| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> [论文笔记] XLORE2:大规模跨语言知识图谱构建与应用 -> 正文阅读 |
|
[人工智能][论文笔记] XLORE2:大规模跨语言知识图谱构建与应用 |
论文地址:XLORE2: Large-scale Cross-lingual Knowledge Graph Construction and Application ABSTRACTXLORE2 有423974个跨语言链接。相比于XLORE增加了更多的跨语言知识链接、跨语言属性匹配、细粒度类型推断。构建了实体链接系统 XLink 证明了XLORE2的有效性。 1 介绍基于Wikipedia,有DBpedia、YAGO、BabelNet等
维基百科包含的英文知识最多,存在不同语言的知识分布不平衡的问题。为了解决这个问题,XLORE 成为了第一个中英文知识均衡的大规模跨语言知识库。它提供了一种通过利用维基百科中的跨语言链接来构建跨任何两种语言的知识图谱的新方法。虽然XLORE已经拥有比较均衡的双语知识量,但仍有大量缺失事实需要补充。主要包括以下三种:
相应的工作包括:跨语言知识链接、跨语言属性匹配、细粒度类型推断
为了证明XLORE的丰富性,构建了一个高效的实体链接系统XLINK(将文档中的mention链接到各种实体) 2 相关工作
3 方法
4 跨语言知识图谱构建4.1 跨语言知识链接背景:XLORE2 包含 470 万个英文实例和 1000 万个中文实例。目前这两种语言的实例之间只有 424,000 个跨语言链接。 任务:扩展知识链接的任务就是:发现不同语言中的等效实例,并构建起链接。 问题:特征可扩展性差(只能把特定的词汇或结构当作特征)和链接稀疏(现存的跨语言链接很少) 解决方案:使用基于异构网络表示学习(异构网络嵌入 HNE)的方法,在同一个低维向量空间中表示跨语言实例,从而比较跨语言实例的等效性
4.2 跨语言属性匹配背景:不同语言的infobox 可能存在不一致的问题,因此我们选择基于英文维基对其他语言的实例属性进行属性对齐。英文百科中存在超过10万个属性,但是只有不到5%(约5000)的属性存在跨语言(中/英)的映射。 问题:多义属性 、同义属性、不同的单位制、时效性;单靠标签和值不足以进行跨语言属性匹配 解决方案:提出因子图模型,通过显式的链接属性来形式化关联。
4.3 跨语言分类对齐任务: 对一种语言中的每个概念匹配出另一种语言中最相关的几个概念。 问题: 基于双语主题模型的向量相似性方法只考虑概念的文本上下文,而完全忽略了明确的概念相关性,例如概念与其在文本中的共现词之间的关系,或者分类法中祖先-后代关系的概念之间的关系。 解决方案:直接利用维基百科提供的类别之间的跨语言链接作为概念之间的跨语言链接 5 数据质量改进5.1 跨语言知识验证使用一种基于跨语言知识验证的动态自适应增强模型,以迭代地增强分类关系预测的性能。通过学习 s u b C l a s s O f subClassOf subClassOf 预测函数和 i n s t a n c e O f instanceOf instanceOf? 预测函数将分类关系预测作为一个二元分类问题来处理。 用于跨语言分类推导的动态自适应增强(DAB)模型如下,基于决策树的二元分类器作为基本学习器 5.2 细粒度类型推断所谓细粒度的类型如下图例子所示: 实现方案为:构建对不同级别的共现信息和标记信息进行编码的异构网络。然后我们通过网络嵌入方法联合学习实例 entity、词 word 和类型 type 表示。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JqibfHqi-1627655755759)(https://i.loli.net/2021/07/30/s5XAmTvFpdkWIuZ.png)] 6 应用XLink 是基于 XLORE 的实体链接应用 一般的实体链接包含:mention detection 和 entity linking 两个步骤
7 系统和数据统计XLORE2 的中英文数据统计(包含实例、概念、属性),如下图所示: XLORE 使用 RDF 形式存储知识,支持基于关键字和SPARQL查询。XLink 是一个无监督的双语实体链接系统。它进行 mention parse 和实体消歧以将输入文档中的提及链接到 XLORE2 中的实体。 XLORE 网址:https://xlore.org XLink 网址:https://xlink.xlore.org 8 总结通过三种方法根据 XLORE 中的现有事实推断缺失的事实:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 20:24:51- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |