IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【Temporal Knowledge Graph】知识图谱论文泛读系列 1 -> 正文阅读

[人工智能]【Temporal Knowledge Graph】知识图谱论文泛读系列 1

Learning from History Modeling Temporal Knowledge Graphs with Sequential.pdf
image.png

本文是AAAI 2021的一篇文章。
论文地址

Abstract

本文提出了一种新的 temporal knowledge graph 表示学习模型,即 CyGNet 。 CyGNet 不仅能够从整个实体词汇(the whole entity vocabulary)中预测未来的事实,而且能够识别重复的事实,并根据过去已知的事实来预测未来的事实。

Introduction

image.png

  • 图1 表示了ICEWS的一个片段,其中图标表示 entity(subject或object),箭头表示 relation ,箭头下方的元组表示(relation,timestamp)

事实上,历史上有许多事实反复发生,例如全球经济危机大约每7到10年定期发生一次;外交活动在两个建立关系的国家之间定期进行;东非动物每年每年6月进行大规模迁徙等等。我们发现,在24年的 ICEWS 数据(即1995年至2019年)中,超过80%的事件已经出现在前一段时间内。这一现象突出了利用已知的事实来预测未来的事实的重要性。
然而以往的方法在建模 TKG 的时候并没有包含对这种进化模式的意识。
本文提出了一种基于新型时间感知复制机制的TKG表示学习方法 CyGNet(Temporal Copy-Generation Network),不仅能够从整个实体词汇中预测未来的事实,而且能重复识别事实,并根据形成过去出现的实体的历史词汇选择这些事实。CyGNet 包含两种推理模式:Copy mode 和 Generation mode。
其中 Copy mode 类似于 NLG 中的抽象摘要中的复制机制,允许语言生成器选择从源文本中复制子序列,从而帮助生成在源文本中保留显著信息的摘要。
本文的贡献:

  • ① 在学习推断 TKG 中未来事实,参考历史上已知事实;
  • ② 提出新的 TKGE 模型 CyGNet ,该模型结合了两种推理模式,符合TKG事实的进化模式;
  • ③ 在五个公共的 TKG 基准数据集上进行了实验

Keyword

Knowledge graph completion; temporal knowledge graph; knowledge graph reasoning;

Method

image.png

Model Components

模型包含两种推理模式,即复制模式和生成模式。其中前者寻求从一个特定的(时间戳)的历史词汇中选择实体,形成历史中重复的事实,而后者从整个实体词汇中预测事实。
image.png
如图3所示,预测一个四元组image.png,复制模式推断出历史词汇表image.png中的实体的概率,然后候选实体作为 s1 和 p3 在已知的 snapshots 的 object entity。另一方面,生成模式估计整个实体词汇表中每个实体来回答一个 query 的概率。 CyGNet 结合来自两个模式的概率预测,得到最终的输出概率。
首先处理训练集的每个 snapshots, 获得每个训练 snapshot 的 subject entity的历史词汇和三元组(s,p,t),image.png,其中image.png是一个包含所有能够充当在snapshotimage.png中,与s和p组成的元组中的object entities的N维的multi-hot隐含向量。
按序列依次训练每个snapshot, 就像递归一样增量地维护之前所有的snapshot的历史词汇表,在评估的时候将用上训练集的最大历史词汇量,对每个在时间image.png的时间轴,训练过程从之前的snapshot中扩展历史词汇。如公式所示:
image.png
训练过程如图4所示:
image.png

Copy mode

复制模式通过MLP生成一个index vectorimage.png,其中image.png的计算如下:
image.png
为了降低一些无用的信息概率,将image.png中不感兴趣的实体的索引值变为一个很小的负数,修改后的image.png变为image.png
通过添加image.pngimage.png来划分候选空间,使得不感兴趣实体的概率最小化,然后通过softmax来估计预测:
image.png
image.png
其中不感兴趣的实体在image.png中的赋值接近于0.
复制模式的优点是它可以从一个比整体实体词汇表更明确的候选空间中学习预测。

Generation mode

生成模式负责通过从整体词汇表image.png中选择对象实体来预测事实。生成模式将预测的事实视作全新的事实,没有参考任何历史。与复制模式类似,生成模式也生成索引向量,使用softmax进行预测:
image.png

Learning Objective

模型的任务将视为一个多类分类任务,即预测一个给定的缺失四元组image.png中,每个候选object entity的概率。模型中将采用交叉熵来进行模型训练:
image.png

Inference

CyGNet将结合复制模式和生成模式的预测值(即加权组合)来得到最终的预测值,使用一个常数image.png来衡量复制模式和生成模式预测值的权重:
image.png

Experiment

本文所采用的数据集:
image.png
实验结果:
image.png
image.png
消融实验:
image.png

Conclusion

本文首次提出使用复制机制来解决temporal knowledge graph的描述和推断,基于未来事实可以从历史事实中预测的假设。提出的CyGNet不仅能够预测整个开放世界的事实,还能够识别重复事实,根据过去出现的已知事实来选择这些未来的事实。在五个基准数据集上结果证明了本文模型的有效性。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-08-19 19:04:57  更:2022-08-19 19:08:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 19:33:04-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计