IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 《ROTATE: KNOWLEDGE GRAPH EMBEDDING BY RELATIONAL ROTATION IN COMPLEX SPACE》论文阅读 -> 正文阅读

[人工智能]《ROTATE: KNOWLEDGE GRAPH EMBEDDING BY RELATIONAL ROTATION IN COMPLEX SPACE》论文阅读

发表于ICLR 2019。

abstract

研究在知识图中学习实体和关系的表征来预测缺失links的任务。这种任务的成功很大程度上取决于建模和推断关系的模式上。本文提出了一种全新的知识嵌入图的方法RotatE,可以建模和推断各种关系模式:对称/非对称,反转,组成。RotatE将每种关系建模为在复向量空间中从源实体到目标实体的一个旋转(rotate)。除此以外,我们还提出了一种全新的self-adversarial 负采样技术来进行RotatE模型的有效性训练。实验证明,RotatE不仅是具有可扩展性的,也可以推断和建模各种各样的关系模式,在链接预测模式上可以超越现存的SOTA方法。

1.introduction

从observed facts中找到方法来建模和推断模式(如:对称性/不对称性,反转,组成)在预测missing links中是很重要的。但是,现存的方法没有办法建模以上这些所有的模式,于是我们找到方法来建模和推断以上三种类型的关系模式。

我们的motivation来自于Euler identity: e i θ = c o s θ + i ? s i n θ e^{i\theta} =cos \theta+ i \,sin \theta eiθ=cosθ+isinθ,它表明一个复数可以被视为是复平面(complex space)的一个旋转。给定一个三元组 ( h , r , t ) (h,r,t) (h,r,t),我们期望 t = h ° r t = h \circ r t=h°r,其中 h , r , t ∈ C k h,r,t \in \mathbb{C}^k h,r,tCk是embeddings,以及 ∣ r i ∣ = 1 |r_i|=1 ri?=1, ° \circ °代表哈达玛积。对于复平面中的每一个维度,我们期望:

t i = h i r i , h i , r i , t i ∈ C , ∣ r i ∣ = 1. t_i =h_i r_i ,h_i,r_i,t_i \in \mathbb{C},|r_i|=1. ti?=hi?ri?hi?,ri?,ti?C,ri?=1.

这样一个简单的操作,可以有效建模之前提到的三种关系:symmetric/antisymmetric,inversion,composition。举例说明:一个relation r r r是对称的iff embedding r r r的每个成分满足 r i = e 0 / i π = ± 1. r_i = e^{0/i\pi}=\pm 1. ri?=e0/iπ=±1.两个关系是inverse iff 它们的embedding是conjugates(共轭的): r 2 = r 1 ˉ r_2 = \bar{r_1} r2?=r1?ˉ?,一个关系 r 3 = e i θ 3 r_3 =e^{i \theta_3} r3?=eiθ3?是两个关系 r 2 = e i θ 2 , r 1 = e i θ 1 r_2 =e^{i \theta_2},r_1 =e^{i \theta_1} r2?=eiθ2?,r1?=eiθ1?的组合 iff r 3 = r 1 ° r 2 ( θ 3 = θ 1 + θ 2 ) r_3 = r_1 \circ r_2 (\theta_3 =\theta_1 +\theta_2) r3?=r1?°r2?(θ3?=θ1?+θ2?)。进一步的,RotatE可以扩展到大的知识图上去,因为它在时间和空间上几乎是线性的。

为了有效优化RotatE,我们进一步提出了一个self-adversarial 负采样方法,根据目前的实体和关系来生成负样本。这种方法非常通用可以被用于许多现有的知识图嵌入方法中。实验证明,RotatE达到了SOTA。

2.related work

3.RotatE:relational rotation in complex vector space

3.1 modeling and inferring relation patterns

在知识图中三种非常重要的关系模式:summery,inversion and composition。给出它们的定义:\
定义1:一个关系 r r r是对称的/反对称的,若对 ? x , y : \forall x,y: ?x,y:

r ( x , y ) ? r ( y , x ) ( r ( x , y ) ? ? r ( y , x ) ) r(x,y) \Rightarrow r(y,x)(r(x,y) \Rightarrow \neg r(y,x)) r(x,y)?r(y,x)(r(x,y)??r(y,x))

定义2:一个关系 r 1 r_1 r1?是关系 r 2 r_2 r2?的inverse,若对 ? x , y : \forall x,y: ?x,y:

r 2 ( x , y ) ? r 1 ( x , y ) r_2(x,y)\Rightarrow r_1(x,y) r2?(x,y)?r1?(x,y)

定义3:一个关系 r 1 r_1 r1? r 2 , r 3 r_2,r_3 r2?,r3?构成,若对 ? x , y , z : \forall x,y,z: ?x,y,z:

r 2 ( x , y ) ? r 3 ( y , z ) ? r 1 ( x , z ) r_2(x,y)\bigcap r_3(y,z)\Rightarrow r_1(x,z) r2?(x,y)?r3?(y,z)?r1?(x,z)

请添加图片描述

3.2 modeling relations as rotations in complex vector space

给定一个三元组 ( h , r , t ) (h,r,t) (h,r,t)

t = h ° r , w h e r e ? ∣ r i ∣ = 1 t = h \circ r,where \, |r_i| =1 t=h°rwhereri?=1

对于embedding中的每一个元素,我们都有 t i = h i r i t_i = h_i r_i ti?=hi?ri?,且 h , t ∈ C k h,t\in \mathbb{C}^k h,tCk r i ∈ C , ∣ r i ∣ = 1 r_ i \in \mathbb{C}, |r_i|=1 ri?C,ri?=1,因此 r i r_i ri?具有形式 e i θ r , i e^{i \theta_{r,i}} eiθr,i?,是关于复平面中的原点的 θ r , i \theta_{r,i} θr,i?的逆时针旋转,仅仅影响负向量空间中的实体嵌入。我们称提出的模型为RotatE由于它的旋转特性。根据以上的定义,对于每个三元组 ( h , r , t ) (h,r,t) (h,r,t),我们定义RotatE的距离函数如下:

d r ( h , t ) = ∣ ∣ h ° r ? t ∣ ∣ d_r(h,t) =||h \circ r - t|| dr?(h,t)=h°r?t

通过定义每个关系为复向量空间中的旋转,RotatE是唯一可以建模以及推断上面三种关系模式的模型。

3.3 optimization

我们使用了和负采样损失相似的损失函数来有效优化基于距离的模型:

L = ? l o g ? σ ( γ ? d r ( h , t ) ) ? ∑ i = 1 n 1 k l o g ? σ ( d r ( h i ′ , t i ′ ) ? γ ) , L = -log \, \sigma(\gamma-d_r(h,t))-\sum\limits_{i=1}^n \frac{1}{k}log \, \sigma (d_r(h_i',t_i')-\gamma), L=?logσ(γ?dr?(h,t))?i=1n?k1?logσ(dr?(hi?,ti?)?γ),

其中 γ \gamma γ是固定的margin, ( h i ′ , r , t i ′ ) (h_i',r,t_i') (hi?,r,ti?)是i-th negative triplet。

我们也提出了一种新的方法来生成负样本。负采样损失使用一种uniform的方法来采样negative triplets。这样的均匀的负采样方法具有效率不高的问题(因为很多的样本随着训练的进行很明显是错误的,并不能提供任何有意义的信息)。因此我们提出了一个称为self-adversarial的负采样,它根据目前的embedding模型采样出negative triples。具体来说,我们从下面的分布中采样出negative triples:
请添加图片描述
最终的带有self-adversarial training 的负采样损失的形式:
请添加图片描述

4.experiments

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-26 12:13:20  更:2021-10-26 12:15:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 8:22:13-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码