IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> IJCAI22:Language Models as Knowledge Embeddings -> 正文阅读

[人工智能]IJCAI22:Language Models as Knowledge Embeddings

研究问题

同时利用结构信息和文本信息,在对比学习框架下提升长尾实体的表示

背景动机

目前知识图嵌入有两种计算方法,即基于结构的方法和基于描述的方法

  • 基于结构的方法如TransE和RotatE,可以保存知识图谱的结构信息,并对各种属性进行建模。其缺陷在于无法对大量结构信息匮乏的长尾实体进行建模,对RotatE在WN18RR数据集上的统计如下图所示
    在这里插入图片描述
  • 基于描述的方法如DKRL和KEPLER,通过使用语言模型编码实体的描述来获得表示,因而具有inductive (zero-shot) 的能力。但这些方法在效果上比不上基于结构的方法,原因是语言模型的效率过低,限制了负采样的规模,而这对模型的性能很重要。另外并不是所有实体都能拥有文本描述,直接丢弃这部分实体的操作忽视了它们的结构信息

模型方法

LMKE基础设定

在这里插入图片描述
给定三元组 h , r , t h, r, t h,r,t,其描述分别为 S h , S r , S t S_h, S_r, S_t Sh?,Sr?,St?,其中 s e = ( x 1 , … , x n e ) s_e=\left(x_1, \ldots, x_{n_e}\right) se?=(x1?,,xne??)为token的序列。输入可以表示为 s u = ( h , s h , r , s r , t , s t ) = ( h , x 1 h , … , x n h h , r , x 1 r , … , x n r r , t , x 1 t , … , x n t t ) s_u=\left(h, s_h, r, s_r, t, s_t\right)=\left(h, x_1^h, \ldots, x_{n_h}^h, r, x_1^r, \ldots, x_{n_r}^r, t, x_1^t, \ldots, x_{n_t}^t\right) su?=(h,sh?,r,sr?,t,st?)=(h,x1h?,,xnh?h?,r,x1r?,,xnr?r?,t,x1t?,,xnt?t?),在开头和末尾分别添加[CLS]和[SEP]标识。

s u s_u su?作为一个整体输入预训练语言模型,分别得到三元组各部分的嵌入表示 h , r , t ∈ R d \mathbf{h}, \mathbf{r}, \mathbf{t} \in \mathbb{R}^d h,r,tRd以及三元组整体的表示 u \mathbf{u} u,三元组成立的概率为 p ( u ) = σ ( w u + b ) p(u)=\sigma(\mathbf{w} \mathbf{u}+b) p(u)=σ(wu+b)

在执行链路预测任务时,上述方法的缺陷在于要为每一个负样本生成整个三元组的表示,使得整体计算复杂度过高。

在这里插入图片描述

更加高效的对比学习框架:C-LMKE

在这里插入图片描述
在链路预测任务中,将给定的头实体和关系及其文本描述视为查询q,将要预测的尾实体视为键k,一个batch内的原始qk对视为正样本对,同batch内的其他三元组的k与q视为负样本对。

在计算相似度时,考虑到1-N关系的存在,没有使用通常的余弦相似度,而是用了MLP实现。
在这里插入图片描述
其中 d = [ log ? ( d q + 1 ) ; log ? ( d k + 1 ) ] \mathbf{d}=\left[\log \left(d_q+1\right) ; \log \left(d_k+1\right)\right] d=[log(dq?+1);log(dk?+1)]通过度的对数来考虑结构信息,有点奇怪

最终的损失函数如下,好像和之前基于负采样的损失函数看上去没有很大区别
在这里插入图片描述

实验

最后两行的效果确实提升非常大,在FB数据集上,是基于描述的方法第一次超过基于结构的方法。另外,所有基于描述的方法在WN数据集上都显著超越基于结构的方法,因为WN数据集中的实体本来就是词,根据文本就能推断出它们之间的关系。而FB数据集就得同时依赖文本和结构信息。
在这里插入图片描述
三元组分类

在这里插入图片描述
不同度的实体的效果比较,可以看到度数较小的长尾实体效果显著提升了

在这里插入图片描述
负样本对越多,效果越好

在这里插入图片描述

总结

虽然说是对比学习,但感觉对正负样本对的定义有点奇怪,其实还是负采样,跟之前的方法没有本质区别,最大的创新点是把头实体加关系、以及尾实体分别用文本表示了

看了一下github上放出来的代码,运行时间有点吓人,跑一次模型需要两天以上
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-21 00:29:07  更:2022-09-21 00:30:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 22:48:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码