[人工智能] IJCAI22：Language Models as Knowledge Embeddings

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> IJCAI22：Language Models as Knowledge Embeddings -> 正文阅读

[人工智能]IJCAI22：Language Models as Knowledge Embeddings

研究问题

同时利用结构信息和文本信息，在对比学习框架下提升长尾实体的表示

背景动机

目前知识图嵌入有两种计算方法，即基于结构的方法和基于描述的方法

基于结构的方法如TransE和RotatE，可以保存知识图谱的结构信息，并对各种属性进行建模。其缺陷在于无法对大量结构信息匮乏的长尾实体进行建模，对RotatE在WN18RR数据集上的统计如下图所示
基于描述的方法如DKRL和KEPLER，通过使用语言模型编码实体的描述来获得表示，因而具有inductive (zero-shot) 的能力。但这些方法在效果上比不上基于结构的方法，原因是语言模型的效率过低，限制了负采样的规模，而这对模型的性能很重要。另外并不是所有实体都能拥有文本描述，直接丢弃这部分实体的操作忽视了它们的结构信息

模型方法

LMKE基础设定

在这里插入图片描述
给定三元组 $h, r, t$ ，其描述分别为 $S_h, S_r, S_t$ ，其中 $s_e=\left(x_1, \ldots, x_{n_e}\right)$ 为token的序列。输入可以表示为 $s_u=\left(h, s_h, r, s_r, t, s_t\right)=\left(h, x_1^h, \ldots, x_{n_h}^h, r, x_1^r, \ldots, x_{n_r}^r, t, x_1^t, \ldots, x_{n_t}^t\right)$ ，在开头和末尾分别添加[CLS]和[SEP]标识。

将 $s_u$ 作为一个整体输入预训练语言模型，分别得到三元组各部分的嵌入表示 $\mathbf{h}, \mathbf{r}, \mathbf{t} \in \mathbb{R}^d$ 以及三元组整体的表示 $\mathbf{u}$ ，三元组成立的概率为 $p(u)=\sigma(\mathbf{w} \mathbf{u}+b)$ 。

在执行链路预测任务时，上述方法的缺陷在于要为每一个负样本生成整个三元组的表示，使得整体计算复杂度过高。

在这里插入图片描述

更加高效的对比学习框架：C-LMKE

在这里插入图片描述
在链路预测任务中，将给定的头实体和关系及其文本描述视为查询q，将要预测的尾实体视为键k，一个batch内的原始qk对视为正样本对，同batch内的其他三元组的k与q视为负样本对。

在计算相似度时，考虑到1-N关系的存在，没有使用通常的余弦相似度，而是用了MLP实现。
在这里插入图片描述
其中 $\mathbf{d}=\left[\log \left(d_q+1\right) ; \log \left(d_k+1\right)\right]$ 通过度的对数来考虑结构信息，有点奇怪