| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【自然语言处理】【检索】GENER:自回归实体检索 -> 正文阅读 |
|
[人工智能]【自然语言处理】【检索】GENER:自回归实体检索 |
论文地址:https://arxiv.org/pdf/2010.00904.pdf
一、简介? 通过自然语言来从大型知识库中检索正确实体的能力,是一些应用的基础能力。大多数的商业推荐系统都需要对文本中的实体 ? 虽然先前有大量的实体检索工作,但是这些工作都有一个共同的设计选择:实体会被关联到唯一的标签,并且检索问题被建模为这些标签上的多分类问题。输入文本和标签的匹配是通过一个 ? 但是,这样的方式也有几个缺点。首先,除非使用昂贵的 ? 本文作者提出了
GENER(Generative?ENtitiy?REtrieval)
\text{GENER(Generative ENtitiy REtrieval)}
GENER(Generative?ENtitiy?REtrieval)。第一个利用 ? 自回归的形式可以直接捕获上下文和实体名称的关系,并且能够对上下文和实体名称进行有效的交互。此外,所需的存储空间也比当前的系统小好几个数量集,因为 ? 作者在三种任务的20个数据集上评估了
GENER
\text{GENER}
GENER:(1) 实体消歧;(2) 端到端实体链接;(2) 文档检索。本文的方法几乎在所有数据集上都实现了 二、实体检索? 假设有一个实体集合
E
\mathcal{E}
E,其中每个实体都是一个知识库中的条目(entry)。本文要解决的问题是:给定一个文本输入源
x
x
x,一个模型能够从
E
\mathcal{E}
E中返回与
x
x
x最相关的实体。假设每个
e
∈
E
e\in\mathcal{E}
e∈E会被分配一个唯一的文本表示:一个 ? 该问题的一个实例是实体消歧
(Entity?Disambiguation,ED)
\text{(Entity Disambiguation,ED)}
(Entity?Disambiguation,ED),给定一个被标注了 三、方法? 本文通过 1. 基于约束 Beam?Search \text{Beam Search} Beam?Search? 在测试时,可以计算
E
\mathcal{E}
E中每个元素的评分并进行排序。不幸的是,当
E
\mathcal{E}
E太大时其可能计算太昂贵。因此,作者利用
Beam?Search(BS)
\text{Beam Search(BS)}
Beam?Search(BS),一种能够有效检索搜索空间中近似解码策略 。相比于对
E
\mathcal{E}
E中所有实体进行精确的评分,本文使用具有
k
k
k个beams的
BS
\text{BS}
BS来
E
\mathcal{E}
E中搜索出
top-k
\text{top-k}
top-k个实体。注意,使用
BS
\text{BS}
BS意味着检索器的时间代价不依赖于
E
\mathcal{E}
E的大小,而是 ? 因为需要输出
E
\mathcal{E}
E中的实体,所以不能使用传统的
BS
\text{BS}
BS进行解码。确实,在每个解码步骤中允许生成词表中的任意 ? 上图是一个前缀树
(trie)
\text{(trie)}
(trie)的例子。当输出的数量可控,则
trie
\text{trie}
trie相对较小,可以提前预计算并存储在内存中。使用约束来遮蔽无效 2. 自回归端到端实体链接? 本文扩展了自回归框架来解决端到端的实体链接
(Entity?Linking,EL)
\text{(Entity Linking,EL)}
(Entity?Linking,EL)。给定一个文档,系统必须检索出实体提及,并将这些实体提及链接至知识库中的实体。在这种设定下,模型需要预测带有标注 ? 带有标注的输出空间是指数级的大。因此,预计算一个 四、实验
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 22:42:43- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |