| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文阅读笔记(三)【ACL 2021】Locate and Label: A Two-stage Identifier for Nested Named Entity -> 正文阅读 |
|
[人工智能]论文阅读笔记(三)【ACL 2021】Locate and Label: A Two-stage Identifier for Nested Named Entity |
摘要(1)过去的难点: Introduction(1)NER: 命名实体识别是自然语言处理中的一项基本任务,重点是识别引用实体的文本范围。NER广泛用于下游任务,如实体链接和关系提取。 (2)当今的NER中,嵌套NER是有所关注的; 基于跨度的方法是将NER视为了一项具有识别嵌套NER固有能力的分类任务。首先,由于大量低质量的候选跨度(就是上面说的部分匹配的跨度)导致较高的计算成本。然后,很难识别长实体,因为在训练期间枚举的跨度不是无限长的。其次,边界信息没有得到充分利用,而模型定位实体很重要。 (3)动机: (4)贡献:
Method在第一阶段,我们设计了一个span建议模块,该模块包含两个组件:过滤器和回归器。过滤器将种子跨度分为上下文跨度和跨度建议,使用IoU,在这些种子跨度中,而重叠程度较低的部分为上下文跨度(contextual spans),实体重叠程度较高的部分为提案跨度(proposal spans)。并过滤掉前者以减少候选跨度。回归器通过调整跨度建议的边界来定位实体,以提高候选跨度的质量。 Two-stage Identifier.1. Token representation:① 句子: 一个句子有n个单词,对于第i个单词,我们通过concat它的word embedding
x
i
w
x_{i}^{w}
xiw?,上下文word embedding
x
i
l
m
x_{i}^{lm}
xilm?,词性标注POS
x
i
p
o
s
x_{i}^{pos}
xipos?,字符级嵌入
x
i
c
h
a
r
x_{i}^{char}
xichar?来得到它的表示。 2. Seed Span Generation(1)获取种子跨度集 3. Span Proposal Module将跨度分为了跨度建议(质量高)和上下文跨度(质量低),目的是消除后者,降低成本。 Span Propos Module由两部分组成: Span建议过滤器和边界回归器; 前者用于删除上下文范围并保留范围建议,而后者用于调整范围建议的边界以定位实体。 (1) Span Proposal Filter 最大池跨度表示法 跨度表示 概率计算 其中所有的 h i h_{i} hi?是某个单词的最终表示; [;]表示的是concat; MLP包含了两个线性层和一个GELU激活函数 (2) Boundary Regressor 计算左右边界的偏移 4. 实体分类器模块调整偏移后的边界 开始位置 s t ~ i \widetilde{st}_{i} st i?、结束位置 e d ~ i \widetilde{ed}_{i} ed i? 新的边界单词池化 交叉熵损失 5.Training Objective我们不将所有的部分匹配的跨度视为负跨度,而是分配权重,对于第i个跨度 b i b_{i} bi?, w i w_{i} wi?设置为: 其中 α ∈ { α 1 , α 2 } \alpha\in\{\alpha_{1},\alpha_{2}\} α∈{α1?,α2?}表明了分别用在第一和第二阶段的IoU的阈值; e i e_{i} ei?表明是 b i b_{i} bi?的gt标签; μ \mu μ是聚焦参数,可平滑调整部分匹配示例的下加权率; 如果 μ \mu μ = 0,那么上式就是一个hard one;此外,如果跨度未与任何实体重叠或与某些实体完全匹配,则损失重量 w i w_{i} wi?=1。 focal loss(焦点损失) 其中, w i w_{i} wi?是第i个实例的权重; γ \gamma γ表示的是focal loss的聚焦参数;该损失包含了两个组件,平滑 L 1 L_{1} L1?loss是在boundary水平,而重叠loss是在span水平; 其中 d i = { e d ~ i , e d ^ i } d_i = \{\widetilde{ed}_{i},\widehat{ed}_{i}\} di?={ed i?,ed i?}, e i = { s t ~ i , s t ^ i } e_i = \{\widetilde{st}_{i},\widehat{st}_{i}\} ei?={st i?,st i?}, s t ^ i \widehat{st}_{i} st i?, e d ^ i \widehat{ed}_{i} ed i?, t ^ i l \widehat{t}_{i}^{l} t il?和 t ^ i r \widehat{t}_{i}^{r} t ir?表明了ground-truth的左边界、右边界、左偏移和右偏移 交叉熵损失 其中 w i w_{i} wi?通过式子11计算出来的第i个例子的权重,我们联合训练滤波器、回归器和分类器,因此总损失计算如下: (5)实体encoding 其中 u ∈ ( 0 , 1 ) u\in(0,1) u∈(0,1)表示分数的衰减系数,k表示IoU阈值。之后我们保持所有的span proposals用 s c o r e > δ score>\delta score>δ作为最终的提取实体。 Experiment1. 实验设置数据集 评价指标 参数设置 2. 实验结果在nested NER任务的结果 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 14:51:47- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |