IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Raki的读paper小记:Bipartite Flat-Graph Network for Nested Named Entity Recognition -> 正文阅读

[人工智能]Raki的读paper小记:Bipartite Flat-Graph Network for Nested Named Entity Recognition

Abstract & Introduction & Related Work

  • 研究任务
    嵌套NER
  • 已有方法和相关工作
  • 面临挑战
    1. 已有的模型只考虑从最内层到外层的信息的单向传递
  • 创新思路
    1. 双向考虑了内外层子图之间的信息交互
  • 实验结论
    sota
    在这里插入图片描述

Model

首先给出模型总览图

外层使用BiLSTM + CRF来抽取平面实体,并将抽取出来的特征构成一个图 G 1 G^1 G1

对于图模块,我们使用GCN,它在潜在实体的起点和终点节点之间迭代传播信息以学习内部实体。最后,从图模块学到的表征被进一步反馈到平面模块,以获得更好的最外层预测。
在这里插入图片描述

Token Representation

首先把word embedding和 char embedding concat起来,然后丢到一个BiLSTM里面得到序列信息,把输出的新特征丢到接下来的模块里面

Flat NER Module

一个BiLSTM + CRF 没什么好说的

Graph Module

Graph Construction

图一就是一个团

图二就是…从node0到nodeN的一个有向图

Bi-GCN

给出一个图G, 和它的节点,图特征由 Bi-GCN来学习
在这里插入图片描述
通过下面公式得到两个图的汇聚特征
在这里插入图片描述
在得到每个节点的特征后,通过一个两层的fc,最后经过一个softmax来得到实体得分
在这里插入图片描述
对于内部实体,使用交叉熵来计算损失
在这里插入图片描述

BiFlaG Training

公式(7)中的实体得分M带有句子中每个词对的类型概率。为了进一步考虑从内部实体到外部实体的信息传播,我们使用 B i ? G C N Bi-GCN Bi?GCN 从实体得分M中为平面模块生成新的表示。词对 ( t i , t j ) (t_i , t_j) (ti?,tj?) 的最大类型得分 r i j r_{ij} rij? 表示这个span是实体还是非实体,以及作为这种类型的置信度,由最大汇聚得到

在这里插入图片描述
构建出一个新的图 G 3 G^3 G3 r i j ∈ E r_{ij} \in E rij?E

第一部分由平面模块构成
在这里插入图片描述
第二部分由新图上做双向图卷积得到
在这里插入图片描述
得到最终表示
在这里插入图片描述
新的表示丢到平面模块来更新参数并且抽取更好的外部实体

外部损失由两个CRF构成
在这里插入图片描述
整个算法的流程
在这里插入图片描述

Loss Function

总的损失函数,其中 λ 2 λ_2 λ2? 是平面模块和图形模块的损失之间的权重。在训练阶段,我们将这一总损失降到最低
在这里插入图片描述

Experiment

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Conclusion

我们的BiFlaG模型也可以通过简单地移除图模块来处理非嵌套结构。就相同的严格设置而言,实证结果表明,我们的模型普遍优于以前的sota

Remark

应用了图结构,感觉整体中规中矩,没啥亮点,或许一定程度上证明了应用图结构的有效性?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-09 20:42:12  更:2022-02-09 20:43:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 10:37:12-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码