[人工智能] 论文笔记 ACL 2021|Document-level Event Extraction via Parallel Prediction Networks

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 论文笔记 ACL 2021|Document-level Event Extraction via Parallel Prediction Networks -> 正文阅读

[人工智能]论文笔记 ACL 2021|Document-level Event Extraction via Parallel Prediction Networks

文章目录

1 简介

论文题目：Document-level Event Extraction via Parallel Prediction Networks
论文来源：ACL 2021
论文链接：https://aclanthology.org/2021.acl-long.492.pdf
代码链接：https://github.com/HangYang-NLP/DE-PPN

1.1 创新

提出一个编码-解码模型进行文档级事件抽取，分别基于文档级别的编码和多粒度的解码。
介绍一种匹配损失函数用于训练端到端模型，它可以加强全局优化。

2 方法

在这里插入图片描述
模型的整体框架如上图所示，分为下面5部分。

候选论元识别：首先使用第一个Transformer对句子进行编码，然后以序列标注的形式进行句子级的候选论元识别。
文档级别编码：实现对候选论元和句子编码进行max-pooling，然后经过第二个Transformer建模全部的句子和论元之间的关系(句子的编码中加入位置编码)。然后对 $H^s$ 进行max-pooling操作，在对每个事件类型进行二分类，进行事件类型分类。
多粒度解码：多粒度的编码器包括三个部分：事件编码器、角色编码器、事件-角色编码器。
在事件编码器中设置m为生成事件的数量(大于文档中的平均数量)，其中 $Q^{event}$ 为事件query。

在角色编码器中设置n为角色类型的数量(大于文档中的平均数量)，其中 $Q^{role}$ 为角色query。

在事件-角色编码器中，建模事件查询和论元查询的关系。
事件预测：使用下面公式过滤虚假的事件，进行二分类(非空，空)。

使用下面公式对论元进行分类( $N'_a+1$ 分类)，

得到m个事件 $\widehat{Y} =(\widehat{Y}_1,\widehat{Y}_2,....,\widehat{Y}_m)$ ，其中每个事件包含n个预测论元。 $\widehat{Y}_i=(P_i^1,P_i^2,...,P_i^n)$ 。
匹配loss函数：定义双向匹配的损失公式如下：
$C_{match}$ 公式如下，其中 $judge_i$ 为判断事件i是否为空，

则损失函数如下：

最终的损失函数如下(候选论元识别、事件类型分类)：