[人工智能] 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De -> 正文阅读

[人工智能]论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De

文章目录

1 简介

论文题目：Document-level Event Extraction with Efficient End-to-end Learning of Cross-event Dependencies
论文来源：NAACL 2021
论文链接：https://aclanthology.org/2021.nuse-1.4.pdf

1.1 动机

先前的工作没有结合事件提及抽取，来学习实体和事件共指。
在文档级别上，对跨事件依赖项进行建模时，效率是一个挑战。

1.2 创新

提出了一个文档级别的事件抽取模型，使用Deep Value Networks(DVN)捕捉跨事件依赖，同时进行事件提及抽取、事件共指和实体共指。
为了恰当地在文件级别上评测事件抽取，提出两种评测指标DOCTRIGGER和DOCARGUMENT DOCTRIGGER考虑触发词span、事件类型和事件共指，将相同的事件共指聚集到一起，然后计算匹配分数，使用Kuhn-Munkres algorithm约束一个真实触发词cluster对于一个预测触发词cluster。DOCARGUMENT考虑论元span，论元角色和实体共指。

2 背景知识

对于事件提及抽取，本篇论文的不同之处是需要提取所有名称、名词和代词论元的完整span，而先前的工作专注于抽取名称论元的head span。
事件共指(Event Coreference)是识别相互关联的事件提及。与实体共指类似，为每个预测的触发词 $d_i$ 预测最可能的祖先触发器 $d_j$ 。

3 方法

主要包括两部分，使用base model独立地预测每个子任务，然后将DVN合并到base model中以高效地捕捉跨事件依赖关系。

3.1 基础模型

基础模型使用DYGIE++，主要包括下面模块：

Encoding：使用BERT-BASE进行编码
Span Enumeration：为了解决重叠实体，枚举全部的k-gram作为候选事件提及和实体提及，对于每个span $s_i$ 表示为head token $e_h$ 、tail token $e_t$ 和距离编码，表示为 $x_i=[e_h,e_t,c_{h,t}]$
Classification：对于触发词抽取对应每个token，公式为 $y_i^{trig}=FFN^{trig}(e_i)$ ；实体抽取对应每个span，公式为 $y_i^{ent}=FFN^{ent}(x_i)$ ；论元抽取、事件提及和实体提及，对每对候选span进行评分,公式为 $y_k^{t}=FFN^{t}([x_i,x_j])$