IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文笔记 ACL 2020|Improving Event Detection via Open-domain Trigger Knowledge -> 正文阅读

[人工智能]论文笔记 ACL 2020|Improving Event Detection via Open-domain Trigger Knowledge

1 简介

论文题目:Improving Event Detection via Open-domain Trigger Knowledge
论文来源:ACL 2020
论文链接:https://aclanthology.org/2020.acl-main.522.pdf
代码链接:https://github.com/shuaiwa16/ekd

1.1 动机

  • 由于标记数据的长尾问题(大量的类别仅有少量的样本)和生成数据的同质性,以前的方法在未见过或者稀疏的数据上表现不佳,在密集的数据上过拟合。

1.2 创新

  • 第一个利用开放域的触发词知识提高事件检测的性能。
  • 提出了一个新的teacher-student模型,从标记和未标记的数据中学习,减少标记中的内置偏差。

2 方法

2.1 知识收集

从WordNet中收集开放域触发词知识,分为下面两个步骤:

  1. 消除单词的歧义:使用IMS消岐,然后使用Stanford CoreNLP获得特征(词性标注、句法分析)。
  2. 判断是否触发事件:利用一个查表的方法,判断是否触发事件。

2.2 模型

在这里插入图片描述
模型的整体框架如上图,主要包括下面几部分:

  • 特征抽取:使用BERT对句子进行编码。
  • 事件预测:对于带标注的数据,预测每个词的事件类型。公式如下:
  • 知识蒸馏:知识蒸馏的目标是使teacher模型的概率等于student模型的概率(公式如下),两个模型共享参数,teacher模型的输入为 S + S^+ S+(Knowledge-attending Sentences),通过开放域触发词知识,使用B-TRI和E-TRI标注触发词的开始和结束边界。如原始句子为 S = { w 1 , w 2 , . . . , w i , . . . , w n } S=\{w_1,w_2,...,w_i,...,w_n\} S={w1?,w2?,...,wi?,...,wn?}, w i w_i wi?为开放域触发词知识定义的触发词, S + = { w 1 , w 2 , . . . , B ? T R I , w i , E ? T R I , . . . , w n } S^+=\{w_1,w_2,...,B-TRI,w_i,E-TRI,...,w_n\} S+={w1?,w2?,...,B?TRI,wi?,E?TRI,...,wn?}。B-TRI和E-TRI在知识收集的句子上微调(mask的概率为15%)。student模型的输入为 S ? S^- S?(Knowledge-absent Sentences),随机mask由开放域触发词知识定义的触发词,如 S ? = { w 1 , w 2 , . . . , [ M A S K ] , . . . , w n } S^-=\{w_1,w_2,...,[MASK],...,w_n\} S?={w1?,w2?,...,[MASK],...,wn?}。使用KL散度最小化概率分布之间的差异,公式如下:
  • 联合训练:优化的目标为带标注数据的监督loss和未标注数据的KL散度loss,公式如下:
    在这里插入图片描述

3 实验

在ACE 2005数据集上的实验结果如下图:
在这里插入图片描述
为了评测是否将知识蒸馏到模型中,在测试集上观察带和不带开放域触发词知识的实验效果,结果如下图:
在这里插入图片描述
在领域迁移情形下的实验结果:
在这里插入图片描述
不同频率触发词的实验结果:
在这里插入图片描述
使用三种不同的知识,验证模型是否可以蒸馏其他的知识类型,实验结果如下图:
在这里插入图片描述
Case Study:
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-14 21:08:29  更:2022-02-14 21:11:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 10:24:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码