IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文解析 Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction – 20’ACL -> 正文阅读

[人工智能]论文解析 Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction – 20’ACL

论文: Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction. C Fan, C Yuan, J Du, L Gui, M Yang, R Xu. ACL 2020 [pdf] [code]

现有问题:

现有pipeline框架中情绪识别和原因提取分分开进行的,存在误差传播的问题

解决方法:

提出了一种基于转换的模型,将任务转换为类似解析的有向图构建过程。

该模型基于有时序的一系列操作,增量式地生成有向图,通过这个过程可以同时识别情绪及其对应的原因,使相互独立的任务联结在一起,最大化的利用任务之间的相互依赖性。

工作与贡献

  • 通过学习基于转换的框架,将端到端的情绪原因对提取任务转换为类似解析的有向图结构过程的任务

  • 通过联合学习框架可以同时提取情绪和对应的原因,并且一般情况下具有线性的时间复杂度

模型结构:

输入:情绪文本 dnl =(c1, c2, ..., cn) (子句流)

输出:搜索最佳操作序列 Aml = (a1, a2, ..., am)

构建的有向图?

有向图的构建

解析器

解析器 S = (σ; β; E; C; R)

σ; β; 为不相交列表成为堆栈和缓冲器,分别存放已被处理的和待处理的节点的指针。

E 是情绪集合,C 是原因集合,R 是目前已生成的边的集合;

另外,A 是操作历史的列表。

操作定义

image-20211207205856998

  • SHIFT (SH) :当 β 不为空时, 弹出 β0 然后压入 σ 的栈顶。因为 β0 可能是 β 中下一个节点的原因

  • RIGHT-ARClt (RAlt):给 σ1 到 σ0 分配一个因果边 lt , 然后把 σ0 复制到集合 E,σ1 复制到集合 C, 删除 σ 中的 σ1(删除原因);

  • LEFT-ARClt (LAlt) :给 σ0 到 σ1 分配一个因果边 lt ,然后把 σ1 复制到集合 E,σ0 复制到集合 C, 删除 σ 中的 σ0(删除原因);

  • RIGHT-ARCln (RAln) :给 σ1 到 σ0 分配一个非因果边 ln , 然后把 σ0 从 σ 中弹出并插入到集合 E;

  • LEFT-ARCln (LAln) :给 σ0 到 σ1 分配一个非因果边 ln ,然后把 σ1 从 σ 中弹出并插入到集合 E;

  • CYCLE-ARC (CA) :为 σ0 分配一个自循环边 lt ,然后把 σ0 复制到集合 E 和 C

操作限制

  • 只有当堆栈 σ 中的元素的大于等于2值,左右操作才可以执行

  • 当 σ| σ1 | σ0 均为情绪且不为原因时,RIGHT-ARCln 将会被执行

  • 实际上,CYCLE-ARC 操作可能会与其他操作有冲突,例如, σ0 是自己的原因,也是 σ1 的原因时,就会与 LEFT-ARClt (LAlt) 操作有冲突。解决方法是,专门训练一个二分类器来识别 σ0,将它分离出来。

对一个文本操作的标准过程

注:$ 结束标识符

转换原理

对给定子句流,搜索最佳操作序列 A*

其中,At-1 是历史操作序列集合, at 由第 t 步生成,St+1 是执行 at 操作后更新的系统状态。rt 作为系统表示,用来计算第 t 步生成 at 的概率,

wa?是可学习的参数向量,ba 为偏置项;A(S) 为到目前解析器状态的所有合法操作的集合。最后的优化函数如下:

至此,ECPE 任务就被融合为一个基于转换的操作预测任务。

为提升解码效率,使用贪心策略,每次都选取最大概率的操作,直到解析过程结束。

解析器原理

解析器状态的表示

初始状态

结束状态

对第 t 步, 使用双向 LSTM 获取特征表示

σt = (... ; σ1; σ0)

βt =(β0; β1; ...)

对于At = (... ; at-2; at-1) ,使用查找表映射到一个离散值 ai, 然后用单项 LSTM 获取特表示

相对距离 d 也是使用查找表映射到一个离散值 ed 。

操作反转

将输入句子序列反转逆序,然后再用解析器再执行一次有向图的构造

rt 、r^ t 分别表示正向和反向操作

训练目标

通过基于转换的框架的学习,将训练数据的最佳输出结构转化成预定义操作的最佳序列,目标函数可以转换成如下公式

a^t 为反向操作,p(ct | s0t) 为自循环边的可预测概率,λ 为 L2 正则系数,θ 表示所有可训练的参数。在训练时的解码中,仅 rt 和 S0t 用于预测下一个操作。

数据集

数据集来自 Rui Xia and Zixiang Ding. 2019 ,统计情况如下

image-20211207221208760

实验结果

实验结果如下:

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-08 13:48:54  更:2021-12-08 13:49:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 0:11:48-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码