IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 《GRACE: Gradient Harmonized and Cascaded Labeling for Aspect-based Sentiment Analysis》阅读笔记 -> 正文阅读

[人工智能]《GRACE: Gradient Harmonized and Cascaded Labeling for Aspect-based Sentiment Analysis》阅读笔记

GRACE

论文题目: 《GRACE: Gradient Harmonized and Cascaded Labeling for Aspect-based Sentiment Analysis》


本文研究对象是方面术语与情感极性的联合抽取,作者提出以前的方法忽略了方面术语之间的相互作用,同时忽略了序列标记任务中标签的不平衡性。针对这两个问题提出新的框架GRACE,解决端到端的方面项极性共提取问题。它采用级联标签的方法来考虑标签之间的相互作用时,标签他们的情感标签同时梯度协调策略来缓解标签的不平衡问题

模型

在这里插入图片描述

文中解决得是ASTE问题,把其看作两个序列标签任务,对于给定的句子 S = { w i ∣ i = 1 , . . . , n } S = \{w_i|i=1,...,n\} S={wi?i=1,...,n} 对于每个单词 w i w_i wi? 我们的任务就是预测两个标签 t i e t^e_i tie? , t i c t^c_i tic? ,前者是方面词标签 T e = { B , I , O } T^e=\{B,I,O\} Te={B,I,O} ,后者是情感极性标签 T c = { P O S , N E U , N E G , C O N , O } T^c=\{POS,NEU,NEG,CON,O\} Tc={POS,NEU,NEG,CON,O} , 它由两个共享浅层的模块组成,一个是图中粉色部分是用于ATE任务即提取方面词,另一个模块是图中浅蓝色部分是用于情感极性分类

左边是bert,生成多个隐藏状态,最后一层的输出为 H e H_e He?

在这里插入图片描述

bert的不同层捕捉不同的信息,越高层跟任务越相关,越底层提取越基础的语句特征,所以两个模块共享了bert的底层,bert的l层输出为:

H c = H l H_c=H^l Hc?=Hl

所以 H [ l + 1 : L ] H^{[l+1:L]} H[l+1:L] 是特定为ATE任务服务

级联标签

考虑到方面词标签之间存在关联,例如文中的例子:

nice operating system and keyboard

因为’operating system‘和’keyboard‘之间是“and”连接,所以operating system情感是积极,可推断keyboard也是积极,所以提出了级联标记方法,该方法使用生成的方面术语序列作为输入来生成情感序列。 H c H_c Hc? 输入到新的transformer编码器中,生成新的情感表征 G c G_c Gc?

在这里插入图片描述

其中Q是预测得到的方面标签,

Gradient Harmonized Loss

训练损失为

在这里插入图片描述

有两个因素会影响性能。一个是正面和负面例子之间的不平衡,另一个是简单和困难例子之间的不平衡

在这里插入图片描述

从图中可以看到O标签的数量远远大于B,I,即在标签预测任务中,每个标签之间存在不平衡。每个标签的难易属性可以用g来预测:

在这里插入图片描述

对于数量很大的标签,一个策略是减少这些标签的重量损失。更新后的损失函数如下。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Virtual Adversarial Training

为了使模型对对抗性噪声更具鲁棒性,利用虚拟对抗性训练,即在训练模型时对输入词嵌入E加入小扰动r。额外损失如下
在这里插入图片描述

r的计算过程如下
在这里插入图片描述

最后总的损失函数为

在这里插入图片描述

一致极性标签

将情感分类视为极性序列标签时的一个问题是,生成的序列标签并不总是一致的。比如 ‘operating system’的极性标签可能是’POS NEG‘,为了解决这个问题设计了一个在相同方面术语内表示不同标签的方法。为了生成ASC序列标签,首先得到方面术语的边界,比如上面的例子,”O B I O B“的边界为: {[1,2),[2,4),[2,4),[4,5),[5,6)},情感极性分类过程如下

在这里插入图片描述

本文提出了一个新的框架GRACE来同时解决方面术语提取和方面情感分类问题。该框架采用了一种级联标记方法,通过多头注意力机制来增强方面术语之间的交互。并且通过梯度协调方法,缓解了标签任务中标签的不平衡问题。还引入了虚拟对抗训练和post-trained来提高抽取性能。在三个基准数据集上的实验结果验证了GRACE在极性共提取方面显著优于其他模型。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-04 11:12:44  更:2021-08-04 11:13:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 14:47:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码