IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> SeqGAN----Exposure Bias问题 -> 正文阅读

[人工智能]SeqGAN----Exposure Bias问题

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

本文是作者在学习SeqGAN时,对于GAN在序列任务上问题的具体分析。
通过阅读GAN相关的研究资料,整理了如下问题


提示:以下是本篇文章正文内容,下面案例可供参考

一、Exposure Bias

在Bengio等人在2015年的论文中提到的暴露偏差问题,那么在了解什么是Exposure Bias,需要知道其出现的原因。
这具体表现在RNN的训练过程的两种策略,free running和teacher forcing。
Free running是训练中把上一个节点的输出当成下一个节点的输入,但这会使得训练过程变慢,而且由于输入结果依赖于上一个节点的输出,如果发生偏差,会导致后续学习效果变差。

在这里插入图片描述
而Tearcher forcing就是针对上面的问题,做出调整,使每个节点的输入都是句子的实际输出或者是基于数据集的最大期望输出,这使得tearcher forcing依赖于Ground Truth。这在没有Ground Truth的测试集上表现并不好。
正如上面叙述,Free running在训练过程中由节点输出和真实不同产生的偏差,导致后序序列产生错误传播的问题便是Exposure Bias问题。

二、现有方法

1.Scheduled Sampling

如1中所述,Tearcher forcing虽然可以一定程度上避免Exposure Bias,但也产生了新的问题,即在无Ground Truth时效果很差。为了解决这个问题,Bengio等人又提出了一种新的训练策略----scheduled sampling,翻译过来就是有计划采样。具体表现为:
模型初始设定一个p,p代表RNN训练中Tearcher forcing所占的比率,范围[0,1],p的初始值较高,表明训练之初,对Ground Truth较大,但随着时间推移,p的值会慢慢衰减,使得模型减少对Ground Truth的依赖。
这个方法可以一定程度上缓解Ground Truth依赖问题。

2.评价指标

另外有一部分人发现另一种可以解决Ground Truth依赖问题,便是设置一种新的损失函数,这其中最为人所熟知的便是Papineni等人在2002年提出bilingual evaluation understudy (BLEU),引入的长度惩罚因子乘上最后的评分。
在这里插入图片描述
但是这种方法在很多文本生成任务上不适用。

三、GAN的应用

根据上述问题的展开,我们发现GAN的网络结构似乎可以缓解上述问题。但同时GAN在应用在文本上仍存在两大难题。
过往GAN在图像上取得成功,但是图像和文本的数据表示存在很大区分度,图像的数据是连续的,这使得如果输入发生变化,输出是能够感知这类变化。而文本表示是离散的,如果输入发生细微变化,输出端可能没办法感知。使得loss为0,模型无法进行训练。
GAN的评估往往是在句子生成完之后进行评估,而通过对1产生的原因剖析,我们发现对非完整序列的评估同样重要。

总结

通过叙述SeqGAN产生的来龙去脉。为之后分析SeqGAN的做好铺垫。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-07 11:11:01  更:2022-05-07 11:13:36 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 7:52:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码