IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 恒源云(GPUSHARE)_语音识别与语义处理领域之[机器翻译] 21.7 mRASP2 -> 正文阅读

[人工智能]恒源云(GPUSHARE)_语音识别与语义处理领域之[机器翻译] 21.7 mRASP2

文章来源 | 恒源云社区(一个专注 AI 行业的共享算力平台恒源智享云)

原文地址 | [机器翻译] 21.7 mRASP2

原文作者 | 角灰


Contrastive Learning for Many-to-many Multilingual Neural Machine Translation
github:

摘要:

现有的多语言模型聚焦于英语为中心的翻译,而非英语的方向远远落后。本文旨在一个多对多翻译系统,重点是非英语语言方向的质量。基于这样一个假设:通用的跨语言表示会导致更好的多语言翻译性能。为此提出了一种训练方法mRASP2,以获得单一统一的多语言翻译模型。mRASP2的核心在于如下两点:

  1. 通过对比学习拉近多语言表示对齐语义空间
  2. 同时使用平行和单语语料进行对齐增强

结论:

  1. 对比学习确实能提升零资源翻译
  2. 使用单语数据,所有翻译方向上都取得了实质性的改进。
  3. 分析并可视化了本文方法,对比学习确实能够拉近不同语言语义的表征
  4. 未来打算使用更大数据集训练模型PC150

方法:

1.损失函数

损失为交叉熵Lce和对比损失Lctr的加权和,|s|是平均句子长度,因为Lce是词级别的,而Lctr是序列级别的,两者有比例关系,因此要乘上平均句子长度。
xi,xj是平行语料。Lce计算常规decoder输出和label的交叉熵,旨在让解码器输出分布与真实分布一致。

而对比损失Lctr为了拉近语义空间中跨语言同义词的表征距离,并且拉远非同义词表征的距离。具体为:以某个样本点的源端向量表示为锚点,以该样本目标端的向量表征为正样本(过encoder),以同一个batch中其他样本点的目标端句子向量表示为负样本,最小化锚点和正样本的距离,最大化锚点和所以负样本的距离。

其中距离使用的是余弦距离,分子是锚点和正例的距离,分母是所有负例和锚点的距离和,通过最小化Lctr就能达到拉近同义词表征、拉远非同义词表征的目的。

引入对比学习,可以在不降低其他翻译方向的基础上,提高零资源翻译的性能。

2.对齐增强


其中距离使用的是余弦距离,分子是锚点和正例的距离,分母是所有负例和锚点的距离和,通过最小化Lctr就能达到拉近同义词表征、拉远非同义词表征的目的。

实验结果

相比多语言基线模型m-Transformer,mRASP2在表中的10个方向上都有显著的提升。
在无监督翻译(至少一端的语料在预训练时出现过)上平均超过了基线十多点。
即使是在零资源翻译(非英语对翻译)上性能也很卓越,和桥接模型差不多(pivot)。

可视化分析


使用T-SNE对英、日、德三种语言同义句的语义空间表征降维后可视化,发现使用mRASP(b)比基线transformer更好的拉近了多语言同义句的语义表征。

个人总结

对比学习yyds,接下来准备找代码试试。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-28 11:50:53  更:2022-04-28 11:53:23 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 8:18:48-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码