IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 一种机器翻译的评估方法 BLEU -> 正文阅读

[人工智能]一种机器翻译的评估方法 BLEU


title: BLEU
date: 2021-08-17 18:23:27
tags: NLP的一些收获

论文链接 BLEU: a Method for Automatic Evaluation of Machine Translation

首先给出一组reference和candidate:

Candidate1:It is a guide to action which ensures that the military always obeys the commands of the party.

Candidate2:It is to insure the troops forever hearing the activity guidebook that party direct.

Reference1:It is a guide to action that ensures that the military will forever heed Party commands.

Reference2:It is the guiding principle which guarantees the military forces always being under the command of the Party.

Reference3:It is the practical guide for the army always to heed the directions of the party.

任务是对两个候选案例进行评估。

论文基于词交集和ngram短语交集设计了如下算法进行评估:

其中:

可以看出这个算法由两部分组成,BP和改进后的ngram。

Modified Ngram

首先说明这个指标是针对于词的出现次数进行评估的。

它也可以分为两部分,因为它显然是一个值与该位置权重的乘积的累加,也就是wn和log(Pn),这里的n其实就是ngram的n。指的是词中word的个数。wn就是针对于不同的n的权重。

在计算ngram的值时,引入Min和Max。其中Max表示某一个词在n个reference中的出现次数的最大值,Min表示的是某一个词在Candidate中出现的次数和Max中的最小值。然后再求Min与候选词数和的比值。因此可以看出这个指标是对过长的词句有明显的处罚,因为当Candidate中的word没有在reference中出现时,Min的值必为0而候选词的数目会增加。

BP

Brevity Penalty补足Ngram的缺陷,对过短的candidate进行处罚,其中c是candidate中每一个句子的长度,r是refernce中最接近c的长度。当c越短时,这个系数当然会越小,指标值越小,很合理。

Merge

将二者整合在一起就是BLEU,取值范围[0,1],越大越好。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-28 11:54:55  更:2022-01-28 11:57:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/19 9:10:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码