IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【Day 1】机器阅读理解——机器阅读理解简介 -> 正文阅读

[人工智能]【Day 1】机器阅读理解——机器阅读理解简介

引言

本系列文章会介绍机器阅读理解相关技术和模型。主要按照以下线路:

image-20211103080154867

机器阅读理解介绍

NLP四大基本任务:

  • 序列标注:分词、词性标注
  • 分类任务:文本分类、情感分析
  • 句子关系:问答系统、对话系统
  • 生成任务:机器翻译、文章摘要

阅读理解一般基于NLU(自然语言理解)和NLG(自然语言生成),是比较特殊的,无法简单的归类与上面某类。

阅读理解 指通过阅读从文本中抽取信息并理解意义的过程。

机器阅读理解(Machine Reading Comprehension,MRC) 是QA问题的子集,含有contexts,通过交互从文字中提取与构造文章语义。

机器阅读理解

给定上下文 C C C和问题 Q Q Q,需要模型给出关于问题 Q Q Q的正确答案 A A A,通过学习某个函数 F \mathcal{F} F,比如 A = F ( C , Q ) A=\mathcal{F}(C,Q) A=F(C,Q)

典型的应用场景有:搜索引擎、机器问答&智能客服等。

机器阅读理解也有四大任务:

  • 完形填空
  • 单项选择
  • 答案抽取
  • 自由回答

完形填空 从原文中除去若干单词或实体,需要模型填入正确的单词或实体。

单项选择 从给定的若干选择中选出正确答案。

答案抽取 回答限定是文章的一个子句,需要模在文章中标注正确答案的起始和终止位置。

片段抽取

给定包含 n n n个单词的上下文 C = { t 1 , t 2 , ? ? , t n } C=\{t_1,t_2,\cdots,t_n\} C={t1?,t2?,?,tn?},和问题 Q Q Q,片段抽取(span extraction)需要从上下文 C C C中抽取连续的子序列 A = { t i , t i + 1 , ? ? , t i + k } A=\{t_i,t_{i+1},\cdots,t_{i+k}\} A={ti?,ti+1?,?,ti+k?}作为问题 Q Q Q的答案,通过学习一个函数 F \mathcal{F} F,使 A = F ( C , Q ) A=\mathcal{F}(C,Q) A=F(C,Q)

自由回答 不限定模型生成答案的形式,允许模型自由生产数据(自己组织语言回答问题)。

下面列出各任务对应的数据集:

  • 完形填空:
    • CNN&Daily Mail
    • CBT
  • 单项选择:
    • MC Test
    • RACE
  • 答案抽取:
    • SQuAD
    • NewsQA
  • 自由回答:
    • MS MARCO
    • DuReader1

机器阅读理解模型架构

image-20211103230624502

总体架构如上。

Embedding

  • One-hot
  • Word2vec
  • Elmo
  • BERT

Feature Extraction

  • CNN
  • RNN
  • Transformer

Context-Query Interaction

  • 注意力机制

Answer Prediction

  • Word predictor
  • Option predictor
  • Span extractor
  • Answer generator

评估指标

Accuracy

准确率
Accuracy = n m \text{Accuracy} = \frac{n}{m} Accuracy=mn?

F1

P = precision = T P T P + F P R = recall = T P T P + F N F1 = 2 × P × R P + R \text{P} = \text{precision} = \frac{TP}{TP +FP} \\ \text{R} = \text{recall} = \frac{TP}{TP +FN} \\ \text{F1} = \frac{2 \times P \times R}{P + R} P=precision=TP+FPTP?R=recall=TP+FNTP?F1=P+R2×P×R?

Rouge-L

R l c s = L C S ( X , Y ) m P l c s = L C S ( X , Y ) n F l c s = ( 1 + β ) 2 R l c s P l c s R l c s + β 2 P l c s R_{lcs} = \frac{LCS(X,Y)}{m} \\ P_{lcs} = \frac{LCS(X,Y)}{n} \\ F_{lcs} = \frac{(1+\beta)^2R_{lcs} P_{lcs}}{R_{lcs} + \beta^2P_{lcs}} Rlcs?=mLCS(X,Y)?Plcs?=nLCS(X,Y)?Flcs?=Rlcs?+β2Plcs?(1+β)2Rlcs?Plcs??

其中 m m m指标准答案长度, n n n指模型答案长度。

NLP相关任务的基本流程

image-20211103233456885

文本特征工程一般应用在机器学习模型上,而深度学习模型一般不需要。

推荐阅读论文Neural Machine Reading Comprehension: Methods and Trends 2

Reference


  1. DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications ??

  2. Neural Machine Reading Comprehension: Methods and Trends ??

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-09 19:29:17  更:2021-11-09 19:29:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 6:32:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码