IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【自然语言处理】【表格问答】简单有效的表格问答模型RCI -> 正文阅读

[人工智能]【自然语言处理】【表格问答】简单有效的表格问答模型RCI

一、简介

? 近期,研究人员尝试将预训练技术应用在表格问答领域中并取得了不错的效果,例如表格预训练模型 TAPAS \text{TAPAS} TAPAS TABERT \text{TABERT} TABERT

? 本文提出了两种新颖的方法,证明即使不使用预训练技术也能在表格问答上取得优越的表现。这两种方法分别为:

  • RCI?interaction \text{RCI interaction} RCI?interaction,该方法利用基于transformer结构的模型来分别对行和列进行分类,并确定与问题最相关的单元格。
  • RCI?represetation \text{RCI represetation} RCI?represetation,该方法通过将已有表格的嵌入向量进行持久化,从而能够为在线QA系统提供高效的服务。

? 实验表明, RCI?interaction \text{RCI interaction} RCI?interaction的表现超越了基于大量表格语料进行预训练的模型 TAPAS \text{TAPAS} TAPAS TABERT \text{TABERT} TABERT,在标准的 WikiSQL \text{WikiSQL} WikiSQL基准上实现了约3.4%和18.86%的改进。

二、整体思路

? RCI \text{RCI} RCI模型的灵感来源于表格问答的两个基本操作:行选择和列选择。将行和列的预测概率进行合并,就能得到表格中所有单元格的概率。将具有最高概率的单元格作为答案返回,或者对表格中的单元格进行高亮来帮助用户定位相关信息。一般来说,要定位答案所在的列比较容易,行会比较难。

三、模型 RCI \text{RCI} RCI

1. Interaction \text{Interaction} Interaction Representation \text{Representation} Representation

? RCI \text{RCI} RCI使用文本匹配来定位答案所在的行或者列,其中一个文本是问题,另一个文本是行或者列。 RCI \text{RCI} RCI模型有两个版本,分别是 Interaction \text{Interaction} Interaction Representation \text{Representation} Representation Interaction \text{Interaction} Interaction版本会将两个句子进行拼接,然后使用transformer进行分类,是一个标准的文本匹配模型。 Representation \text{Representation} Representation版本会分别对两个句子进行向量映射,然后比较这两个向量。因此, Representation \text{Representation} Representation版本的目标是改善实际应用系统的效率。

? 以列分类器举例, Interaction \text{Interaction} Interaction版本模型将问题和列文本进行拼接后送人transformer中。 Representation \text{Representation} Representation版本模型则会先对所有的表格进行预处理,为每行或者每列生成一个向量表示。在问答时,问题会被投影成向量,然后与列向量合并后,送入单层网络进行分类。

2. 问题形式化

给定一个 m m m n n n列的表格,其中表头为 H = [ h 1 , h 2 , … , h n ] H=[h_1,h_2,\dots,h_n] H=[h1?,h2?,,hn?],单元格的取值为 V = [ v i , j ] , 1 ≤ i ≤ m , 1 ≤ j ≤ n V=[v_{i,j}],1\leq i\leq m,1\leq j\leq n V=[vi,j?],1im,1jn。表格问答通常由1个表格、1个问题和一组包含正确答案的单元格位置索引组成。因此,单元格位置的索引记为 T ? I × J , I = 1 , 2 , . . . , m , J = 1 , 2 , . . . , n T\subseteq I\times J,I=1,2,...,m,J=1,2,...,n T?I×J,I=1,2,...,m,J=1,2,...,n。(这种精确的答案位置通常很难获得,因此本文中的模型采用弱监督的方式进行训练,即只要答案字符串在单元格中就为正确答案。)

? 模型的目标是训练出行和列分类器,从而能够找出正确的行和列索引
T r = { i ∣ ? j : ( i , j ) ∈ T } T c = { j ∣ ? i : ( i , j ) ∈ T } T_r=\{i|\exists j:(i,j)\in T\} \\ T_c=\{j|\exists i:(i,j)\in T\} Tr?={i?j:(i,j)T}Tc?={j?i:(i,j)T}

3. 表格序列化

? 可以简单的使用空格来连接行或者列的取值,从而实现表格的序列化。但是,最好能够将表格结构也合并至序列化的文本中。这里假设表格是单层表头,多层表头可以拉平后再应用该方法

? 行( S i r S_i^r Sir?)和列( S j c S_j^c Sjc?)序列化表示形式化为
S i r = ? j = 1 n ζ h ( h j ) ⊕ ζ v ( v i , j ) S j c = ζ h ( h j ) ⊕ ? i = 1 m ζ v ( v i , j ) \begin{aligned} S_i^r=\bigoplus_{j=1}^n\zeta_h(h_j)\oplus\zeta_v(v_{i,j}) \\ S_j^c=\zeta_h(h_j)\oplus\bigoplus_{i=1}^m\zeta_v(v_{i,j}) \end{aligned} Sir?=j=1?n?ζh?(hj?)ζv?(vi,j?)Sjc?=ζh?(hj?)i=1?m?ζv?(vi,j?)?
其中, ⊕ \oplus 表示拼接,函数 ζ h \zeta_h ζh? ζ v \zeta_v ζv?用于分隔表头和单元格取值。对于 ζ h \zeta_h ζh?会在表头后增加符号“:”,对于 ζ v \zeta_v ζv?则会在单元格取值后添加符号“|”。
在这里插入图片描述

? 以上表为例,该表格的第一行被转换为
Name:Benjamin?Contee|Took?office:1789|Left?office:1791|Party:Anti-Administration|Note/Events:| \text{Name:Benjamin Contee|Took office:1789|Left office:1791|Party:Anti-Administration|Note/Events:|} Name:Benjamin?Contee|Took?office:1789|Left?office:1791|Party:Anti-Administration|Note/Events:|
该表的第二列被转换为
Took?office:1789|1791|1792|1793|1795| \text{Took office:1789|1791|1792|1793|1795|} Took?office:1789|1791|1792|1793|1795|
? 无论是 Interaction \text{Interaction} Interaction版本或者 Representation \text{Representation} Representation版本模型都会使用上面的序列化表示。

4. Interaction \text{Interaction} Interaction模型

? 在 Interaction \text{Interaction} Interaction版本中,序列化文本会使用 [CLS] \text{[CLS]} [CLS] [SEP] \text{[SEP]} [SEP]与问题进行拼接。然后这个序列对被输入至 ALBERT \text{ALBERT} ALBERT。最终 [CLS] \text{[CLS]} [CLS]隐藏层的输出用于后面的线性层和 softmax \text{softmax} softmax,判断行或者列是否包含答案。

5. Representation \text{Representation} Representation模型

在这里插入图片描述

? 上图是 Representation \text{Representation} Representation版本模型的结构,问题 r q r_q rq?的向量表示和 j j j r c r_c rc?的向量表示会先被分别算出来。然后,这两个向量按各种方式进行拼接,并使用带有 softmax \text{softmax} softmax层的全连接层对拼接后的向量进行分类
r δ = r q ? r c v q c = r q : r c : r q ? r c : r δ ? r δ p ( j ∈ T c ) = s o f t m a x ( Wv q c + b ) 0 \begin{aligned} \textbf{r}_\delta&=\textbf{r}_q-\textbf{r}_c \\ \textbf{v}_{qc}&=\textbf{r}_q:\textbf{r}_c:\textbf{r}_q\otimes\textbf{r}_c:\textbf{r}_\delta\otimes\textbf{r}_\delta \\ p(j\in T_c)&=softmax(\textbf{Wv}_{qc}+\textbf{b})_0 \end{aligned} rδ?vqc?p(jTc?)?=rq??rc?=rq?:rc?:rq??rc?:rδ??rδ?=softmax(Wvqc?+b)0??

6. 扩展至聚合类问题

? 虽然模型 RCI \text{RCI} RCI主要聚焦在查询类问题,但也可以使用额外的问题分类器来实现对聚合类问题的回答。具体来说,使用另外一个transformer来对“问题-表头”对进行分类,类别为: lookup,max,min,count,sum,average \text{lookup,max,min,count,sum,average} lookup,max,min,count,sum,average。然后,设定一个阈值来选择一部分单元格,并使用具体的操作类型(平均、求和等)来对这些单元格进行操作。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-09 20:42:12  更:2022-02-09 20:42:17 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 10:44:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码