IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> AWS文本表示三连击 -> 正文阅读

[人工智能]AWS文本表示三连击

????????今天带来亚马逊AI的三篇文本表示相关的论文。

一、PariSupCon

? ? ? ? 论文地址:ReadPaperhttps://readpaper.com/pdf-annotate/note?noteId=674471725467123712&pdfId=4558702641194999809? ? ? ? 代码地址:PairSupCon

????????本文是对sbert的"简单改进"。算法结构上没有太多的新的东西,主要的点是损失函数的设计。在模型结构上,使用的是sbert相同的结构,损失函数的选择是实例识别的对比函数加上普通的分类损失函数。还有一点细节就是负样本中加入了困难程度权重。

模型结构:

损失函数:

其中包含了分类损失(左边),对比损失(右边)。

? ? ? ? 分类损失:

? ? ? ? ?困难样本权重的对比损失:

?实验:

model

准确率

精确率

召回率

F1

bi-encoder

87.56%

92.88%

85.56%

89.07%

pairsupcon

88.26%

89.21%

91.23%

90.21%

? ? ? ? ? ? ? 模型:tuhailong/PairSupCon-roberta-wwm-ext · Hugging FaceWe’re on a journey to advance and democratize artificial intelligence through open source and open science.icon-default.png?t=M3C8https://huggingface.co/tuhailong/PairSupCon-roberta-wwm-ext? ? ? ? 该方法对比bi-encoder的方法,在准确率相近的情况下,F1值高了一个点,可以作为向量表示的方法代替bi-encoder。

二、VaSCL

? ? ? ? 论文地址:ReadPaperhttps://readpaper.com/pdf-annotate/note?noteId=635747223384444928&pdfId=4551519301694136321? ? ? ? 代码地址:VaSCL

????????本文是对SimCSE的"简单改进"。在SimCSE基于Dropout的对比损失的基础上,加入了虚拟增强对比损失,通过使用加入高斯噪声获得虚拟样本,而困难负样本则使用batch中k近邻的负样本;正样本的选择也尽量做到困难,选取可以使增强样本与源正样本距离最大化的高斯噪声进行虚拟增强。

损失函数:

????????

? ? ? ? 对比损失部分:

?????????选取相关噪声构造困难样本:

?三、Trans-Encoder

? ? ? ? 论文地址:ReadPaperhttps://readpaper.com/pdf-annotate/note?noteId=677106246942351360&pdfId=4552127588902903809? ? ? ? 代码地址:Trans-Encoder

????????本文结合自监督学习和知识蒸馏,首先bi-encoder作为教师模型蒸馏学习一个cross-encoder模型,再反过来利用cross-encoder蒸馏学习一个bi-encoder。

模型结构:

? ? ? ? 自蒸馏:

? ? ? ? 相互蒸馏:

?

这种左脚踩右脚的方式真的能有效吗?在两个教师模型效果都不太理想时,学生模型的误差会不会累积?能否使用大模型的bi-encoder和小模型的cross-encoder进行学习,这样的效果会不会更好?因为数据是无监督的,所以只能使用bi-encoder作为第一任老师,能不能在有监督的数据下,使用cross-encoder作为第一任老师?有时间把实验做一下再来讨论吧。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-22 18:36:57  更:2022-04-22 18:38:25 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 10:45:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码