IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> SimCSE 对比学习句向量 -> 正文阅读

[人工智能]SimCSE 对比学习句向量

摘要

本文介绍了简单的对比学习框架SimCSE,一种无监督方法,使用一个输入句子,在一个对比目标中预测自己,只使用标准的dropout作为噪声,效果与监督学习相当。删除dropout(数据增强方式)会导致表示崩溃。

本文提出了一种有监督的方法,将NLP推理数据集中的注释对纳入对比学习框架,集成对为正样本,对立对为负样本。实验表明对比学习将预先训练的嵌入的各向异性空间正则化,使其更加均匀,当有监督可用时能更好地处理。

介绍

SimCSE,一种简易对比句向量框架,可从未标注数据中产生好的句向量。

无监督的SimCSE预测输入句子本身,只有dropout作为噪声,即将同一个句子传递给预先训练的编码器两次,两次应用标准dropout,获得两个不同的嵌入作为正例。使用同一批次中其它句子作为负样本,模型预测负样本中的正样本。

有监督的SimCSE建立在近期成功使用NLI数据集进行句嵌入的基础上,将注释句对纳入对比学习,为一个3-way分类任务(蕴涵、中性和矛盾),使用蕴涵对可作为正样例。添加对应的矛盾对作为硬否定进一步提高性能。

为更好理解SimCSE,采用语义相关正对之间的对齐和整个表示空间的均匀性衡量学习到的向量的质量。

无监督SimCSE提高了均匀性,避免了dropout噪声退化对齐,提高了表示的表现力。NLI训练信号可进一步改善正对之间的对齐,产生更好的句向量。

背景

对比学习的目的是通过将语义上相近的邻居拉到一起,非邻居推开以学习有效的表示。假设一个成对的样本,其中xi和xi+ 语义相关。使用对比框架和批内负样本交叉熵目标函数;

用 h 表征 x,使用含有 N 对的最小批量 x 训练目标函数。

τ是温度超参数,sim(h1, h2)为余弦相似度。

使用BERT或RoBERTa编码输入的语句,使用对比学习(上述公式)调参。

对比学习中的一个关键问题是如何构建正样本对。视觉表示中,一种有效的解决方案是将同一图像的两种随机变换(例如,裁剪、翻转、扭曲和旋转)作为xi和xi+ 。语言表示可类似的方法,通过应用增强技术,如单词删除、重新排序和替换。但由于NLP的离散特性,数据增强在自然语言处理中具有固有的困难。

使用対齐性和均匀量表征质量。

给定正样本对的分布式表征,対齐性是计算向量对的预期距离。

?均匀性衡量的是嵌入均匀分布的程度:

无监督SimCSE

无监督SimCSE很单:取一个句子集合,关键是对正样本对通过使用独立采样的dropout掩码; Transformer模型汇总包含dropout层,使用不同比率,获得编码,对于大小为N的一批数据,其目标函数为,h编码后的x;

?Dropout噪音用于数据扩增:正样本对是相同句子使用不同dropout表征的向量

有监督SimCSE

增加dropout噪音可保持正样本对较好的対齐性。

使用NLI数据集预测句子间的关系:有继承性、中性或对立关系。

训练详情

使用BERT或RoBERTa预训练模型的CLS作为句向量,从英文维基百科随机抽取10^6个句子样本做无监督训练,

结论

本文提出了一个简单的对比学习框架SimCSE,提高了语义文本相似任务中句向量的表征。可使用NLI数据集预测输入句子本身的无监督和有监督方法。

无监督的对比目标,可在NLP中广泛应用,为文本输入的数据增强提供了新视角,可以扩展到其他连续表示,集成到语言模型预训练中。

参考:

原文:https://arxiv.org/abs/2104.08821v3

NLP论文阅读:最新对比学习方法 SimCSE_哔哩哔哩_bilibili

GitHub - princeton-nlp/SimCSE: EMNLP'2021: SimCSE: Simple Contrastive Learning of Sentence Embeddings https://arxiv.org/abs/2104.08821

simcse实践使用_programerchen的博客-CSDN博客

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-30 00:52:59  更:2022-09-30 00:56:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 21:13:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码