| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> DiffCSE -> 正文阅读 |
|
[人工智能]DiffCSE |
DiffCSE模型这篇论文DiffCSE: Difference-based Contrastive Learning for Sentence Embeddings提出了 DiffCSE,一种用于学习句子嵌入的无监督对比学习框架。 DiffCSE 学习对原始句子和编辑句子之间的差异敏感的句子嵌入,其中编辑句子是通过随机mask原始句子然后从masked language模型中采样获得的。DiffCSE是对SimCSE模型的优化。这篇论文是发表于2022NAACL,代码地址为代码 论文亮点(1)目前在Semantic Textual Similarity (STS)任务上的SOTA模型 模型DiffCSE是无监督对比学习,模型分为sentence encoder
f
f
f,generator
G
G
G,discriminator
D
D
D 。模型结构图如下: Loss模型loss分两个部分,分别为对比loss和Replaced Token Detection (RTD) loss。
L
c
o
n
t
r
a
s
t
=
?
log
?
e
s
i
m
(
h
i
,
h
i
+
)
/
τ
∑
j
=
1
N
e
s
i
m
(
h
i
,
h
j
+
)
/
τ
\mathcal{L}_{contrast} = -\log\frac{e^{sim(h_{i}, h_{i}^{+})/\tau}}{\sum_{j=1}^{N}e^{sim(h_{i}, h_{j}^{+})/\tau}}
Lcontrast?=?log∑j=1N?esim(hi?,hj+?)/τesim(hi?,hi+?)/τ?
L
R
T
D
=
∑
i
N
L
R
T
D
x
i
\mathcal{L}_{RTD} = \sum_{i}^{N}\mathcal{L}_{RTD}^{x_{i}}
LRTD?=i∑N?LRTDxi??
L
R
T
D
x
i
=
∑
i
=
1
T
(
?
1
(
x
(
t
)
′
′
=
x
(
t
)
)
log
?
D
(
x
′
′
,
h
,
t
)
?
1
(
x
(
t
)
′
′
≠
x
(
t
)
)
log
?
D
(
x
′
′
,
h
,
t
)
)
\mathcal{L}_{RTD}^{x_{i}} = \sum_{i=1}^{T}\Large(-\Large\boldsymbol{1} (x^{''}_{(t)}=x_{(t)})\log D(x^{''}, \boldsymbol{h}, t)\\- \Large\boldsymbol{1}(x^{''}_{(t)}\neq x_{(t)})\log D(x^{''}, \boldsymbol{h}, t))
LRTDxi??=i=1∑T?(?1(x(t)′′?=x(t)?)logD(x′′,h,t)?1(x(t)′′??=x(t)?)logD(x′′,h,t)) 模型参数说明(1)sentence encoder
f
f
f和 discriminator
D
D
D中的参数进行更新,generator
G
G
G参数固定 (5)句子随机mask占比为30%的时候,模型效果好
在DiffCSE中的Pooler Choice选择有"cls", “cls_before_pooler”, “avg”, “avg_top2”, "avg_first_last"等。 实验结果后期补充实验结果。 如果表述不当,欢迎指正,谢谢。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 4:45:27- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |