| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 谣言检测文献阅读四—Reply-Aided Detection of Misinformation via Bayesian Deep Learning -> 正文阅读 |
|
[人工智能]谣言检测文献阅读四—Reply-Aided Detection of Misinformation via Bayesian Deep Learning |
系列文章目录
前言文章:Reply-Aided Detection of Misinformation via Bayesian Deep Learning 1 介绍1、文章说目前其他的文章存在的一个问题:这些模型的一个主要限制是它们无法表示由有关正在审查的声明的不完整或有限的可用数据引起的不确定性。(A major limitation of these models is their inability to represent uncertainty caused by incomplete or finite available data about the claim being examined.)
2 相关工作2.1 文本内容??包含语言特征,因为虚假信息不是为了叙述客观事实,因此它们通常包含固执己见或煽动性的语言 2.2 来源可信度分析??原始发帖者诚信度越高、专业知识越渊博发帖的真实率越高(诚信度和专业知识可以通过账户特征来评估,例如个人信息的完整性、关注者和粉丝的数量) 2.3 多媒体功能??通过多媒体的视觉特征和统计特征判断信息的真假。视觉特征包括清晰度得分、连贯性得分、多样性得分和聚类得分。统计特征包括计数、图像比率、多图像比率、热图像比率、长图像比率等 2.4 社会参与人群的智慧,即通过其他人对于原贴的态度,立场,支持、反对、中性 3 问题说明??声明 C = { c 1 , c 2 , . . . , c N } C=\{c_1,c_2,...,c_N\} C={c1?,c2?,...,cN?}, c i c_i ci?由一 M M M个用户的回复 D = { d 1 , d 2 , . . . , d M } D=\{d_1,d_2,...,d_M\} D={d1?,d2?,...,dM?}组成,其中需要判断的消息为 { c i , D i } \{c_i,D_i\} {ci?,Di?},标签为 y i y_i yi? 4 贝叶斯深度学习4.1对声明进行编码??通过对声明编码得到先验概率,声明
c
=
{
w
1
,
w
2
,
.
.
.
,
w
l
}
c=\{w_1,w_2,...,w_l\}
c={w1?,w2?,...,wl?},其中
w
l
∈
R
d
w_l\in \mathbb{R}^d
wl?∈Rd是一个
d
d
d维向量 其中, μ θ μ_θ μθ?和 d i a g ( σ θ 2 ) diag(σ^2_θ) diag(σθ2?)是多元高斯分布的均值和协方差矩阵。由于变量 z z z取决于声称的隐藏状态 h c h_c hc?,我们通过深层神经网络从 h c h_c hc?推导出高斯分布的这两个参数:
4.2 对人们的回复进行编码??我们现在展示人们的回复编码器来获取辅助信息。该辅助信息是特定于声明的,用于通过纠正声明真实性的先验信念来生成后验信念。 4.3 准确性建模??后验信念是通过 MLP 组合声明和回复信息来生成的。 MLP 的强非线性使其适合于查找索赔与其答复之间的复杂关系。具体来说,MLP 输入是潜在声明变量 z 连接到回复的隐藏状态
h
D
h_D
hD? 5 优化??我们模型的随机变量是非线性和非共轭的。因此,后验分布不能通过分析推导出来。为了逼近后验分布,我们构建了一个由
?
\phi
? 参数化的推理模型来逼近难以处理的真实后验
p
θ
(
z
∣
h
c
)
p_θ (z|h_c )
pθ?(z∣hc?);然后我们推导出一个目标函数来衡量
p
θ
(
z
∣
h
c
)
p_θ (z|h_c )
pθ?(z∣hc?)的逼近程度;最后,我们利用随机梯度变分贝叶斯 (SGVB) 方法来学习推理模型参数
?
\phi
?和生成模型参数
θ
θ
θ。 5.1 推理模型??遵循神经变分推理方法,我们构建了一个由
?
\phi
? 参数化的推理模型,以计算近似的后验分布,称为变分分布。给定观察到的变量,我们定义了一个变分分布
q
?
(
z
∣
y
,
h
c
,
h
D
)
q_\phi(z|y,h_c,h_D)
q??(z∣y,hc?,hD?) 来逼近真实的后验分布
p
θ
(
z
∣
h
c
)
p_θ (z|h_c)
pθ?(z∣hc?)。类似于变分自动编码器(VAE),类似于方程式。 公式(3) 对于
p
θ
(
z
∣
h
c
)
p_θ (z|h_c)
pθ?(z∣hc?),变分分布被选择为多元高斯分布: 5.2 目标函数??下面我们根据变分原理推导出贝叶斯深度学习模型的目标函数。为了最大化对数似然
l
n
(
p
(
y
∣
h
c
,
h
D
)
)
ln(p(y|h_c,h_D))
ln(p(y∣hc?,hD?)) ,我们推导出一个证据下界 (ELBO) 目标函数,以确保正确逼近真实的后验。为了简化目标函数推导的符号,我们进行以下代入:
p
θ
(
y
)
=
p
θ
(
y
∣
z
,
h
D
)
,
p
θ
(
z
)
=
p
θ
(
z
∣
h
c
)
,
q
?
(
z
)
=
q
?
(
z
∣
y
,
h
c
,
h
D
)
p_θ (y) = p_θ (y|z,h_D), p_θ (z) = p_θ (z|h_c ), q_? (z) =q_?(z|y,h_c,h_D)
pθ?(y)=pθ?(y∣z,hD?),pθ?(z)=pθ?(z∣hc?),q??(z)=q??(z∣y,hc?,hD?)-公式(10)。目标函数推导如下: 注:KL散度、期望E计算方法 5.3 梯度估计??我们推导出一个基于小批量的 SGVB 估计器来区分和优化关于推理参数
?
?
?和生成参数
θ
θ
θ的ELBO 目标函数
L
(
θ
,
?
∣
y
,
h
c
,
h
D
)
L(θ, ?|y,h_c,h_D)
L(θ,?∣y,hc?,hD?)。通过蒙特卡罗估计,我们计算了 ELBO 目标函数的期望部分。让小批量大小为 B,对于每个声明
c
i
,
i
∈
[
1
,
B
]
c_i,i ∈ [1, B]
ci?,i∈[1,B],S 是从变分后验分布
z
~
~
q
?
\widetilde{z} ~ q_?
z
~q??中抽取的样本。给定一个声明子集,我们可以为基于小批量的完整数据集构建一个 ELBO 目标函数的估计器,如下所示: 5.4 预测??训练后,我们通过生成网络计算后验分布
p
θ
(
z
∣
h
c
)
p_θ (z|h_c )
pθ?(z∣hc?)。声明真实性的实际预测是通过对 S 个样本的期望给出的: 6 实验设置6.2 数据集6.4 超参数设置三个 LSTM 的激活函数是 tanh。 MLP 的激活函数是 ReLu。在验证子集上调整的超参数是:
7 结果与讨论7.2 潜在分布的合并是否优于确定性分布???在本小节中,我们评估了在索赔编码器中使用潜在分布对错误信息检测任务的影响。为了评估潜在分布p的影响,我们在我们的模型中去除p,并将其分类性能与完整模型进行比较。具体来说,去除p是通过获取BiLSTM隐藏状态的输出,即
h
c
h_c
hc?,并将其作为输出MLP的输入来完成的。模型的其余部分保持不变。由于不涉及潜在分布,去除p的模型根据传统的Softmax损耗最小化进行了优化。在图4(a)和图4(b)中,我们展示了在Rumoreval和Pheme测试子集上去除p的模型相对于完整模型的分类性能。我们观察到,在每个评估指标上,完整模型的表现都比烧蚀模型好至少7.77%。这表明通过使用潜在分布可以获得更好的表示质量。 7.3 从人们的回复中获得的辅助信息是否会产生一种更准确的后验信念,即声明的真实性???使用回复和不使用回复准确率对比 7.4 在对回复进行编码时,时间顺序是否优于随机顺序???对于RumorEval数据集影响较大,但是对于Pheme数据集影响较小,而RumorEval数据量(153)远远小于Pheme(1468),推测是否是和数据量有关,是否是当原始数据量大时候回复的影响几乎消失 7.5 加入一个潜在变量来编码回复是否有益???我们通过在回复编码器中添加一个新的潜在分布来扩展我们的模型。与声明编码器所做的类似,新的潜在分布被设计为多维高斯分布,其均值和协方差矩阵源自 LSTM 输出
h
D
h_D
hD?(如公式 3、4 和 5 中所示)。与等式 6 类似地对一个新的潜在变量进行采样,并将其输入到 MLP 以预测正在检查的声明的准确性。实验证明,回复添加额外的潜在分布并没有提供任何额外的性能改进。 7.6 潜在变量z的维数如何影响模型的性能? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 7:45:28- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |