| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 贝叶斯网专题10:参数学习之理论基础-分布的分布 -> 正文阅读 |
|
[人工智能]贝叶斯网专题10:参数学习之理论基础-分布的分布 |
第一部分:贝叶斯网基础1.1 信息论基础1.2 贝叶斯网基本概念1.3 变量独立性的图论分析第二部分:贝叶斯网推理2.1 概率推理中的变量消元方法2.2 团树传播算法2.3 近似推理2.3.1 蒙特卡洛方法2.3.1.1 重要性抽样法2.3.1.2 马尔可夫蒙特卡洛抽样法(MCMC)2.3.2 变分推理第三部分:贝叶斯网参数学习上一部分我们介绍了贝叶斯网推理方法,包括精确推理方法和近似推理方法。从本部分开始,将介绍贝叶斯网学习方法,包括本部分将介绍的参数学习方法,和下一部分将介绍的结构学习方法。 3.1 理论基础-分布的分布贝叶斯估计是贝叶斯网参数学习的重要方法,其理论基础是Beta分布和Dirichlet分布,它们是描述分布的分布。本节将对这两个分布的来源和性质作详细介绍。 3.1.1 泛化阶乘:Gamma函数在Beta分布和Dirichlet分布中都出现了Gamma函数,这里首先对Gamma函数进行介绍。 3.1.1.1 Gamma函数的定义和性质首先给出Gamma函数的定义: 3.1.1.2 Gamma函数简史最早提出『将阶乘扩展到实数域』这一问题的是哥德巴赫。他将阶乘序列绘制到坐标图上,并用一条平滑的曲线穿过所有这些点,但哥德巴赫无法给出这条光滑曲线的解析形式。于是他写信给贝努利求助。欧拉从贝努利那里得知了这个问题,并于1729年发现了Gamma函数,完美解决了该问题。当时欧拉只有22岁。 3.1.2 Beta分布3.1.2.1 单个顺序统计量的分布若有
n
n
n个随机变量独立同分布于0到1的均匀分布,记作:
X
1
,
X
2
,
?
?
,
X
n
~
i
i
d
U
n
i
f
o
r
m
(
0
,
1
)
X_1,X_2,\cdots,X_n\stackrel{iid}{\sim}Uniform(0,1)
X1?,X2?,?,Xn?~iidUniform(0,1) 。iid是独立同分布的缩写(independent identically distributed)。将这
n
n
n个随机变量按由小到大排序后得到顺序统计量,记作
X
(
1
)
,
X
(
2
)
,
?
?
,
X
(
n
)
X_{(1)},X_{(2)},\cdots,X_{(n)}
X(1)?,X(2)?,?,X(n)?,计算排在第
k
k
k位的随机变量
X
(
k
)
X_{(k)}
X(k)?的概率分布。 3.1.2.2 Beta分布的性质下图绘制了
α
1
,
α
2
\alpha_1,\alpha_2
α1?,α2?取不同值时,Beta分布的概率密度曲线。可以看出,Beta分布的定义域为
[
0
,
1
]
[0,1]
[0,1],刚好是概率的取值范围。且随着参数的不同,Beta分布具有非常丰富的形态,可以是凸的、凹的、单调递增的、单调下降的,也可以是曲线或者直线。当
α
1
=
α
2
=
1
\alpha_1=\alpha_2=1
α1?=α2?=1时,Beta分布等价于均匀分布。Beta分布还可以近似正态分布。正是由于Beta分布能够拟合如此多的形态,因此它在统计数据拟合中被广泛使用,可称为分布的分布。 Beta分布的期望也具有很优美的形式。 3.1.2.3 Beta-Binomial共轭Beta分布与Binomial二项分布是共轭的,即当数据符合二项分布时,参数的先验分布和后验分布都保持Beta分布的形式。写成表达式为: 在上一节中,
p
=
X
(
k
)
p=X_{(k)}
p=X(k)?是我们要猜测的参数。由于在获得任何关于
X
i
X_i
Xi?的知识之前,我们只能假设
X
i
X_i
Xi?服从均匀分布,进而我们推导出顺序统计量
p
p
p的分布服从Beta分布:
f
(
p
)
=
B
e
t
a
(
p
∣
k
,
n
?
k
+
1
)
f(p)=Beta(p|k,n-k+1)
f(p)=Beta(p∣k,n?k+1)。该分布称为p的先验分布。 Beta-Binomial共轭提供了先验分布和后验分布的形式不变性。基于此,我们可以在先验分布中赋予参数明确的物理意义,且该物理意义可延伸到后验分布中进行解释。在从先验到后验的过程中,所补充的数据知识也有明确的物理意义。最重要的是,在机器学习中,具有共轭性的分布可进行在线学习,降低学习成本,这在后面介绍贝叶斯网参数学习时会进行分析。 3.1.3 Dirichlet分布3.1.3.1 多个顺序统计量的联合分布回顾3.1.2.1节中关于单个顺序统计量的概率分布,其满足Beta分布。进一步地,我们来计算其中排在第
k
1
k_1
k1?和第
k
1
+
k
2
k_1+k_2
k1?+k2?位的两个顺序统计量的联合概率分布。 3.1.3.2 Dirichlet分布的性质从Dirichlet分布的推导过程以及其表达式形式可看出,Dirichlet分布是Beta分布在高维上的推广,它和Beta分布一样具有丰富的形态,可用于拟合各种高维联合分布。 3.1.3.3 Dirichlet-Multinomial共轭我们知道Dirichlet分布是Beta分布在高维上的推广,Beta分布与二项分布共轭,二项分布的高维推广是Multinomial多项式分布,则我们猜想Dirichlet分布与Multinomial共轭。 类似3.1.2.3节推导Beta-Binomial共轭,此时
p
?
=
(
X
(
k
1
)
,
X
(
k
1
+
k
2
)
)
\vec p=(X_{(k_1)},X_{(k_1+k_2)})
p?=(X(k1?)?,X(k1?+k2?)?)的联合概率密度函数为: 3.1.4 小结Beta分布及其高维扩展Dirichlet分布具有优良的共轭性质,且能拟合绝大部分概率分布的形态,在统计数据拟合中被广泛使用,可称为分布的分布,分布之母。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 12:56:08- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |