IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 10.变分推断 -> 正文阅读

[数据结构与算法]10.变分推断

10.变分推断

引入

? 机器学习可以分为两大派,即频率派和贝叶斯学派,从频率角度看,机器学习模型是一个优化问题,从贝叶斯角度来看,模型的求解是一个积分问题
P ( θ ∣ X ) = P ( X ∣ θ ) P ( θ ) P ( X ) = P ( X ∣ θ ) P ( θ ) ∫ θ P ( X ∣ θ ) P ( θ ) d θ P(\theta|X)=\frac{P(X|\theta)P(\theta)}{P(X)}=\frac{P(X|\theta)P(\theta)}{\int_\theta{P(X|\theta)P(\theta)d\theta}} P(θX)=P(X)P(Xθ)P(θ)?=θ?P(Xθ)P(θ)dθP(Xθ)P(θ)?
贝叶斯角度的推断过程,有N个样本X,对于新的样本 x ^ \hat{x} x^,要求 P ( x ^ ∣ X ) P(\hat{x}|X) P(x^X)
KaTeX parse error: No such environment: align* at position 8: \begin{?a?l?i?g?n?*?}? P(\hat{x}|X)&=…
如果新样本和数据集独立,那么推断就是概率分布依参数后验分布的期望。

我们看到,推断问题的中心是参数后验分布的求解,推断分为:

  1. 精确推断

  2. 近似推断-参数空间无法精确求解

    1. 确定性近似-如变分推断

    2. 随机近似-如 MCMC,MH,Gibbs

基于平均场假设的变分推断

Data : X

latent variable + parameter : Z, Z i Z_i Zi?为Z的第 i i i维特征,回顾EM中的推导
log ? P ( X ) = log ? P ( X , Z ) ? log ? P ( Z ∣ X ) = log ? P ( X , Z ) q ( Z ) ? log ? P ( Z ∣ X ) q ( Z ) \log{P(X)}=\log{P(X,Z)}-\log{P(Z|X)}=\log\frac{P(X,Z)}{q(Z)}-\log\frac{P(Z|X)}{q(Z)} logP(X)=logP(X,Z)?logP(ZX)=logq(Z)P(X,Z)??logq(Z)P(ZX)?
左右两边分别积分
KaTeX parse error: No such environment: align* at position 8: \begin{?a?l?i?g?n?*?}? &left:\int_Zq(…
其中 L ( q ) L(q) L(q)?称为变分,我们的目标是寻找 q ( Z ) q(Z) q(Z)?,让他近似于P(Z|X),他们越接近,KL(q,p)就越接近0,因为P(X)是不变的,最小化KL等同于最大化ELBO,所以问题转化为我们要找到使L(q)去最大值的q
q ^ = a r g m a x q L ( q ) \hat{q}=\mathop{argmax}_qL(q) q^?=argmaxq?L(q)
假设Z可以划分为M个独立的组,由平均场理论
q ( Z ) = ∏ i = 1 M q i ( Z i ) q(Z)=\prod_{i=1}^Mq_i(Z_i) q(Z)=i=1M?qi?(Zi?)
对于变分推断,我们固定其他项,关注其中的某一项,将上式子带入 L ( q ) = ∫ Z q ( Z ) l o g P ( X , Z ) d Z ? ∫ Z q ( Z ) l o g q ( Z ) d Z L(q)=\int_Zq(Z)logP(X,Z)dZ-\int_Zq(Z)logq(Z)dZ L(q)=Z?q(Z)logP(X,Z)dZ?Z?q(Z)logq(Z)dZ中,第一项可以改写为
KaTeX parse error: No such environment: align* at position 8: \begin{?a?l?i?g?n?*?}? \int_Zq(Z)logP…
对于第二项
KaTeX parse error: No such environment: align* at position 8: \begin{?a?l?i?g?n?*?}? \int_Zq(Z)logq…
将求和符号展开,对其中的第j项
KaTeX parse error: No such environment: align* at position 8: \begin{?a?l?i?g?n?*?}? &\int_{Z_1,Z_2…
于是第二项写为
∑ i = 1 M ∫ z i q i ( Z i ) l o g q i ( Z i ) d Z i \sum_{i=1}^M\int_{z_i}q_i(Z_i)logq_i(Z_i)dZ_i i=1M?zi??qi?(Zi?)logqi?(Zi?)dZi?
当我们只关心其中第j项时,上式改写为
∫ Z j q j ( Z j ) l o g q j ( Z j ) d Z j + c o n s t \int_{Z_j}q_j(Z_j)logq_j(Z_j)dZ_j+const Zj??qj?(Zj?)logqj?(Zj?)dZj?+const

l o g p ^ ( X , Z j ) = E ∏ i ≠ j q i ( Z i ) [ l o g ( X , Z ) ] log\hat{p}(X,Z_j)=E_{\prod_{i\neq{j}}q_i(Z_i)}[log(X,Z)] logp^?(X,Zj?)=Ei?=j?qi?(Zi?)?[log(X,Z)],原式等于
? ∫ Z j q j ( Z j ) l o g q j ( Z j ) p ^ ( X , Z j ) d Z j -\int_{Z_j}q_j(Z_j)log\frac{q_j(Z_j)}{\hat{p}(X,Z_j)}d_{Z_j} ?Zj??qj?(Zj?)logp^?(X,Zj?)qj?(Zj?)?dZj??
于是最大的 q j ( Z j ) = p ^ ( X , Z j ) q_j(Z_j)=\hat{p}(X,Z_j) qj?(Zj?)=p^?(X,Zj?)才能得到最大值。我们看到,对每一个 q j q_j qj? ,都是固定其余的 q q q,求这个值,于是可以使用坐标上升的方法进行迭代求解,上面的推导针对单个样本,但是对数据集也是适用的。

基于平均场假设的变分推断存在一些问题:

  1. 假设太强,Z 非常复杂的情况下,假设不适用

  2. 期望中的积分,可能无法计算

  3. 完整链接:https://blog.csdn.net/qq_27388259/article/details/112001400

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-12-18 16:14:34  更:2021-12-18 16:17:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 16:56:15-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码