[人工智能] 徐亦达概率模型学习

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 徐亦达概率模型学习 -> 正文阅读

[人工智能]徐亦达概率模型学习

单高斯分布 MLE

posterior 正比例于 likelihood * prior
$p(\theta | x) \propto p(x|\theta) * p(\theta)$
$参数\theta的后验分布 \propto 参数\theta表示的x分布上已知样本有多大概率 * 参数\theta的先验分布$
$\propto 样本的likelihood * 参数的先验$
MLE : max log_likelihood estimator
MAP: max a posterior

混合高斯分布（多个高斯分布混合在一起） MLE

单高斯混合分布, 只需要令: $\frac{\partial{L}}{\partial{u}}=0$ ， $\frac{\partial{L}}{\partial{\Sigma}}=0$ ；即可一步到位的精确的求出 $u和\Sigma$ 的值

混合高斯分布，由于L中有log(多个式子求和)，而log(多个式子求和)求出导数是可以的，但要解 $\frac{\partial{L}}{\partial{u}}=0$ 、 $\frac{\partial{L}}{\partial{\Sigma}}=0$ 比较难，所以没法一步到位精确求解，只能迭代求解。此迭代求解方法即 EM算法

即:
解方程 $\frac{\partial{log(多个式子的乘积)}}{\partial{其中一个变量}}$ = 0 较难
解方程 $\frac{\partial{log(多个式子的和)}}{\partial{其中一个变量}}$ = 0 较容易
注意：两者的导数都可以求得出来

EM算法（混合高斯分布）

中心点或均值u、形状或协方差矩阵 $\Sigma$

em算法迭代过程演示

$em算法参数\Theta初始化为\Theta^{(1)}$
$em算法第1次迭代结果\Theta^{(2)}$
$em算法第2次迭代结果\Theta^{(3)}$
$\Theta^{(f)}$

em迭代描述

em算法迭代过程描述:
$\Theta^{(g+1)}=\Theta^{(g)}$
$\Theta^{(g+1)}={argmax}_{\Theta}\int_{z} {log p(X,z|\Theta) p(z|X,\Theta^{(g)})} dz$ (这里看完后弄清楚了回头要明确一下)

em算法引入的隐变量z应该保持边缘分布不变:

这里的 $z_i$ 就是前面"EM算法（混合高斯分布）" 中的 $\alpha_l$
上图 $p(x_i)$ 就是 $p(x_i|\Theta)$

em算法中 log_likelihood $p(X|\Theta)$ 逐步增加推导 1

如果对于任意 $\Theta$ 有 $H(\Theta^{(g)}, \Theta^{(g)} ) \ge H(\Theta, \Theta^{(g)} )$ ，
则 $H(\Theta^{(g)}, \Theta^{(g)} ) \ge H(\Theta^{(g+1)}, \Theta^{(g)} )$

em算法中 log_likelihood $p(X|\Theta)$ 逐步增加推导 2

Jensen’s inequality (琴生不等式)

…

sklearn 手写数字数据集 gmm 例子 (图片的一个像素点被当成一个随机变量)

"""sklearn 手写数字数据集 gmm 例子 (图片的一个像素点被当成一个随机变量)
来自 https://jakevdp.github.io/PythonDataScienceHandbook/05.12-gaussian-mixtures.html
或 https://github.com/jakevdp/PythonDataScienceHandbook/blob/master/notebooks/05.12-Gaussian-Mixtures.ipynb
"""

import numpy as np
from sklearn.datasets import load_digits
from matplotlib import pyplot as plt
def plot_digits(data):
    fig, ax = plt.subplots(10, 10, figsize=(8, 8),
                           subplot_kw=dict(xticks=[], yticks=[]))
    fig.subplots_adjust(hspace=0.05, wspace=0.05)
    for i, axi in enumerate(ax.flat):
        im = axi.imshow(data[i].reshape(8, 8), cmap='binary')
        im.set_clim(0, 16)
    plt.show()

digits = load_digits()
print(digits.data.shape)#(1797, 64)

# plot_digits(digits.data)

from sklearn.decomposition import PCA
pca = PCA(n_components=0.99, whiten=True)
data = pca.fit_transform(digits.data)
print(data.shape)#(1797, 41)

from sklearn.mixture import GaussianMixture
"""
n_components = np.arange(50, 210, 10)
models = [GaussianMixture(n_components=n, covariance_type='full', random_state=0) for n in n_components]
aics = [model.fit(data).aic(data) for model in models]
plt.plot(n_components, aics); plt.show()
"""

gmm = GaussianMixture(n_components=150, covariance_type='full', random_state=0)
gmm.fit(data)
print(gmm.converged_)

data_new,label_new = gmm.sample(n_samples=100)
print(data_new.shape)

digits_new = pca.inverse_transform(data_new)
plot_digits(digits_new)