[人工智能] [机器学习]贝叶斯分类器I

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> [机器学习]贝叶斯分类器I -> 正文阅读

[人工智能][机器学习]贝叶斯分类器I

贝叶斯分类器I

贝叶斯决策论

贝叶斯决策论实在概率框架下实施决策得基本方法。

对分类任务来说，在所有相关概率都已知得理想情况下，贝叶斯决策论考虑如何基于这些概率和误判损失选择最优得类别标记。

问题：

假设有 $N$ 种可能得类别标记，即 $y=\left \{ c_1,c_2,\cdots,c_N \right \}$ ， $\lambda_{ij}$ 为将一个真实标记为 $c_i$ 的样本误标记为 $c_j$ 所产生的损失.

条件风险： $R(c_i|x)=\sum_{N}^{j=1}\lambda_{ij}P(c_j|x)$
目标：于是我们的任务便是寻找一个判定准则 $\longrightarrow y$ 以最小化总体风险： $R(h)=E_x\left [ R(h(x)|x) \right ]$
结果： $h^*(x)={argmin}_{c\in y }R(c|x)$ ， $h^*(x)$ 称为贝叶斯最优分类器。

若记 $\lambda_{ij}=\left\{\begin{matrix} 0,i=j \\ 1,i\ne j \end{matrix}\right.$ ，则条件风险 $R (c ∣ x) = 1 ? P (c ∣ x)$ ，贝叶斯最优分类器为 $h^*(x)={argmax}_{c\in y }P(c|x)$ 。

于是问题转化为估计 $P (c ∣ x)$ ，由贝叶斯定理 $P(c|x)=\frac{P(c)P(x|c)}{P(x)}$ 。
在这里插入图片描述

朴素贝叶斯分类器

朴素贝叶斯分类器(naive Bayes classifier)采用了“属性条件独立性假设”：对已知类别，假设所有属性相互独立。

目标函数

$\begin{matrix} P(c|x)=\frac{P(c)P(x|c)}{P(x)}=\frac{P(c)}{P(x)}\prod_{i=1}^{d}P(x_i|c) \\ \\ h_{nb}(x)={argmax}_{{c\in y }}P(c)\prod_{i=1}^{d}P(x_i|c) \end{matrix}$

求解

先验概率： $P(c)=\frac{\left | D_c \right | }{\left | D \right | }$
条件概率：

离散属性：令 $D_{c,x_i}$ 表示 $D_c$ 中在第 $i$ 个属性上取值为 $x_i$ 的样本组成的集合，则： $P(x_i|c)=\frac{\left | D_{c,x_i} \right | }{\left | D_c \right | }$
连续属性：考虑概率密度函数，假定 $p(x_i|c)\sim N(\mu_{c,i},\sigma_{c,i}^2)$ ，则： $P(x_i|c)=\frac{1}{\sqrt{2\pi}\sigma_{c,i}}exp(-\frac{(x_i-\mu_{c,i})^2}{2\sigma_{c,i}^2} )$

补充

为避免其他属性携带信息被训练集中未出现的属性值抹去，在估计概率时通常要进行平滑，常用拉普拉斯修正：
$\begin{matrix} \hat{P}(c)=\frac{\left | D_c \right |+1 }{\left | D \right |+N } \\ \\ \hat{P}(x_i|c)= \frac{\left | D_{c,x_i} \right |+1 }{\left | D_c \right |+N_i } \end{matrix}$