| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 朴素贝叶斯(分类模型) -> 正文阅读 |
|
[人工智能]朴素贝叶斯(分类模型) |
1、基本假设:各个维度上的特征被分类的条件概率之间是相互独立的 2、原理:单独考量每一维度特征被分类的条件概率,进而综合这些概率并对其所在的特征向量做出分类预测。 3、数学表达 ?p(y)的获得其实也较为简单:计算D中y的各个情况出现的频率即可(这里用到了大数定律:当训练集包含充足的独立同分布样本时,P(y)可通过各类样本出现的频率来进行估计) p(x|y)的获得略显困难,因为x往往包含多个相关因素(是一个多种因素构成的向量)。 所以目标转换为? ? ? agrmax? ? ?4、例子讲解 (1) 假设我们的任务是根据一个西瓜的特征来在它被吃之前判断它是否是个好瓜。现在我们有以下数据集: ?现在,基于已有的数据,我们想利用朴素贝叶斯算法训练出一个分类器,以判断一个具有特征{色泽=青绿,根蒂=蜷缩,敲声=浊响,纹理=清晰,脐部=凹陷,触感=硬滑,密度=0.697,含糖率=0.460}的测试样例瓜是否为好瓜 那么,首先我们估计先验概率P( y?),显然有: 其次,我们计算每个属性值的条件概率P ( x i ∣ y?)? 对于离散值属性: 对于连续值属性: 最后,我们计算测试瓜?x_{test}分别属于好瓜和坏瓜的概率: 很明显,测试瓜是好瓜的概率0.038远大于测试瓜是坏瓜的概率,于是分类器判断测试瓜为好瓜。 (2)拉普拉斯修正(Laplacian correction) ? ??Ni 代表第i个特征的个数,N代表分类的个数 ?那么在上面的西瓜数据集中,使用拉普拉斯修正后,对于类别概率就有: 对于具备特征{敲声=清脆}的测试瓜就有: ? ?5、参数估计 ????????极大似然估计(适用于模型已知,参数未知) ?证明过程可参考?极大似然估计法推出朴素贝叶斯法中的先验概率估计公式? - 知乎 (zhihu.com)https://www.zhihu.com/question/33959624 ?计算概率模型的时候就是估计参数的时候 ? ? ? ? ? ? ? ? ? ? ? ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 8:29:24- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |