IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 贝叶斯与朴素贝叶斯 -> 正文阅读

[人工智能]贝叶斯与朴素贝叶斯

贝叶斯

贝叶斯分类算法是统计学的一种分类方法, 它是一类利用概率统计知识进行分类的算法。

贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。
按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。
如上公式也可变形为:P(A|B)=P(B|A)*P(A)/P(B)在这里插入图片描述

贝叶斯公式

在这里插入图片描述

公式的延伸:
在这里插入图片描述

概率是反映随机事件出现的可能性大小的量度,而条件概率则是给定某事件A的条件下,另一事件B发生的概率。 全概率公式则是利用条件概率,将复杂事件A分割为若干简单事件概率的求和问题。贝叶斯公式则是利用条件概率和全概率公式计算后验概率。

全概率公式

将复杂事件A的概率求解问题,转化为在不同情况下发生的简单事件的概率的求和问题,公式为:
在这里插入图片描述

朴素贝叶斯

朴素贝叶斯法是基于贝叶斯定理 与特征条件独立假设的分类方法。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model, NBM)。

在许多场合,朴素贝叶斯(Naive Bayes, NB) 分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。

朴素贝叶斯算法公式

以贝叶斯定理为基础) [假设特征之间相互独立,先通过训练数据集,学习从输入到输出的概率分布,再基于学习到的模型及输入,求出使得后验概率最大的输出实现分类。

在这里插入图片描述
特征之间相互独立:

在这里插入图片描述

算法另一种讲解

朴素贝叶斯分类器基于一个简单的假定:给定目标值时属性之间相互条件独立。

贝叶斯公式:
在这里插入图片描述

朴素贝叶斯:
将一个完成
在这里插入图片描述

朴素贝叶斯 比 贝叶斯 概率准确性高

朴素贝叶斯算法应用场景

常用场景

  1. 文本分类:
    正面信息有多少,负面信息有多少。还可以对文章分类,做成一个分类器。
    例如:涉政文章,涉黄文章,广告文章,诈骗文章,其他垃圾文章等。

  2. 垃圾邮件过滤
    把垃圾邮件过滤掉,例如开票,广告,违法等邮件。

  3. 多分类实时预测
    传入文本,图像,音频,立即做出回应,区分是否违规,返回给用户。

  4. 拼写纠错
    写文章,编辑,WORD时,打出标记红线,黄线,判断是否存在语法问题。

示例:

要把以下内容的垃圾文件过滤,可能是文本,图片

我司可代开普通增值税发票,税点优惠,欢迎来电咨询。

处理步骤:

  1. 进行分词
  2. 根据每个词出现的概率,求出正常邮件的概率,以及垃圾邮件的概率。
  3. 再进行对比,正常词占的百分比多,还是垃圾的词占的百分比多。
  4. 得出结果,这是垃圾邮件还是正常邮件。

C=P(“我”|S)P(“司”|S)P(“可”|S)P(“代开”|S)P(“普通”|S)P(“增值税”|S)P(“发票”|S)P( “税点”|S)P(“优惠”|S)P(“欢迎”|S)P(“来电”|S)P( “咨询”|S)P(“垃圾邮件”)

根据朴素贝叶斯算法,先求出每个分词占垃圾邮件的概率是多少,再累加相乘,得到一个总体概率。例如最后得出0.3 有30%的概率是垃圾邮件。

在计算出正常邮件的概率

W=P(“我”|H)P(“司”|H)P(“可”|H)P(“代开”|H)P(“普通”|H)*P(“增值税”|H)P( “发票”|H)P( “税点”|H)P( “优惠”|H)P( “欢迎”|H)P( “来电”|H)P(“咨询”|H)P(“正常邮件”)

得出概率:0.05

给出这个邮件是个垃圾邮件。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-08 22:28:32  更:2022-03-08 22:29:16 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 16:55:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码