IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【 西瓜书】4 决策树 -> 正文阅读

[人工智能]【 西瓜书】4 决策树

西瓜书-决策树

在这里插入图片描述
决策树是递归生成过程,递归边界:

  1. 训练集全部属于同一类
  2. 所有样本属性相同,标签不同,不能划分,标签为当前节点的大多数标签。
  3. 样本集合为空,不能划分,标签为父节点的大多数的标签。

第二种是利用当前节点的后验分布,第三种是利用腹肌诶单的样本分布当做当前节点的先验分布

根据每次划分选择的属性的方式,有以下决策树算法

信息熵:越小,纯度越高,类别数少

信息增益:纯度增大的度量

ID3

用信息增益选择划分属性

缺点:信息增益偏好类别多的属性

因此,有用增益率来选择属性的

**增益率:**信息增益除以类别数

C4.5

用增益率选择属性。

缺点:增益率偏好取值数目少的属性,C4.5使用启发式尊重:先从候选划分属性找出信息增益高于平均水平的,再选择增益率高的

CART决策树

**基尼系数:**反映从数据集中抽取两个样本,类别不一样的概率,越小,纯度越高,选择金指数最小的属性为划分属性。

剪枝

决策树对付过拟合。

预剪枝

在生成过程中剪枝,每个节点预先估计会不会带来性能的提升。

是一种贪心做法,当前没有性能提升,但是后来可能会带来性能提升;减少了时间和测试时间开销。

性能

主要指泛化性能,采用留出法检验,在验证集上测试。

后剪枝

从训练集生成完整的决策树

泛化性能更好,时间开销大

连续与缺失值

连续

连续属性离散化,使用二分法(C4.5),和离散属性不同,属性可以重复使用

缺失值处理

问题:

  1. 有缺失情况下怎么选择属性
  2. 如果该属性上的值缺失,怎么划分这个数据

解决:

  1. 信息增益乘上一个系数,信息增益只能在无缺失数据上求,系数表示无缺失值所占比例
  2. 将样本按照不同的概率划分到不同的子节点中。同时进入每一个节点,并乘上一个概率系数。

多变量决策树

单变量决策树决策边界是线性的,这里是对变量的线性组合

课后习题

最小训练误差作为划分依据的缺陷

过拟合

最小训练误差是求误差最小化,在样本有限的情况下,若根据最小训练误差来进行树的节点划分,只要节点数越接近样本数那么训练误差会越小,这样训练出来的决策树会过拟合,从而缺乏泛化能力。

练误差是求误差最小化,在样本有限的情况下,若根据最小训练误差来进行树的节点划分,只要节点数越接近样本数那么训练误差会越小,这样训练出来的决策树会过拟合,从而缺乏泛化能力。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-14 23:56:33  更:2022-04-15 00:02:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:42:40-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码