IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> Datawhale 西瓜书第四章 -> 正文阅读

[数据结构与算法]Datawhale 西瓜书第四章

1、决策树基本流程

? ? ? ?决策树是模拟树状的决策过程,包括根节点、叶子节点和内部节点。根节点包括样本全集,叶子节点表示决策结果。决策树计算的过程就是寻找一条从根节点到叶子节点的路径。

? ? ? ?基本算法过程为:

2、划分选择

? ? ? ?决策树是递归过程,分为三种情况:

? ? ? (1)当前节点包含的样本全属于同一类别,无需化划分。

? ? ? (2)当前属性集为空,或是所有样本在所有属性上取值相同,无法划分。

? ? ? (3)当前节点包含的样本集合为空,不能划分。

? ? ? ? ?具体而言,划分的方法包括

? ? ? ? (1)信息增益。信息增益是使用信息熵来对样本的纯度进行分析。信息熵定义为:

Ent(D)=-\sum_{k=1}^{|y|}p_{k}log_{2}p_{k}

? ? ? ? ? 信息熵越小,数据集的纯度越高。

? ? ? ? (2)增益率。决策过程包括较多的属性偏好。为了减少属性偏好对决策树的影响,引入的增益率的概念,进行最优划分属性选择,计算公式为:

Gain_ratio(D,a)=\frac{Gain(D,a)}{IV(a)}

3、剪枝处理。剪枝处理是为了防止训练过程过拟合而导致的模型泛化性能不佳,包括预剪枝和后剪枝策略等。

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-07-23 11:03:36  更:2021-07-23 11:05:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 16:25:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码