| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 西瓜书第4章学习笔记 -> 正文阅读 |
|
[人工智能]西瓜书第4章学习笔记 |
4.1基本流程决策树的概念:基于树结构进行决策,包含根结点、若干内部结点和若干叶结点。叶结点对应于决策结果,其他每个结点对应于一个属性测试。每个结点包含的样本集根据测试结果被划分到各个子结点中,根节点包含所有样本集。遵循“分而治之(divide-and-conquer)”策略。 4.2划分选择总体目标是:决策树的分支结点所包含的样本尽可能属于同一类别,即结点的纯度越来越高。 三种划分的选择:信息增益、增益率和基尼指数 信息增益: ?增益率: ?基尼指数: 4.3剪枝处理“剪枝”主要是对付决策树学习的“过拟合”手段。基本策略分为“预剪枝”和“后剪枝”。 预剪枝是指在决策树生产过程中,对每个结点在划分前先进行估计,若当前结点的划分不能带来决策树泛化性能提升,则停止划分并标记当前结点为叶节点。 后剪枝是指先从训练集生成一棵完整的决策树,自底向上地对非叶结点进行考察,若将该结点对应的子树替换为叶结点能提升决策树泛化性能,则将该子树替换为叶结点。 4.4连续与缺失值连续值可采用二分法对其离散化处理,缺失值需要解决如何在属性值缺失的情况下进行划分属性选择和给定划分属性,若样本在该属性上的值缺失,如何对样本进行划分。 4.5多变量决策树“多变量决策树”就是能实现“斜划分”甚至更复杂划分的决策树。与传统的决策树不同,在多变量决策树的学习过程中,不是为每个非叶结点寻找一个最优划分属性,而是试图建立一个合适的线性分类器。 ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 4:19:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |