[人工智能] Machine Learning（Lesson4 决策树与集成学习）

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Machine Learning（Lesson4 决策树与集成学习） -> 正文阅读

[人工智能]Machine Learning（Lesson4 决策树与集成学习）

引言

之前写的都太冗余了，其实代码什么的后面都差不多，把那章一个完整的机器学习项目认真学会了，就可以上Kaggle上面修炼了。以后我会试着用更简洁的语言，把问题大致说清楚，更大程度上忽略细节。

决策树

什么是决策树

决策树很简单，下图就是一颗决策树，能区分香蕉、西瓜、橙子三种水果。

是

否

是

否

是否是圆的

是否是绿的

香蕉

西瓜

橙子

但是对于我们所说的决策树，很关键一点就是，每个叶子节点里面包含的不是一个确定的类，而是成为某一类的概率，我们送于训练的样本通常来说并不存在某种方式把每类都分清楚（都分清楚了反而是过拟合）。

如何构建决策树

决策树判断是非常简单的，问题在于如何训练

基尼指数

$G_i={1-\sum_{k=1}^n}P_{i,k}^2$
基尼指数代表纯度，如果只含一个类，显然等于0，纯度非常高。越高纯度说明这个节点预测能力越强，可想而知我们希望节点的基尼指数尽可能高。

信息熵

$H_i=-\sum_{k=1,P_{i,k}!=0}^nP_{i,k}log(P_{i,k})$
信息熵就是含的信息量，如果一个节点只有一类，那log1=0，即信息熵为0。
众所周知，熵的意思是无序程度，熵越大不确定度越高，我们总是希望不确定性低一点，所以熵要尽可能小。
我们将依据这两个指标（二选一）建立树，聪明的你一定想到办法了