开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 分类算法————决策树 -> 正文阅读

[人工智能]分类算法————决策树

1、认识决策树

1.1 信息论基础

1、认识决策树

原理：最早结构类似于if-else判断结构，利用该种结构分割数据的一种分类学习方法

为了高效的进行决策，所以需要将权值更高的语句最先判断，决定特征的先后顺序

使用哈夫曼树的方法构建?

1.1 信息论基础

1.1.1 信息：

消除随机不定性的东西——香农

1.1.2 信息熵：

衡量消除信息中不确定性程度的指标

1.1.3 信息增益

特征A对训练数据集D的信息增益g(D,A),定义为集合D的信息熵H(D)与特征A给定条件下D的信息条件熵H(D|A)之差。表示的是当得到某特征时，总的不确定性减少程度

?2，决策树划分依据

ID3
- 信息增益最大的准则
C4.5
- 信息增益比最大的准则
CART
- 分类树: 基尼系数最小的准则在sklearn中可以选择划分的默认原则
- 优势：划分更加细致（从后面例子的树显示来理解

3，决策树API

class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)
- 决策树分类器
- criterion:默认是’gini’系数，也可以选择信息增益的熵’entropy’
- max_depth:树的深度大小? ? 超参数通过设置树的深度，使模型不要过分延展，提高泛化能力
- random_state:随机数种子

4，预测鸢尾花数据集

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

def iris_demo():
    """
    利用决策树对鸢尾花数据集预测
    :return:
    """
    #1.读入数据
    iris=load_iris()

    #2.划分数据集
    x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,random_state=22)

    #3.建立决策树
    estimator=DecisionTreeClassifier(criterion='entropy',max_depth=10,random_state=12)
    estimator.fit(x_train,y_train)  #将训练集放入模型

    #4.模型评估
    score=estimator.score(x_test,y_test)
    print("预测准确率为：\n",score)
    return None
iris_demo()

与KNN算法相比，准确率降低。这是由于，决策树会耗费“代价”进行决策，在进行大型数据集预测时更有利

5，决策树可视化

导入文件?

from sklearn.tree import export_graphviz

?运行代码

 export_graphviz(estimator,out_file="iristree.dot",feature_names=iris.feature_names)

获得.dot文件，再通过其他方式转换成图片

6，总结

优点：
- 简单的理解和解释，树木可视化。
缺点：
- 决策树学习者可能会创建不能很好地推广数据的过于复杂的树，这被称为过拟合。
改进：
- 减枝cart算法(决策树API当中已经实现，随机森林参数调优有相关介绍)
- 随机森林

注：企业重要决策，由于决策树很好的分析能力，在决策过程应用较多，可以选择特征

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-21 20:50:48 更:2022-03-21 20:54:22

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/15 7:08:04-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码