| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 随机森林实例(R语言实现) -> 正文阅读 |
|
[人工智能]随机森林实例(R语言实现) |
1.可以先查询一下路径(可以是数据所在的路径) 需要更改路径的话用setwd(“路径”) 2.安装需要的包并使用
3.导入数据 如果用R自带的数据,以iris为例:有5个变量,3个种类 可以把Species作为因变量,用其它4个变量来预测种类 如果要调用本地的数据:
4.划分数据集、测试集 用createDataPartition()来划分,p=0.8表示80%的数据作为训练集,20%作为测试集,一般的训练集和测试集是比例是7:3或者8:2 将trainlist中的数作为训练集trainset,将不在trainlist中的数作为测试集testset 训练集有120行,5个变量 测试集有30行,5个变量 变量数目要保持一致 5.构建模型 R语言可以自动识别因变量的类型,如果是因子,就是做分类模型 为了复现模型,设置set.seed(数字随便写)
? 错误率:5.83% 混淆矩阵:看对角线,setosa的40个都预测正确,versicolor错了4个,virgincica错了3个? 也可以画图看一下效果
? 6.预测 得到预测结果:
查看各项指标:
上方的混淆矩阵显示:第一,二个种类的预测全对,第三个错了1个,错的是把virginica预测成bersicolor
7.ROC和AUC 前面需要的是类别,所以type="class" 而ROC需要一个概率,所以type=“prob”
可以看到1,0.992说明很好 画ROC曲线 由于有三个变量,所以用多分类muticlass.roc(testser$Species,rf.test2) 如果只有两个变量,二分类调用roc(testset$Species, rf.test2)
AUC值是0.995,很理想 ?? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 16:32:14- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |