| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Test05 -> 正文阅读 |
|
[人工智能]Test05 |
?本期学习链接为https://github.com/datawhalechina/hands-on-data-analysis 第三章 模型搭建和评估--建模 经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。今天我们学习建模,下一节我们学习评估。 1首先导入 import pandas as pd 前几节基本上了解了pandas和numpy包 现在查询一下matplotlib.pyplot 相关百度链接为;https://blog.csdn.net/feng98ren/article/details/79392747 ?载入库 载入我们提供清洗之后的数据(clear_data.csv),大家也将原始数据载入(train.csv),说说他们有什么不同** ? ? 清洗后的数据看起来更简洁明了。大多是数字 模型搭建 * 处理完前面的数据我们就得到建模数据,下一步是选择合适模型 这里我的建模,并不是从零开始,自己一个人完成完成所有代码的编译。我们这里使用一个机器学习最常用的一个库(sklearn)来完成我们的模型的搭建 ?关于库(sklearn)的介绍; https://zhuanlan.zhihu.com/p/33420189 任务一:切割训练集和测试集 * 将数据集分为自变量和因变量 先取出来X和Y ?然后在进行切割‘ #### 任务二:模型创建 #### 提示2 ? ? ? ?【思考】 分别给不同函数结果进行分类。通常预测的规则都是通用的 多分类的问题常常是使用差分策略,通过二分类学习来解决多分类问题,即将多分类问题拆解为多个二分类训练二分类学习器最后通过继承得到结果,最经典拆分策略有三种:“一对一”(OvO)、“一对其余”(OvR)和“多对多”(MvM)。 #### 任务三:输出模型预测结果 #### 提示3 ?【思考】 可以让我们大致知道输出的结果,而且也可以根据这个来进行调整 #### 任务一:交叉验证 交叉验证 ?#### 提示4 k折交叉验证分数 平均交叉验证分数 #### 思考4 数量有限 #### 任务二:混淆矩阵 ?混淆矩阵 准确率 (Accuracy),精确度(Precision),Recall,f-分数计算方法 ? ? #### 提示5 ? 【思考】 要确定自己的矩阵有意义 #### 任务三:ROC曲线 【思考】什么是OCR曲线,OCR曲线的存在是为了解决什么问题? ROC的全名叫做Receiver Operating Characteristic,中文名字叫“受试者工作特征曲线”,其主要分析工具是一个画在二维平面上的曲线——ROC 曲线。 #### 提示6 ? ?#### 思考6 假设测试样本个数为m,类别个数为n。在训练完成后,计算出每个测试样本的在各类别下的概率或置信度,得到一个[m, n]形状的矩阵P,每一行表示一个测试样本在各类别下概率值(按类别标签排序)。相应地,将每个测试样本的标签转换为类似二进制的形式,每个位置用来标记是否属于对应的类别(也按标签排序,这样才和前面对应),由此也可以获得一个[m, n]的标签矩阵L。? 【思考】你能从这条OCR曲线的到什么信息?这些信息可以做什么? 比较优秀 ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 20:29:07- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |