| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习模型性能度量详解 【Python机器学习系列(十六)】 -> 正文阅读 |
|
[人工智能]机器学习模型性能度量详解 【Python机器学习系列(十六)】 |
机器学习模型性能度量 【Python机器学习系列(十六)】 文章目录性能度量,即对机器学习模型的泛化能力进行评估的过程。要进行性能度量,首先需要认识并掌握多种性能度量指标。 机器学习的任务可以分为回归任务和分类任务。回归任务中常用的性能度量指标是均方误差。这个较为基础,这里不多赘述。这里主要关注分类任务的性能度量指标。 1. 错误率 与 精度错误率 与 精度 是一对相反的指标。 2. 查准率 查全率 与 F12.1 TP、FP、FN、 TN首先认识四组概念:
则这四组指标满足TP+FP+FN+TN=样例总数。 2.2 查准率 与 查全率查准率和查全率,也是一对矛盾的变量。其针对的是分类问题的某一个类别。对一个机器学习模型某一次的预测结果中,对于不同的分类类别,可以有多个不同的查准率和查全率,而不是唯一的。 查准率(precision): 即:预测结果是某标签的样例中,实际真的是该标签的样例所占的比例。 查全率(recall): 2.3 P-R 图 与 平衡点P-R图 ?? 通常,如果一个机器学习模型的P-R曲线A被另一个模型的P-R曲线B完全包住,则可以断言B优于A。 此时可以用 平衡点(Break-Event Point, BEP) 来衡量。平衡点,是P-R图中查准率等于查全率时的取值。 2.4 F1相比BEP,F1是更为常用的度量指标。 公式为: ? 此外,
F
1
F1
F1度量的一般形式
F
β
F_\beta
Fβ?,可以表达出对查准率和查全率的偏好: β > 0 \beta>0 β>0度量的是查全率对查准率的重要性。 当
β
=
1
\beta=1
β=1时,即F1; 2.5 宏查准率 & 宏查全率 & 宏F1很多时候,可以得到多个混淆矩阵。如进行多次训练或测试,或有多个数据集,或者执行多分类任务。这样情况下,为了考察全局性能, 这里引入 宏查准率(macro-P)、宏查全率(macro-R)、 宏F1(macro-F1)三个指标。 2.6 微查准率 & 微查全率 & 微F1微查准率、微查全率、微F1,则是在计算多个TP、FP、TN、FN的时候,将其求均值。再使用得到的均值来计算出的即是微查准率(micro-P) 、微查全率(micro-R)、 微F1(micro-F1)。 3. ROC与AUCROC的全称是受试者工作特征(Receiver Operatng Characteristic)曲线。 真正例率的计算公式为: 假正例率的计算公式为: 表示实际为不是正例的样本中,预测为正例的样本的比例。 分别以假正利率和真正例率为横、纵轴,得到的图线即为ROC曲线,示例如图所示: ? ROC曲线下方包围的面积,即为AUC(Area Under ROC Curve)。 当然,这里的ROC曲线只是理想状态下的。现实中往往测试样本会比较少,绘制图形时只能用几个有限的坐标对,常常得不到这么完美的曲线,而是得到如下图所示的ROC曲线和AUC: 4. python计算ROC,AUC4.1 二分类情形以二分类为例,计算ROC和AUC的代码如下。
?????? 然后绘制roc曲线。
效果如下: 分别计算0为正例 和 1为正例时的AUC值:
????????? 也可以使用roc_auc_score()方法,在二分类的情形下,只能求出将标签值为1视为正例时的AUC值,该方法计算AUC值不需要求真正例率和假正例率,只需要传入真实的标签,以及预测判断每个样本为正例的概率。具体代码如下:
??????????????? 4.2 多分类情形与macro-AUC以三分类为例,标签有0,1,2三个,测试集的真实标签为y_test,预测概率为p,如下图所示: 则绘制ROC曲线:
?????????? 分别以0,1,2为正例,计算出的AUC值为:
???? roc_auc_score()方法,在多分类中,与二分类有所不同。可以通过roc_auc_score()方法来计算AUC的均值,从而评估模型的整体性能。
????? 本次分享就到这里,小啾感谢您的关注与支持!
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/28 18:49:05- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |