| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习流程(一)-评价指标 -> 正文阅读 |
|
[人工智能]机器学习流程(一)-评价指标 |
一、分类评估指标
1.1精度 Acc预测正确的样本的占总样本的比例,取值范围为[0,1],取值越大,模型预测能力越好。 其中: 精度评价指标对平等对待每个类别,即每一个样本判对 (0) 和判错 (1) 的代价都是一样的。
1.2混淆矩阵 Confusion Matrix混淆矩阵又被称为错误矩阵,是除了ROC曲线和AUC之外的另一个判断分类好坏程度的方法。下面给出二分类的混淆矩阵:
如上表,可以将结果分为四类: 进一步可以推出这些指标:
?1.3准确率与召回率准确率又称查准率,预测为真正例(TP)占真正例与伪真例(TP+FP)的百分比。 ?召回率又称为查全率,预测为真正例(TP)占真正例与伪负例(TP+FN)的百分比 ?1.4 F1 Score和Fβ Score
Precision和Recall 是互相影响的,理想情况下肯定是做到两者都高,但是一般情况下Precision高、Recall 就低, Recall 高、Precision就低。为了均衡两个指标,我们可以采用Precision和Recall的加权调和平均(weighted harmonic mean)来衡量,即Fβ Score,公式如下: β表示权重: 通俗的语言就是:β 越大,Recall的权重越大, 越小,Precision的权重越大。 由于Fβ Score 无法直观反映数据的情况,同时业务含义相对较弱,实际工作用到的不多。 其中,β>1时,查全率更有影响;β=1时,退化为标准的F1;β<1时,查准率更有影响。??
精确率(Precision)和召回率(Recall)的调和平均数,最大为1,最小为0 F1值的一般形式为差准率和查全率的调和均值。?是分类与信息检索中最常用的指标之一。 1.5?P-R曲线(Precision-Recall Curve)P-R曲线又称为精确率(Precision)和召回率(Recall)变化的曲线 1.6?ROC 和 AUC
真正率(TPR): 识别对了的正例(TP)占实际总正例的比例,实际计算值跟召回率相同。 结论:ROC曲线越光滑,过拟合程度越小。绿线分类模型的整体性能要优于红线分类模型。
AUC 值为 ROC 曲线所覆盖的区域面积,显然,AUC越大,分类器分类效果越好。 AUC的物理意义:? AUC的物理意义正样本的预测结果大于负样本的预测结果的概率。所以AUC反应的是分类器对样本的排序能力。另外值得注意的是,AUC对样本类别是否均衡并不敏感,这也是不均衡样本通常用AUC评价分类器性能的一个原因。 1.7?KS(Kolmogorov-Smirnov)KS值是在模型中用于区分预测正负样本分隔程度的评价指标,一般应用于金融风控领域。 与ROC曲线相似,ROC是以FPR作为横坐标,TPR作为纵坐标,通过改变不同阈值,从而得到ROC曲线。 而在KS曲线中,则是以阈值作为横坐标,以FPR和TPR作为纵坐标,ks曲线则为TPR-FPR,ks曲线的最大值通常为ks值。 为什么这样求KS值呢?我们知道,当阈值减小时,TPR和FPR会同时减小,当阈值增大时,TPR和FPR会同时增大。而在实际工程中,我们希望TPR更大一些,FPR更小一些,即TPR-FPR越大越好,即ks值越大越好。 可以理解TPR是收益,FPR是代价,ks值是收益最大。图中绿色线是TPR、蓝色线是FPR。 KS统计量计算公式:KS = abs(FPR - TPR).max() 1.8代码样例
二、回归评估指标1、平均绝对误差(MAE) 2、均方误差(MSE) 3、均方根误差 4、R2拟合优度 说明:R2最大值为1。R2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R2的值越小,说明回归直线对观测值的拟合程度越差。 三、聚类评价指标 原文链接:https://blog.csdn.net/weixin_41175904/article/details/115502452 |
|
|
上一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 21:32:34- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |