| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> “西瓜书核心知识点”---第二章:模型评估与选择 -> 正文阅读 |
|
[人工智能]“西瓜书核心知识点”---第二章:模型评估与选择 |
1.错误率(error rate): 误差:学习器的实际预测输出与样本真是输出之间的差异。 泛化误差:学习器在新样本上的误差。泛化误差越小越好。学的“太好了”(将训练样本本身的特点当成所有样本都会有的一般性质)就会导致泛化能力下降,即“过拟合”。“欠拟合”:对训练样本的一般性质尚未学好。 2.评估泛化误差:使用“测试集”来测试学习器对新样本的判别能力,得到“测试误差”即近似为“泛化误差”。 3.划分数据集:若只有一个数据集,划分训练集S和测试集T的方法: (1)留出法: ① 按比例:三七分、二八分。 (2)交叉熵验证法: “k折交叉熵”,将数据集D划分为k个大小相似的互斥子集,每个子集尽可能保持数据分布的一致性,即分层采样。其中k-1个子集的并集作为训练集S,另一个子集作为测试集S。常用k = 5,10,20。 (3)自助法: 用以解决数据集较小,难以有效划分训练/测试集时很有用。 (4)调参与自助模型
(2)查准率、查全率和F1: 因为错误率和精度不能满足其他要求,例如:“Web检索中,有多少比例的内容是用户所感兴趣的”“用户感兴趣的信息中多少被检索出来了”。 查准率:P = TP / ( TP + FP ) P高,则R低;P低,则R高。例:好瓜尽可能挑出来,增加选瓜数量,查准率低;好瓜比例高,只挑有把握的,漏掉好瓜,则查全率低。 P-R曲线: ① 若一个学习器的P-R曲线被另一个的完全包住,则后者性能更好;
(3)ROC(受试者工作特征)和AUC: 根据学习器的预测结果对样例进行排序(学习器为测试样本产生一个实值或概率预测,然后与一个分类阈值进行比较,大于阈值,为正,否则为负),按此顺序逐个把样本作为正例进行预测,得“真正例率”TPR(true positive rate)和“假正例率”FPR(false positive rate)。
点(0,1):对应于将所有正例排在所有反例之前的“理想模型”。 曲线的绘制过程: 若一个学习器的ROC曲线被另一个学习器的曲线完全“包住”,则断言后者优于前者。若两线交叉,则比较ROC曲线下的面积AUC。 (4)代价敏感错误率与代价曲线: 因为不同代价所造成的影响不同,直接用错误率(都看成影响相同的)不再适用,所以引入“代价敏感错误率”。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 15:55:42- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |