IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 沐神实用机器学习4——模型评估 -> 正文阅读

[人工智能]沐神实用机器学习4——模型评估

4.1? 模型评估

模型指标

损失的值是衡量模型质量很好的指标，但模型的质量往往由多个指标来衡量；
其他指标：
- 具体的模型指标：分类的准确率，检测的mAP等；
- 具体的商业指标：推理/响应速度；

查询/页面 ==> 检索相关的广告 ==> 估计广告的点击率（CTR） ==> 展示CTR×price最高的广告

预测广告的点击率，即一个二分类问题；

正例（点击）往往较少，负例（不点击）往往较多，响应的数据量要符合实际。

Accuracy 准确率：预测正确的占总的（对于不平衡问题，往往更关注对正类的预测是否正确，更关注每一个类的精度和召回率）；
Precision 精度：对于某个具体的类 $i$ 预测对了多少个（预测为类 $i$ 且该类真的为类 $i$ ）?/ 把多少个样本预测成类 $i$ ；
Recall 召回率：预测为类 $i$ 而且它真的是类 $i$ ?/ 样本中有多少是类 $i$ ；
F1：平衡精度和召回。

关心模型是不是真的能把这两个类区分开来；

对于一个样本，预测值为 $\hat{y}$ ，阈值 $\theta$ （一般情况下为0.5，即正负样本平衡时），大于阈值为正类，小于阈值为负类，若正负样本不平衡，该怎么办？

实际生产过程中，会根据很多东西来选择 $\theta$ ，如就想把特别置信的选出来（关心广告正类预测的精度怎么样），将 $\theta$ 设置的比较大（只有预测值大于0.9时，认为是正类，此时精度会高，但召回率会低）。

在调整 $\theta$ 时，会做ROC曲线：

x轴，分母=有多少个负例的样本（没有点击的样本个数），分子=预测为正类，但实际是负类；
y轴，正类的召回。

ROC：每次取不同的 $\theta$ 值，做正类和负类的判断 ==> 得到曲线，每个点表示不同的 $\theta$ ，该曲线可以表示一种精度和召回之间的权衡。

AUC：曲线下面的面积（最大值为1，最小值为0）；

上图右半部分解释如下：

AUC=1，完全可以区分正类和负类；
AUC=0.7，正负类部分耦合；
AUC=0.5，正负类完全耦合 ≈ 随机预测；
AUC=0，正负类预测相反。

优化收入和用户体验；

Latency：延迟，响应速度；
ASN：平均每一页展现多少广告；
CTR：真实的用户点击率；
ACP：平均每次点击广告主给的钱。

模型上线并不能一次性满足所有指标，通常要有一定的权衡。

模型最关注的指标AUC；
一个新的模型，评估时AUC增加，但商业指标不一定增加；
部署模型用真实的数据来评估模型。?

4.2? 过拟合和欠拟合

4.3? 模型验证

references

4.1 模型评估【斯坦福21秋季：实用机器学习中文版】_哔哩哔哩_bilibili

4.2 过拟合和欠拟合【斯坦福21秋季：实用机器学习中文版】_哔哩哔哩_bilibili

4.3 模型验证【斯坦福21秋季：实用机器学习中文版】_哔哩哔哩_bilibili

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2022-01-28 11:54:55 更:2022-01-28 11:55:43

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/31 6:10:06-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码