IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 沐神实用机器学习4——模型评估 -> 正文阅读

[人工智能]沐神实用机器学习4——模型评估

4.1? 模型评估

模型指标

  • 损失的值是衡量模型质量很好的指标,但模型的质量往往由多个指标来衡量;
  • 其他指标:
    • 具体的模型指标:分类的准确率,检测的mAP等;
    • 具体的商业指标:推理/响应速度;

查询/页面 ==> 检索相关的广告 ==> 估计广告的点击率(CTR) ==> 展示CTR×price最高的广告

预测广告的点击率,即一个二分类问题;

正例(点击)往往较少,负例(不点击)往往较多,响应的数据量要符合实际。

  • Accuracy 准确率:预测正确的占总的(对于不平衡问题,往往更关注对正类的预测是否正确,更关注每一个类的精度和召回率);
  • Precision 精度:对于某个具体的类i预测对了多少个(预测为类i且该类真的为类i)?/ 把多少个样本预测成类i
  • Recall 召回率:预测为类i而且它真的是类i?/ 样本中有多少是类i
  • F1:平衡精度和召回。

关心模型是不是真的能把这两个类区分开来;

对于一个样本,预测值为\hat{y},阈值\theta(一般情况下为0.5,即正负样本平衡时),大于阈值为正类,小于阈值为负类,若正负样本不平衡,该怎么办?

实际生产过程中,会根据很多东西来选择\theta,如就想把特别置信的选出来(关心广告正类预测的精度怎么样),将\theta设置的比较大(只有预测值大于0.9时,认为是正类,此时精度会高,但召回率会低)。

在调整\theta时,会做ROC曲线:

  • x轴,分母=有多少个负例的样本(没有点击的样本个数),分子=预测为正类,但实际是负类;
  • y轴,正类的召回。

ROC:每次取不同的\theta值,做正类和负类的判断 ==> 得到曲线,每个点表示不同的\theta,该曲线可以表示一种精度和召回之间的权衡。

AUC:曲线下面的面积(最大值为1,最小值为0);

上图右半部分解释如下:

  • AUC=1,完全可以区分正类和负类;
  • AUC=0.7,正负类部分耦合;
  • AUC=0.5,正负类完全耦合 ≈ 随机预测;
  • AUC=0,正负类预测相反。

优化收入和用户体验;

  • Latency: 延迟,响应速度;
  • ASN:平均每一页展现多少广告;
  • CTR:真实的用户点击率;
  • ACP:平均每次点击广告主给的钱。

模型上线并不能一次性满足所有指标,通常要有一定的权衡。

  • 模型最关注的指标AUC;
  • 一个新的模型,评估时AUC增加,但商业指标不一定增加;
  • 部署模型用真实的数据来评估模型。?

4.2? 过拟合和欠拟合

4.3? 模型验证

references

4.1 模型评估【斯坦福21秋季:实用机器学习中文版】_哔哩哔哩_bilibili

4.2 过拟合和欠拟合【斯坦福21秋季:实用机器学习中文版】_哔哩哔哩_bilibili

4.3 模型验证【斯坦福21秋季:实用机器学习中文版】_哔哩哔哩_bilibili

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-28 11:54:55  更:2022-01-28 11:55:43 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 15:56:01-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码