IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 机器学习西瓜书第二章概要(1) -> 正文阅读

[人工智能]机器学习西瓜书第二章概要(1)

模型评估与选择

经验误差与过拟合

Error rate (错误率) E=a/m
如果m个样本有a个样本分类错误
Accuracy rate (精度) 精度=1-错误率
学习器在训练集上的误差称为“训练误差”或“经验错误”,新样本上的误差称为“泛化误差”

过拟合:训练器把训练样本学得“太好了”的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有一般性质,这样就会导致泛化性能下降。这种现象称之为过拟合。

欠拟合:指对训练样本的一般性质尚未学好,即高密度特征学习的不够。
拟合状态
学习能力是否“过于强大”,是由学习算法与数据内涵共同决定。
欠拟合解决方法:
(1)决策树学习中扩展分支
(2)学习神经网络中可以增加训练轮


过拟合解决方法:
(1)有效的学习算法在多项式时间内运行完成,若可以彻底避免过拟合,则通过经验误差最小化就能获最优解。
(2)采用更多的有效特征也可!

评估方法

1.留出法

留出法 (hold-out)直接将数据集D划为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即D=S∪T,S∩T=Φ,在S上训练出模型后,用T来评估测试误差,作为泛化误差的估计。

2.交叉验证法

先将数据集D划分为k个大小相似的互斥子集,即D=D1∪D2∪D3…∪Dn,每个子集Di都尽可能保持数据分布的一致性。即从D中通过分层取样得到,然后用k-1个子集作为训练集,余下的作为测试集。从而可以进行k次训练和测试,最终返回k个测试结果的均值,故交叉验证法的评估结果的稳定性和保真性极大程度依赖于k的取值。

在这里插入图片描述
如下顺序划分:
在这里插入图片描述
测试结果为各测试集加和求平均返回结果。
讲一下一个特殊的交叉验证法:留一法(Leave-One-Out LOO)
数据集有m个样本,划分为k个子集,k=m,留一法使用的训练集必初始训练集少一个样本,因此,留一法在绝大多数情况下评估结果相对准确,但是模型数量一旦很大时(模型未考虑调参),评估结果则未必时最准确的(NFL定理)

自助法

直接以自主采样法(bootstrap sampling)为基础。
给定包含m个样本的数据集D,我们对他进行采样并返回D1;
每次从D中挑选一个样本,将其放入D1,然后将该样本返回初始数据集D中,是的样本下次采样时仍然可能被采到,重复m次
求极限为在这里插入图片描述
自助法适合小样本训练,而且由于要将初始数据集分割为多个小数据集,这对集成学习有很大帮助。

调参

所谓调参,就是参数调节,一种改进模型得基本操作
调参过程应该考虑以下几个步骤:
1、参数工程量的复杂度
2、改进训练步长step
3、计算开销,折中逼近目标参数

性能度量

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-19 01:09:21  更:2022-02-19 01:11:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 18:27:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码