| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 西瓜书笔记:(1)第一章 --- 假设空间与版本空间等 -> 正文阅读 |
|
[人工智能]西瓜书笔记:(1)第一章 --- 假设空间与版本空间等 |
西瓜书笔记:(1)第一章文章目录简述开始一种新的学习方式,顺便帮助总结,方便之后的回顾,以及也起到一个监督自己打卡的作用。 1.2 基本术语数据集(data set):记录的数据集合 ,其中的每一条记录成为 示例(instance)或者样本(sample) 特征(feature)\ 属性(attribute):反映事件或对象在某方面的表现和性质的事项,例如“色泽”、“根蒂”、“敲声”称为属性(attribute),或者特征(feature)。 其取值为属性值(attribute value) 属性空间(attribute space)\样本空间(sample space): 属性构成的空间称为 属性空间(attribute space)、样本空间(sample space),或者输入空间。 特征向量(feature vector): 由于空间中的每一个点对应一个坐标向量,因此我们将一个示例称为一个 “特征向量(feature vector)” 分类与回归
聚类(clustering) 聚类一般属于无监督学习,即
根据训练数据是否拥有标记信息,学习任务大致分为两大类,监督学习(supervised learning) 和 无监督学习(unsupervised learning)。 泛化:指模型适用于新样本的能力。具有强泛华能力的模型能很好的适用于整个样本空间。 独立同分布:通常假设样本空间中全体样本服从一个未知“分布”(distribution)D,我们获得每个样本都是独立地从这个分布上采样获得的,即**“独立同分布 ( independent and identically distributed ,简称 i.i.d. )”** 独立同分布 independent and identically distributed – 知乎 一般来说训练样本越多,得到的关于D的信息越多,就越有可能通过学习获得强泛华能力的模型。 独立同分布 理解
1.3 假设空间归纳学习与概念学习 “现在常用的技术大多是产生“黑箱”模型。”
这里对于假设空间的描述,初看没看明白,导致我在后面的阅读中造成了困,但细想后发现我听过的李宏毅老师的课中对于假设空间有类似的描述。其实假设空间即:所有可能的模型的集合,其中正确的模型就在这个集合中,我们的学习过程实际上即在这个集合中进行收缩,找到最正确的集合,在这个过程中,我们借助某些算法,越来越靠近这个最正确的模型。 对书中的西瓜问题进行分析: 西瓜问题中,加入通配符“ * ” ,表示什么色泽,或者什么根蒂、敲声都可以,那么三个特征feature的输入分别有4、3、3种可能的取值,加上可能不存在根据色泽、根蒂、敲声判断好瓜这一假设,那么这个西瓜问题的假设空间大小规模为 4 x 3 x 3 + 1 = 37。 原文中,“即能够将训练集中的瓜判断正确的假设。” ,在机器学习中,即保证在训练集中的损失函数达到最小,但是在这个过程中,会存在出现过拟合的问题。放在原文中的西瓜的例子上,即对于我们见过的(训练集中的)西瓜我们都能预测正确它是好瓜还是坏瓜,但对于我们没见过的瓜,我们却大多或者总是得到错误的结论。
运用在第一小节中学到泛华的概念,过拟合后,模型适应新样本的能力极差。 版本空间所有满足训练集的假设的集合。 如何理解假设空间与版本空间有详细的介绍。但需要注意的是,2016年1月印刷批次的书,刊印错误,应该将清脆改成浊响。勘误修订记录 1.4 归纳偏好在训练集得到的版本空间中有若干假设,但对于一个新的不在训练集中的样本,版本空间中的若干假设可能得到不同的结果,即对于任意训练集外的一个新样本,我们希望借助训练集得到的模型总能得到一个正确的结果。 简单来说,我们希望找出在版本空间中泛化能力最高的。因此我们需要在版本空间中再选择一个最好的假设。 奥卡姆剃刀(Occam’s razor):若存在多个假设与观察一致,则选择最简单的那个。 NFL定理数据挖掘与机器学习关系机器学习领域期刊最重要的国际学术会议是国际机器学习会议(ICML)、国际神经信息处理系统会议(NIPS)和国际学习理论会议(COLT)
最重要的国际学术期刊 : Journal of Machine learning Research 和 Machine Learning。 人工智能重要会议IJCAI、AAAI以及重要期刊如 (Artifical Intelligence、Journal of Artificial Intelligence Research) 计算机视觉与模式识别重要会议: CVPR, 重要期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence. 神经网络重要期刊: Neural Computation 、 IEEE Transactions on Neural Networks and Learning Systems |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 8:44:32- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |