IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 周志华《机器学习》啃书日记(一) -> 正文阅读

[人工智能]周志华《机器学习》啃书日记(一)

定义

利用经验改善系统性能

机器学习的流程:
未知目标函数-->训练样本-->模型方案-->最终学习到的方法

假设空间即模型的候选集合

基本术语

数据集

为进行机器学习收集的数据记录的集合称为一个“数据集”,其中每一条记录是关于一个事件或对象的描述,称为一个“示例”或“样本”。

属性

为反映事件或对象在某方面的表现或性质的事项称为“属性”。
属性的取值则为“属性值”。
属性张成的空间称为“属性空间”、“样本空间”或“输入空间”。因为多个属性张成可形成一个用于描述对象的多维空间,因此可以把空间中的一个示例称为一个“特征向量”。
属性的个数即样本的“维数”。

训练数据

从数据中学得模型的过程称为“学习”或“训练”。训练过程中使用的数据称为“训练数据”,其中的每一个样本称为一个“训练样本”,训练样本组成的集合称为“训练集”。

标记(label)

对于训练样本进行标记的信息。
如:“((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜)”,其中“好瓜”或“坏瓜”就是标记。
拥有标记信息的示例,则称为“样例”。
所有标记的集合称为“标记空间”或“输出空间”。

分类

假如我们预测的是离散值,如区分“好瓜”“坏瓜”,则此类学习任务称为“分类”。
只涉及两个类别的为“二分类”任务,通常其中一个类为“正类”,另一个类为“反类”;涉及多个类别时,则称为“多分类”任务。

回归

若我们要预测的是连续值,例如西瓜成熟度0.95、0.37,则此类学习任务称为“回归”。

测试

学得模型后,使用其进行预测的过程称为“测试”,被预测的样本称为“预测样本”。

学习任务两大类

监督学习

分类和回归

无监督学习

聚类
将训练集中的对象分为若干组,每组称为一个“簇”;这些自动形成的簇可能对应一些潜在的概念划分。有助于我们了解数据内在的规律,为更深入地分析数据建立基础。

泛化能力

机器学习的目标是使学得的模型能很好的适用于“新样本”,而不仅仅是在训练样本上工作得很好;即便对聚类这样的无监督学习任务,我们也希望学得簇划分能适用于没在训练集中出现的样本。学得模型适用于新样本的能力,称为“泛化”能力。
具有强泛化能力的模型能很好的适用于整个样本空间。

假设空间

我们可以把学习过程看作一个在所有假设组成的空间中进行搜索的过程,搜索目标是找到与训练集“匹配”的假设,即能够将训练集中的对象判断正确的假设。假设的表示一旦确定,假设空间及其规模大小就确定了。

在这里插入图片描述
现实问题中我们常面临很大的假设空间,但学习过程是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致,即存在一个与训练集一致的“假设集合”,我们称之为“版本空间”。
在这里插入图片描述

归纳偏好

在一个训练样本无法断定多个假设中哪一个更好,而对于一个具体的学习算法而言,必须要产生一个模型。此时学习算法本身的“偏好”就会起到关键作用。
机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好”,简称“偏好”。
任何一个有效的机器学习算法必有其归纳偏好,否则它将被假设空间中看似在训练集上“等效”的假设所迷惑,而无法产生确定的学习结果。
在这里插入图片描述
归纳学习可看作学习算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或“价值观”。

习题

在这里插入图片描述

答案

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-27 14:05:27  更:2021-09-27 14:06:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/1 6:39:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码