IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 2021-08-17《机器学习》读书笔记 -> 正文阅读

[人工智能]2021-08-17《机器学习》读书笔记

? ? ? ? 最近在跟着Datawhale自学周志华老师的《机器学习》,为了督促自我学习,将一些学习笔记记录于此。

? ? ? ? 以下内容均来源于周志华老师的《机器学习》

? ? ? 《机器学习》这本书被读者亲切的称为“西瓜书”,我想应该是因为以买西瓜为例来解释机器学习这门学科,通俗易懂。

第一章——绪论:

? ? ? ?买西瓜——好瓜的普遍特征:色泽(绿)、根蒂(蜷缩)、敲声(浊响)——根据经验判断一个未开的新瓜是否为好西瓜

? ? ? ?机器学习——收集数据、选取特征——根据数据训练产生模型,面对新的情况时可以进行正确判断。

用一个简单表格对比“买西瓜”与“机器学习”之间的关联

买西瓜

机器学习

”色泽“、”根蒂“、”敲声“

特征\属性

(绿)、(蜷缩)、(浊响)

属性值

一个西瓜

样本\示例

所有的西瓜

数据集

????? 从数据中学习构建模型的过程叫做“学习”或“训练”,在训练好的模型上进行预测的过程叫做“测试”,其中训练过程所使用的数据集叫训练集,测试过程所使用的数据集叫训练集。

不同学习任务类别:

有监督学习(样本有标记信息)

——“分类”:预测离散值,例如预测“好瓜”和“坏瓜”

——“回归”:预测连续值,例如预测西瓜成熟度(0.95/1,0.65/1等)

无监督学习(样本无标记信息)

——“聚类”:学习过程中将数据集分成了若干组(每组称为“簇”),每组中可能对应一些潜在的特征和概念,例如对所有西瓜进行训练,分成“浅色瓜/深色瓜”、“本地瓜/外地瓜”等

泛化能力:通过对训练集中已经见到的样本(西瓜)的学习以获得对没见过的样本(西瓜)进行判断的能力

第二章——模型评估与选择

这一章主要是一些概念了解

误差:模型预测输出与实际输出之间的差距

——训练误差:训练集上的误差

——泛化误差:新样本上的误差

当学习器把训练样本学的“太好”时,很可能把训练样本自身一些不普遍的特征当作所有样本的一般性质、普遍特征,这种现象称为过拟合。过拟合无法避免,只能尽量做到“缓解”。而当学习器把训练样本的一半性质都没学好时,发生欠拟合现象。

模型选择问题:泛化误差最小

泛化误差更小的模型是更优越的模型,这种模型在能在遇到新样本时才能做出正确预测和判断。

? ? ? ? 因此需要评估选择模型,需要一个“测试集”来测试模型对新样本的判别能力,以“测试误差”作为“泛化误差”的近似。

? ? ? ?测试集数据尽量与训练集数据互斥,不能使用“训练误差”作为“泛化误差”的近似,举个书上的例子,考试需要出十道题,但不能用老师上课讲过的十道练习题作为考试题,这样考察不到学生对题型的掌握。所以需要对数据集进行一定处理,分出训练集和测试集

处理方法:

留出法:数据集划分为两个互斥集合,分别作为训练集和数据集

交叉验证法:将数据集划分为k哥大小相似的互斥子集,每次都用k-1个子集的并集作为训练集,剩下的子集作为测试集,进行k次训练后求平均值

自助法:在总数据集种随机采样再放回m次,得到包含m个样本的数据集,将该数据集作为训练集,其余数据作为测试集

性能度量:不同模型的性能度量往往需要不同的评判标准

均方误差:模型预测结果与实际值之差的平方和与数量的比值

错误率和精度:

——错误率:分类错误样本数占样本总数的比例

——精度:分类正确样本数占样本总数的比例,精度=1-错误率

查准率、查全率和F1度量:

?

(图源《机器学习》周志华)

?

?

?

?

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-18 12:42:30  更:2021-08-18 12:43:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 19:38:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码