| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 2021-08-17《机器学习》读书笔记 -> 正文阅读 |
|
[人工智能]2021-08-17《机器学习》读书笔记 |
? ? ? ? 最近在跟着Datawhale自学周志华老师的《机器学习》,为了督促自我学习,将一些学习笔记记录于此。 ? ? ? ? 以下内容均来源于周志华老师的《机器学习》 ? ? ? 《机器学习》这本书被读者亲切的称为“西瓜书”,我想应该是因为以买西瓜为例来解释机器学习这门学科,通俗易懂。 第一章——绪论: ? ? ? ?买西瓜——好瓜的普遍特征:色泽(绿)、根蒂(蜷缩)、敲声(浊响)——根据经验判断一个未开的新瓜是否为好西瓜 ? ? ? ?机器学习——收集数据、选取特征——根据数据训练产生模型,面对新的情况时可以进行正确判断。 用一个简单表格对比“买西瓜”与“机器学习”之间的关联
????? 从数据中学习构建模型的过程叫做“学习”或“训练”,在训练好的模型上进行预测的过程叫做“测试”,其中训练过程所使用的数据集叫训练集,测试过程所使用的数据集叫训练集。 不同学习任务类别: 有监督学习(样本有标记信息) ——“分类”:预测离散值,例如预测“好瓜”和“坏瓜” ——“回归”:预测连续值,例如预测西瓜成熟度(0.95/1,0.65/1等) 无监督学习(样本无标记信息) ——“聚类”:学习过程中将数据集分成了若干组(每组称为“簇”),每组中可能对应一些潜在的特征和概念,例如对所有西瓜进行训练,分成“浅色瓜/深色瓜”、“本地瓜/外地瓜”等 泛化能力:通过对训练集中已经见到的样本(西瓜)的学习以获得对没见过的样本(西瓜)进行判断的能力 第二章——模型评估与选择 这一章主要是一些概念了解 误差:模型预测输出与实际输出之间的差距 ——训练误差:训练集上的误差 ——泛化误差:新样本上的误差 当学习器把训练样本学的“太好”时,很可能把训练样本自身一些不普遍的特征当作所有样本的一般性质、普遍特征,这种现象称为过拟合。过拟合无法避免,只能尽量做到“缓解”。而当学习器把训练样本的一半性质都没学好时,发生欠拟合现象。 模型选择问题:泛化误差最小 泛化误差更小的模型是更优越的模型,这种模型在能在遇到新样本时才能做出正确预测和判断。 ? ? ? ? 因此需要评估选择模型,需要一个“测试集”来测试模型对新样本的判别能力,以“测试误差”作为“泛化误差”的近似。 ? ? ? ?测试集数据尽量与训练集数据互斥,不能使用“训练误差”作为“泛化误差”的近似,举个书上的例子,考试需要出十道题,但不能用老师上课讲过的十道练习题作为考试题,这样考察不到学生对题型的掌握。所以需要对数据集进行一定处理,分出训练集和测试集 处理方法: 留出法:数据集划分为两个互斥集合,分别作为训练集和数据集 交叉验证法:将数据集划分为k哥大小相似的互斥子集,每次都用k-1个子集的并集作为训练集,剩下的子集作为测试集,进行k次训练后求平均值 自助法:在总数据集种随机采样再放回m次,得到包含m个样本的数据集,将该数据集作为训练集,其余数据作为测试集 性能度量:不同模型的性能度量往往需要不同的评判标准 均方误差:模型预测结果与实际值之差的平方和与数量的比值 错误率和精度: ——错误率:分类错误样本数占样本总数的比例 ——精度:分类正确样本数占样本总数的比例,精度=1-错误率 查准率、查全率和F1度量: ? (图源《机器学习》周志华) ? ? ? ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/1 12:32:30- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |