| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 笔记记录1_监督学习_机器学习 -> 正文阅读 |
|
[人工智能]笔记记录1_监督学习_机器学习 |
前言人工智能在近些年来飞速发展,而大学生数学建模比赛也有不少用到机器学习算法的实例。本文通过查阅维基百科、一些书籍、CSDN文章,结合清风“利用matlab快速实现机器学习”的直播课程,写下机器学习小白的笔记记录1。 一、机器学习的基本概念1.1 机器学习是干什么的
维基百科·机器学习
?周志华.机器学习,北京 清华大学出版社 ?机器学习思路及买西瓜分类问题栗子: 1.2 机器学习的划分以下mindmap是我阅读完一文读懂机器学习入门概述【参考了全网最火的文章】的理解: ?1.2.1 监督学习监督学习给定一组带有标记的数据集。计算机可以使用特定的模式来识别每种标记类型的新样本。监督学习的两种主要类型是分类和回归。 翻译:我们在获取输入变量、输出变量(即特征、标签)的数据集之中,寻找二者关系。 而监督学习通过判断变量Y是连续或离散类型,区别出分类问题以及回归问题: (1) 当输出变量Y 取有限个离散值时,称为分类问题。 ?1.2.2 无监督学习在无监督学习中,数据是无标签的。由于大多数真实世界的数据都没有标签,所以这些算法可能更加实用。无监督学习分为聚类和降维。? 聚类的例子:银行收集了客户的许多个人信息,根据这些个人信息可以将客户划分到不同的用户群体(例如:贵宾客户、重点客户、普通客户、可能流失的客户等),银行可以为不同的用户群体制定出相应的个性化营销方案。 1.2.3 强化学习强化学习是指一类在与环境交互中不断学习的问题以及解决这类问题的方法。相比监督学习,它不需要给出“成功”策略作为监督信息,给出滞后回报,调整策略从而取得最大化期望即可。 举个栗子: 一台下棋的电脑可以学会不把它的国王移到对手的棋子可以进入的空间。然后,国际象棋的这一基本教训就可以被扩展和推断出来,直到机器能够打败人类顶级玩家为止。 1.3 模型评估指标1.3.1 回归问题的评估指标 ?1.3.2 分类问题-评估指标 我们借用混淆矩阵(Confusion Matrix)可视化分类结果,以下为西瓜实例: ?通过混淆矩阵,我们计算衡量分类结果好坏的指标就方便很多了。 机器学习中,我们通常将更关注的事件定义为正类事件。(生活中我们通常会更关注那些结果不好的情况的出现)。当然,这个定义依据只是参考借鉴,不是唯一的。 上述西瓜分类例子中,坏瓜为正类(记为1),好瓜负类(记为0)。 ?其中TP、FN、FP、TN为混淆矩阵数值所定义的四个指标: ?借上述指标定义了如下评估指标: ?以下为ROC曲线&AUC用法: 1.4 模型的泛化能力及其评估方法模型的泛化能力(generalization ability)是指由该模型对未知数据的预测能力。 【1】留出法 ?我们不能提前得到未来瓜组的数据,只能选择从已有数据着手。假设100个西瓜,80个瓜用来建立分类模型,称其为训练集(train set);剩下20个瓜用来检验模型的好坏(其实就是我们拿这20个瓜等价新瓜组),称其为测试集(test set)。我们将上述泛化能力的评估称为留出法(Hold-Out)。 注意: 1)一般情况下,划分比例为:7:3,8:2; 2)尽量做到 训练集和测试集的划分随机且数据分布均匀。 ?【2】交叉验证 在留出法中,用于评价模型泛化能力的测试集只是所有样本的一部分,而且这个结果不是很稳定,对模型的泛化能力的评价依赖于哪些样本点落入训练集,哪些样本点在测试集。 1.5 选择最优模型 对于同一个问题,我们可以建立不同的模型去解决。例如前面介绍的西瓜分类问题中,我们可以使用决策树、K最近邻(KNN)、支持向量机(SVM)等常用的机器学习模型。 我们通过衡量泛化能力,参数调节(parameter tuning)选取最好的参数确定最终需要的模型。 1.6 欠拟合&过拟合 过拟合(overfitting)指的是模型在训练集上表现的很好,但是在测试集上表现的并不理想,也就是说模型对未知样本的预测表现一般,泛化能力较差。
总结第一次笔记整理如上,遗憾之处包括参考资料有限、学习视频观看不足等。以后定会裨补阙漏,优化文章知识体系、拓宽自己的理解。 注:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 12:45:29- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |