机器学习简介
关于监督学习、半监督学习、无监督学习、迁移学习、强化学习的简单介绍。
机器学习分类
根据函数类型的不同,机器学习可以分很多种方式,最简单的两种机器学习是regression(回归)和classification(分类),它们成为监督学习。 regression是指模型的输出为数值,一般应用于预测。例如:输入和PM2.5相关的feature,该模型就能预测明天的PM2.5。 classification是做选择题,给定一些类别,模型根据输入可以输出对应的类别。例如:分类模型能甄别邮件是否为垃圾邮件。 监督学习的问题是我们需要大量的训练数据集。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做label。 半监督学习使用的数据,一部分有特征和标签,而另一部分只有特征,综合两类数据来生成合适的函数。 迁移学习 无监督学习 强化学习是使用未标记的数据,但是可以通过一些方法知道离正确答案越来越近还是越来越远
机器学习的步骤
第一步:根据domain知识,猜测一个能完成任务的未知函数。 第二步:根据训练资料,定义损失函数,用来衡量函数解和真实情况的差距。 第三步:通过不断优化,找到能使损失最小的参数,也就是使函数解尽可能接近真实情况。 这三步都属于训练过程。最后训练出来的参数能使模型预测最准,将这个模型用于预测没有看过的资料的过程叫做测试,一般testing 的 loss 会比 training 的 loss 高。
参考链接: https://www.bilibili.com/video/BV1Ht411g7Ef.
|