Task01: 参照开源文档,观看视频 P1-2:机器学习介绍(1天)。 视频地址:https://www.bilibili.com/video/av59538266 01-机器学习介绍 02-为什么要学习机器学习
一、概述
人工智能;我们要达成的目标 机器学习:达成目标的手段 深度学习:机器学习的一种方法 人工智能的思想线索: 生物本能——让机器具有本能——人设定规则——if规则(许多if规则)——缺点:无法超越人类智慧 AI的目的是让机器有自己学习的能力,这就是机器学习的方向。 Maching Learning的方向:写段程序,让机器具有学习的能力。 机器学习需要做的事情:根据我们提供给它的资料,机器寻找我们需要的function。
二、寻找function的过程
首先准备一个function set(叫做model),接下来利用训练资料,告诉机器好的function是什么样的。但是一个一个训练function太慢,需要一个好的算法,从function set里跳出最好的function,记为f*。然后我们希望再给机器输入一个没有训练过的资料时,机器也能正确识别。
关于机器学习有如下的步骤: 第一步:找一个function。 第二步:让机器衡量一个function好还是不好。 第三步:有一个好的算法让机器有办法挑出最好的function。
三、机器学习相关技术
1 监督学习
Regression(回归):是机器学习的一种任务,例如:输入的是过去的PM2.5,输出的是预测的未来的PM2.5。 Classification(分类):与Regression的区别是,回归问题输出的是一个数值,分类问题输出的是类别。又分为二分类和多分类问题。如判断邮件是否为垃圾邮件是二分类问题,判断新闻类别是教育,政治还是财经类新闻属于多分类问题。 求解任务的方法: 选择不同的function set,也就是选择不同的model。Linear Model最简单,Deep Learning很复杂,但是也可以做很复杂的事情,如训练机器下围棋。 除了深度学习以外,还有很多model也是非线性模型,如SVM。 以上监督学习的任务需要大量的training data,需要告诉机器input和output,其中output需要手工标注出来,即label。要减少标注label的数量,可以采用半监督学习。
2 半监督学习
你有少量的猫和狗的labelled data,但是同时你又有大量的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中,这些没有label的data,他可能也是对学习有帮助。后面会讲到。
3 迁移学习
假设我们要做猫和狗的分类问题,只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是这些data跟我们现在要考虑的问题是没有什么特别的关系的。这些不相关的data对于分类有什么帮助,这是迁移学习要讲的问题。
4 无监督学习
无监督学习就是让机器无师自通。 这个Task是一个无监督学习的问题,这个function的输入不知道是什么,可能是某一个code代表要输出图片的特性,输出是一张图片。你给机器看到的只有非常大量的图片,只有function的input,没有output。机器要咋样生成新的图片,这是我们后面要解决的问题。
5 监督学习中的结构化学习
structured learning 中让机器输出的是要有结构性的,举例来说:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。 machine learning只有regression和classification两类问题,就好像告诉你:我们所熟知的世界只有五大洲,但是这只是真实世界的一小部分,真正的世界是如图所示。真正世界还应该包括structure learning,这里面还有很多问题是没有探究的。
6 强化学习
在reinforcement learning里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。机器根据每轮的分数来判断自己的行为是好还是不好,然后调整自己的行为,直至到达最好的效果。reinforcement learning也是比较我们人类真正的学习的情景,如果机器可以做到reinforcement learning,那确实是比较intelligence。 若我们用Alpha Go当做例子时,supervised learning就是告诉机器:看到这个盘式你就下“5-5”,看到这个盘式你就下“3-3”。 Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后再做reinforcement learning。
参考链接 李宏毅机器学习笔记
|