task01-器学习的介绍
目标:人工智慧 手段:机器学习,深度学习即为机器学习的一种方法。 1、什么是机器学习? 答:机器有学习的能力。例如小孩学习一样,看到一张图片之后就有辨识的能力。 务实一点讲机器学习所做的事情即想寻找一个Function,要让机器具有一个能力,这种能力是根据提供给它的资料,让它去寻找我们要寻找的function。 2.机器学学习的框架: 1)就是找一个function; 2)让machine可以衡量一个function是好还是不好; 3)让machine有一个自动的方法,有一个好演算法可以挑出最好的function。  3.机器学习的相关的技术 1)让Machine去了解任务(task): task可分为:Regression和Classification,及结构化学习。前两者的差别就是我们要机器输出的东西的类型是不一样的。 Regression:机器输出的是一个数值。 Classification:机器输出的是类别。 结构化学习:让机器输出的是要有结构性的。 
<1>监督学习步骤:
- 选择function set,即选不同的model;
- 搜集训练数据,告诉机器这个function输入输出及关系是什么?
 <2>半监督学习:减少label的量; <3>迁移学习:减少data的量;  <4>无监督学习:在完全没有任何label的情况下,机器可以学到什么样的事情。  <5>强化学习:我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。  同样的颜色不同的方块是同一个类型的,这边的蓝色的方块,指的是学习的情景,通常学习的情景是你没有办法控制的。比如,因为我们没有data做监督学习,所以我们才做reinforcement learning。现在因为Alpha Go比较火,所以Alpha Go中用到的reinforcement learning会被认为比较潮。所以说有学生去面试,说明自己是做监督学习的,就会被质疑为什么不做reinforcement learning。那这个时候你就应该和他说,如果我今天可以监督学习,其实就不应该做reinforcement learning。reinforcement learning就是我们没有办法做监督学习的时候,我们才做reinforcement learning。红色的是指你的task,你要解的问题,你要解的这个问题随着你用的方程的不同,有regression、有classification、有structured。所以在不同的情境下,都有可能要解这个task。最后,在这些不同task里面有不同的model,用绿色的方块表示。
|