机器学习介绍
1、引入
左边是training,是学习的过程;右边是testing,学好可以拿它做应用。在整个machine learning framework整个过程分成了三个步骤。
- 1、找一个function:确定function集合
- 2、让machine可以衡量一个function是好还是不好:评价标准
- 3、让machine有一个自动的方法可以挑出最好的function:找到最好的function
2、机器学习的相关技术
监督学习
Regression是一种machine learning的task。
Regression和Classification的差别就是我们要机器输出的东西的类型不同: Regression:数值 Classification:类别
- 假设Classification问题分成两种,一种叫做二分类输出的是是或否(Yes or No);eg.邮件是否为垃圾邮件
- 另一类叫做多分类(Multi-class),在Multi-class中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从数个类别里选择正确的类别。eg.文章分类
半监督学习
监督学习(supervised learning)
- 需要大量的training data :告诉我们要找的function的input和output之间的关系
- 需要告诉机器function的input和output是什么 :需要人工标注output(label)
Q:如何减少label需要的量? A:半监督学习
迁移学习
迁移学习:减少data用量
- data中只有少量有label,还有大量的data是不相干的,其能够带来的帮助是迁移学习要讲的问题。
无监督学习
给机器只有非常大量的data,只有function的input,没有output。机器如何生成新的图片,是后面要解决的问题。
监督学习中的结构化学习
structured learning 中让机器输出的是有结构性。 eg.:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。
3、强化学习
强化学习VS监督学习
- 监督学习:告诉机器正确答案是什么
- 强化学习(reinforcement learning):没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。(更intelligence)
eg. Alpha Go:用监督学习加上reinforcement learning去学习
- 先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。
4、为什么要学习机器学习
因为AI终将会颠覆未来,而我们要将其掌控,把未来变成我们所想。
|