李宏毅机器学习(深度学习)记录--introduction
本片文中用的图片大部分来自李宏毅老师的课件
1.什么是机器学习
机器学习就是要找到一个function来解决我们的问题,相当于我们将我们的输入,例如语音,图片等通过这个function来得到我们想要的输出。机器学习就是通过训练得到function后能让机器得到我们想要的输出。
而当我们说到深度学习(deep learning)的时候,我们要找的function是一个类神经网络(Neural Network),相当于以这个类神经网络来得到输出。 function的种类有很多种,首先我们的输入可以是向量、图片、序列(文本和语音)等等。然后通过输出我们可以将function分为regression、classification和其他。 regression是输出的结果是一个数值scalar,而classification就如其名,是一个分类的结果。其他的一些类型就如最后的输出是图片、文本等。
2.教机器进行学习的方法
1.supervised learning:我们在进行训练的时候,将要训练的数据的labels进行标注,表明我们是在知道这个数据最终得到的结果的条件下进行训练,这种方法叫做supervised learning。但如果我们要将每一个数据都进行标记,这明显是一个非常耗费时间的东西。
2.Self-supervised learning:这种方法与上面的方法相区别,初始没有给出labels,即没有标记。这表明机器需要自己在训练中按照不同的特征,然后对这些没有labels的数据给出他们的label
3.Generative Adversarial Network:我们收集到大量的输入数据与输出数据,而没有给出他们的成对关系,机器自动将他们的关系找出来。例如在语音辨识的时候收集大量的语音和文本信息,机器进行学习后能够进行语音识别将语音转成文字
4.Reinforcement Learning (RL):我们人类也无法对一些数据进行标注,但我们可以知道一个结果的好坏的时候,使用RL,譬如下围棋,当看到一局对局的时候,我们也无法知道下在哪一步最好,但我们是知道最终结果的好坏的,这时候使用RL。
另外还有一些其他进阶的课题: 1.Anomaly Detection:这是要机器不仅有进行分类的能力,还要有说出“无法分类”这句话的能力,例如识别宝可梦和数码宝贝的例子中,机器能将一个图片识别为宝可梦或者数码宝贝,同时机器也能对一个无法判别的图片说出“我不知道”。
2.Explainable AI(后面需要重点看的内容):不仅要用机器学习学习到结果,还需要对其进行解释,解释为什么做出这样的选择。这样能减轻机器学习中一些很愚蠢的错误
3.Model Attack:对模型加入noise之后可能会使模型得出意想不到的结果
4.Domain Adaptation:解决训练数据和测试数据有些许不同而导致的模型准确率大幅度下降的问题
5.Network Compression:运算资源有限时如何进行训练
6.Life-long Learning:进行不断地学习
7.Meta Learning:根据机器自己之前学习的经验来进一步学习,学习自己。
|