task 1 机器学习介绍
机器学习感性认识
-
machine learning所做的事情,就是在寻找一个function,要让机器具有一个能力,这种能力是根据你提供给它的资料,它去寻找出我们要寻找的function. -
找function
-
准备function set,其中有成千上万的function。这个function set就叫model -
机器接下来要做的事为:它 有一些训练的资料,这些训练资料告诉机器说一个好的function,它的输入输出应该长什么样子,有什么样关系。 -
我们需要有一个好的演算法,从function set里面挑出一个最好的的function,这个最好的function将它记为f? [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QnEIqZNf-1641829678364)(C:\Users\20986\AppData\Roaming\Typora\typora-user-images\image-20220110232113847.png)] -
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5wvy0kt3-1641829678365)(C:\Users\20986\AppData\Roaming\Typora\typora-user-images\image-20220110232235682.png)] 左边部分为training,就是学习的过程。右边这个部分为testing,学好以后你就可以拿它做应用 -
机器学习步骤
- 第一个步骤就是找一个function
- 第二个步骤让machine可以衡量一个function是好还是不好
- 第三个步骤是让machine有一个自动的方法,有一个好演算法可以挑出最好的function。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SLuZ4ViC-1641829678366)(C:\Users\20986\AppData\Roaming\Typora\typora-user-images\image-20220110232517235.png)]
机器学习的相关技术
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-au9NLT8J-1641829678366)(C:\Users\20986\AppData\Roaming\Typora\typora-user-images\image-20220110232604871.png)]
-
监督学习
- Regression:我们要做regression时的意思是,machine找到的function,它的输出是一个scalar,这个叫做regression
- Classification:在Classification里面机器输出的是类别。假设Classification问题分成两种,一种叫做二分类输出的是是或否(Yes or No);另一类叫做多分类(Multi-class)
-
半监督学习
-
监督学习需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做label。 那有没有办法减少label需要的量呢?就是半监督学习。 假设你先想让机器鉴别猫狗的不同。你想做一个分类器让它告诉你,图片上是猫还是狗。你有少量的猫和狗的labelled data,但是同时你又有大量的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中,这些没有label的data,他可能也是对学习有帮助。 -
迁移学习
- 另外一个减少data用量的方向是迁移学习。假设我们要做猫和狗的分类问题,我们也一样,只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的,我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片还是动画图片(凉宫春日,御坂美琴)你有这一大堆不相干的图片,它到底可以带来什么帮助。这个就是迁移学习要讲的问题。
-
无监督学习
- 如果在完全没有任何label的情况下,到底机器可以学到什么样的事情
-
监督学习中的结构化学习
- structured learning 中让机器输出的是要有结构性的,举例来说:在语音辨识里面,机器输入是声音讯号,输出是一个句子。
-
强化学习
-
我们若将强化学习和监督学习进行比较时,在监督学习中我们会告诉机器正确答案是什么。若现在我们要用监督学习的方法来训练一个聊天机器人,你的训练方式会是:你就告诉机器,现在使用者说了hello,你就说hi,现在使用者说了byebye ,你就说good bye。所以机器有一个人当他家教在他旁边手把手的教他每件事情,这就是监督学习。 reinforcement learning是什么呢?在reinforcement learning里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话,他训练的方法会是这样:你就把机器发到线下,让他的和面进来的客人对话,然后想了半天以后呢,最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。
还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。
|