DataWhale组队学习-李宏毅深度学习Task01
1 机器学习方向的简单定义
写一段机器学习的程序,让机器变得很聪明,从而具有学习能力 让机器学习去识别语句对话,例如:Hi、How are you、Good bye。 学习识别语句对话后,给机器新的声音,例如:Hello的语音片段。它会回答你这是Hello 从人类提供的数据中,找出需要掌握的特定学习能力函数。
找出学习能力函数的过程(监督学习)
所有学习能力函数对应的输入输出集合,被称作Model,其中蕴含了很多不同的输入输出。
给予机器训练集,告诉机器好的输入输出对应关系(学习能力函数)应该长什么样儿。
机器就可以决定Model中函数的好坏
但光知道好坏还不够,机器需要能够通过算法挑出最好函数(最好的学习能力),即找到最优算法。
掌握最好的函数后,机器要能够举一反三,即通过测试集中没有见过的输入得到对应正确的输出。
上述过程可以用小例子的阐明:比如一个小孩子的成长过程中会遇到各色各样的人,这些各色各样的人都可能会影响小孩子,这些人的人生就是一个Model,蕴含很多不同的输入输出。机器训练集,好比是我们家长提前假设好的预测,告诉孩子,从Model中选出不同的人,一个人认真学习,努力工作,享受生活,那么他长大后会变得幸福快乐。另一个人荒废学业,潦草度日,那么他长大后会变得怨天尤人。家长会将前者的经历作为训练集中的一个例子来训练小孩子,后者的经历会被摒弃。从而让小孩子向着健康成长的旅途迈进,掌握前者的人生能力。家长还可能想办法找到最好的人生例子来教导孩子,也就好比机器需要通过算法找出最好的函数。小孩子掌握后,就能够在人生的旅途中通过观察不同的人来判断什么样的人应该被作为榜样追随,直到成为榜样。
2 学习模式
2.1 监督学习(Supervised Learning)
Regression(回归):它的输出是一个数值
Classification(分类):
Binary Classification(二元分类):它的输出是Yes or No
Multi-class Classification(多元分类):它的输出是正确类别
模型的选择:
线性模型 非线性模型(包含Deep Learning、SVM、decision tree、K-NN…) Image Recognition Playing GO
2.2 半监督学习(Semi-supervised Learning)
在label也就是output很难获取的前提下出现的学习模式
使得没有label的数据对学习也具有帮助
2.3 迁移学习(Transfer Learning)
在label也就是output很难获取的前提下出现的学习模式
探寻与需要辨识的数据不相关的数据与需要辨识数据之前的相关性
2.4 无监督学习(Unsupervised Learning)
在完全没有label的情况下机器的学习模式
机器的自主学习
例如:仅仅给机器一大堆文献或文章,不给文章中词句的词性、语义等信息,看看机器会发现些什么,会理解什么。
2.5 结构学习(Structured Learning)
它的输出是一个有结构性的信息
语音识别:输入声音信号,输出是一个完整的语句,语句具有结构性。
机器翻译:输入是中文语句,输出是英文语句。
人脸识别:输入是图片,输出是图片的人物名称
2.6 强化学习(Reinforcement Learning)
Supervised(有完整且正确的输入输出进行训练学习,即从一个手把手教它的老师学习)
Reinforcement(经历未知的过程,得到的只有对过程结果好与坏的评分,即从评价中进行学习)
2.7 总结
蓝色方块指的是学习情景,学习的情景大多是没办法自由控制的。根据你所具有的数据来决定。 红色方块指的是要解决的问题。 绿色方块指的是模型,同样的task可以用不同的模型来解决。
|