# Time: 2021.08.23
# 内容:P1~P2
P1: 机器学习介绍
1.1 人工智能、机器学习、深度学习关系

① 什么是人工智能?
>>人工智能像个函数,我们输入一些东西,它能输出它的判断。

- 输入一段语音,他知道你说的是how are you;
- 输入图片,它知道是个猫;
- 输入棋路,它会下 下一步;
- 输入hi 它会回答 hello;
② 三者的关系
人工智能是目标,机器学习是实现的一个方法;深度学习是机器学习中,
f
f
f 比较复杂的那部分方法;
1.2 实现途径
>>人工智能就是要让机器具有一个能力,我们给它资料,它来找到**最佳的
f
?
f^*
f?,也叫最佳的模型。从而实现上面的功能。
【方法】 
- 第一个步骤:我们有很多方法
f
f
f 都可以实现,这个集合叫function set,也叫模型
- 第二个步骤:我们给它一些训练资料,机器可以根据训练资料判断一个function是好的,还是不好的
- 第三个步骤:机器自动,通过好的算法,挑出test可能最好的function

-
f
1
f_1
f1?好于
f
2
f_2
f2?
- 可能function set里这两张照片非常多的结果都同f1一样,但别的猫照片是但
f
1
f_1
f1?可能识别不出来了。换句话说就是f1不一定是最好的
f
?
f^*
f?的
1.3 实现方法
# 这部分理解的还不是很透彻,后期会补充和修改
>> 监督(supervised)=标签(label),是否有监督,就是输入数据(input)是否有标签,监督学习有标签的学习, 无监督学习没标签则的学习 。半监督学习,就是一半(一点点)数据有标签,一半(极其巨大)数据没标签。
① 监督学习(supervised learning)
>>训练数据是有标签的,训练目标是能够给测试数据正确标签的。
-
回归(Regression) > label是数值

-
分类(Classification) > label是分类 :二分类和多分类
二分类:是不是垃圾邮件  多分类: 文章分类系统 
② 无监督学习(Unsupervised learning)
>> 无监督学习常常被用于数据挖掘,用于在大量无标签数据中发现些什么。它的训练数据是无标签的,训练目标是能对观察值进行分类或者区分等。
非监督性学习是只给特征,没有给标签,就是高考前的一些模拟试卷,是没有标准答案的,也就是没有参照是对还是错,但是我们还是可以根据这些问题之间的联系将语文、数学、英语分开。
经典的算法:k-聚类、主成分分析等;
③ 半监督学习
>> 少量有label,大多数无labled的训练模型,两者相结合的一种学习方法;
④ 迁移学习
>> 假设我们要做猫和狗的分类问题,只有少量的有label的data,大量没有label照片,其中很多别的动物照片,那么这些动物对分类有什么帮助,这种
f
f
f学习过程叫迁移学习。

⑤ 强化学习(reinforcement learning)
我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。通过不断的训练 它自己不断的调整。

机器跟对手互下,机器会不断的下棋,最后赢了,机器就会知道下的不错,但是究竟是哪里可以使它赢,它其实是不知道的。不断地下棋,有时候会输会调整f,是的f胜率越来越高。
我们知道Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。
1.4 总结

P2: 我们为什么需要学习机器学习
>> 为机器挑选合适的model和loss function。不同的model和loss function适合解决不同的问题。
|