1 机器学习介绍
1.1 基本概念
1.1.1 人工智能,机器学习和深度学习
ppt里头的这张图概括了三者的包含关系。
人工智慧是我们想要达成的目标,而机器学习是想要达成目标的手段,希望机器通过学习方式,他跟人一样聪明。而深度学习和机器学习有什么关系呢?深度学习就是机器学习的其中一种方法。
1.1.2 机器学习的本质
机器学习的本质是,寻找一个function,这个function可以使得在面对新的没有见过的数据时,依然可以解决问题。
Machine Learning = Looking for a function
机器学习的过程,就有点像是找一个最好的function的过程 而机器学习的实现,可以概括如下图 即分为training学习,testing测试,而traing这个过程则是分为寻找一个function,确定function的评价指标,还有让machine自动挑出好的function。 下面这个比喻很形象:
机器学习其实只有三个步骤,这三个步骤简化了整个process。可以类比为:把大象放进冰箱。我们把大象塞进冰箱,其实也是三个步骤:把门打开;象塞进去;后把门关起来,然后就结束了。所以说,机器学习三个步骤,就好像是说把大象放进冰箱,也只需要三个步骤。
1.2 机器学习的大框架
如下图,李宏毅对这些任务分别进行了讲解:
-
监督学习:一般分为regression回归和classification分类 需要大量数据,及他们的标签。 所谓的深度学习,其实是一种解决此类问题的模型。 -
半监督学习:部分数据无标签 -
迁移学习:本任务只有很少的数据有标签,试图利用别的有标签的任务 -
无监督学习:完全没有标签 -
结构化学习:(监督学习的一种)指的是,学习有结构的数据,这是一个很重要的发展方向。比如自然语言处理等,这个要求输出的数据是有结构的,这与一般的回归/分类不同 -
强化学习:外加一个评判,让机器自己学(对手一般是另一个机器)
2 课程实践资料整理
小组讨论后,决定结合一部分实践内容进行学习,于是我把涉及到的可以用于实践的资料结合课程进度整理如下:
-
Task02:回归
- 使用numpy实现一个回归问题(跟着教程自己实现一遍)
- 【如果需要】熟悉numpy的使用(来源于吴恩达深度学习练习)
-
Task03:误差和梯度下降
- 完成PM2.5预测(教程P9)
- 使用numpy实现一个简单神经网络logistic回归模型(来源于吴恩达深度学习作业)
-
Task04:深度学习介绍和反向传播机制
- 使用numpy一步步实现神经网络模型(来源于吴恩达深度学习作业)
- 在kaggle平台上提交李宏毅机器学习2021的作业task1:回归
-
Task05:网络设计的技巧
- 完成李宏毅机器学习2021的作业task2:分类,kaggle链接
-
Task06:卷积神经网络
- 完成李宏毅机器学习2021的作业task3:图像分类,数据集
参考阅读
- 李宏毅机器学习笔记(LeeML-Notes)
- 李宏毅机器学习课程视频
- 李宏毅机器学习2021
- 李宏毅机器学习2021作业整理
|