开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 李宏毅《机器学习》任务一 -> 正文阅读

[人工智能]李宏毅《机器学习》任务一

Task01：
参照开源文档，观看视频 P1-2：机器学习介绍（1天）。
视频地址：https://www.bilibili.com/video/av59538266
01-机器学习介绍
02-为什么要学习机器学习

一、概述

人工智能；我们要达成的目标
机器学习：达成目标的手段
深度学习：机器学习的一种方法
人工智能的思想线索：
生物本能——让机器具有本能——人设定规则——if规则(许多if规则）——缺点：无法超越人类智慧
AI的目的是让机器有自己学习的能力，这就是机器学习的方向。
Maching Learning的方向：写段程序，让机器具有学习的能力。
机器学习需要做的事情：根据我们提供给它的资料，机器寻找我们需要的function。
在这里插入图片描述

二、寻找function的过程

   首先准备一个function set（叫做model），接下来利用训练资料，告诉机器好的function是什么样的。但是一个一个训练function太慢，需要一个好的算法，从function set里跳出最好的function，记为f*。然后我们希望再给机器输入一个没有训练过的资料时，机器也能正确识别。

关于机器学习有如下的步骤：
在这里插入图片描述

第一步：找一个function。
第二步：让机器衡量一个function好还是不好。
第三步：有一个好的算法让机器有办法挑出最好的function。

三、机器学习相关技术

在这里插入图片描述

1 监督学习

Regression（回归）：是机器学习的一种任务，例如：输入的是过去的PM2.5，输出的是预测的未来的PM2.5。
Classification（分类）：与Regression的区别是，回归问题输出的是一个数值，分类问题输出的是类别。又分为二分类和多分类问题。如判断邮件是否为垃圾邮件是二分类问题，判断新闻类别是教育，政治还是财经类新闻属于多分类问题。
求解任务的方法：
选择不同的function set，也就是选择不同的model。Linear Model最简单，Deep Learning很复杂，但是也可以做很复杂的事情，如训练机器下围棋。
除了深度学习以外，还有很多model也是非线性模型，如SVM。
以上监督学习的任务需要大量的training data，需要告诉机器input和output，其中output需要手工标注出来，即label。要减少标注label的数量，可以采用半监督学习。

2 半监督学习

在这里插入图片描述
你有少量的猫和狗的labelled data，但是同时你又有大量的Unlabeled data，但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中，这些没有label的data，他可能也是对学习有帮助。后面会讲到。

3 迁移学习

在这里插入图片描述
假设我们要做猫和狗的分类问题，只有少量的有label的data。但是我们现在有大量的data，这些大量的data中可能有label也可能没有label。但是这些data跟我们现在要考虑的问题是没有什么特别的关系的。这些不相关的data对于分类有什么帮助，这是迁移学习要讲的问题。

4 无监督学习

在这里插入图片描述
无监督学习就是让机器无师自通。
这个Task是一个无监督学习的问题，这个function的输入不知道是什么，可能是某一个code代表要输出图片的特性，输出是一张图片。你给机器看到的只有非常大量的图片，只有function的input，没有output。机器要咋样生成新的图片，这是我们后面要解决的问题。

5 监督学习中的结构化学习

在这里插入图片描述
structured learning 中让机器输出的是要有结构性的，举例来说：在语音辨识里面，机器输入是声音讯号，输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话，你输入中文希望机器翻成英文，它的输出也是有结构性的。
machine learning只有regression和classification两类问题，就好像告诉你：我们所熟知的世界只有五大洲，但是这只是真实世界的一小部分，真正的世界是如图所示。真正世界还应该包括structure learning，这里面还有很多问题是没有探究的。

6 强化学习

在reinforcement learning里面，我们没有告诉机器正确的答案是什么，机器所拥有的只有一个分数，就是他做的好还是不好。机器根据每轮的分数来判断自己的行为是好还是不好，然后调整自己的行为，直至到达最好的效果。reinforcement learning也是比较我们人类真正的学习的情景，如果机器可以做到reinforcement learning，那确实是比较intelligence。
在这里插入图片描述
若我们用Alpha Go当做例子时，supervised learning就是告诉机器：看到这个盘式你就下“5-5”，看到这个盘式你就下“3-3”。
Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习，然后再做reinforcement learning。