[人工智能] 【机器学习】（李宏毅）task01

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【机器学习】（李宏毅）task01 -> 正文阅读

[人工智能]【机器学习】（李宏毅）task01

task01-器学习的介绍

目标：人工智慧
手段：机器学习，深度学习即为机器学习的一种方法。
1、什么是机器学习？
答：机器有学习的能力。例如小孩学习一样，看到一张图片之后就有辨识的能力。
务实一点讲机器学习所做的事情即想寻找一个Function，要让机器具有一个能力，这种能力是根据提供给它的资料，让它去寻找我们要寻找的function。
2.机器学学习的框架：
1）就是找一个function；
2）让machine可以衡量一个function是好还是不好；
3）让machine有一个自动的方法，有一个好演算法可以挑出最好的function。
在这里插入图片描述 3.机器学习的相关的技术
1）让Machine去了解任务（task）:
task可分为:Regression和Classification，及结构化学习。前两者的差别就是我们要机器输出的东西的类型是不一样的。
Regression:机器输出的是一个数值。
Classification:机器输出的是类别。
结构化学习：让机器输出的是要有结构性的。
在这里插入图片描述

<1>监督学习步骤：

选择function set，即选不同的model；
搜集训练数据，告诉机器这个function输入输出及关系是什么？
<2>半监督学习：减少label的量；
<3>迁移学习:减少data的量；

<4>无监督学习：在完全没有任何label的情况下，机器可以学到什么样的事情。

<5>强化学习：我们没有告诉机器正确的答案是什么，机器所拥有的只有一个分数，就是他做的好还是不好。

同样的颜色不同的方块是同一个类型的，这边的蓝色的方块，指的是学习的情景，通常学习的情景是你没有办法控制的。比如，因为我们没有data做监督学习，所以我们才做reinforcement learning。现在因为Alpha Go比较火，所以Alpha Go中用到的reinforcement learning会被认为比较潮。所以说有学生去面试，说明自己是做监督学习的，就会被质疑为什么不做reinforcement learning。那这个时候你就应该和他说，如果我今天可以监督学习，其实就不应该做reinforcement learning。reinforcement learning就是我们没有办法做监督学习的时候，我们才做reinforcement learning。红色的是指你的task，你要解的问题，你要解的这个问题随着你用的方程的不同，有regression、有classification、有structured。所以在不同的情境下，都有可能要解这个task。最后，在这些不同task里面有不同的model，用绿色的方块表示。