| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习笔记(一) -> 正文阅读 |
|
[人工智能]机器学习笔记(一) |
大学生自学笔记,相当于自己的一个学习记录。使用教材为吴恩达教授的机器学习,里面含有网友总结的内容。希望能在学习的过程中不断提高自己,学习计算机相关的内容,第一周由于时间仓促,总结较少,在后续的学习过程中将不断完善。 一、什么是机器学习 1.1 ? ? ? ?Tom定义的机器学习是,一个程序能被认为从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P审判,程序在处理T时的性能有所提升。 1.2监督学习 ? ? ? 监督学习最好的例子时房价问题,如下面一个例子,横轴表示面积,纵轴表示房价,有一个朋友有一套750平方英尺的房子,希望把房子卖掉,他想指导房子能卖多少钱。 ? ? ? ?应用合适的学习算法,可以在数据中画出一道直线,这个直线是拟合出来的,如果用一次方程,推断出仿真价值150,000美金,如果采用二次函数进行拟合,售价接近200,000美元,。两种方案中有一个方案会让你的朋友认为合理,这就是监督学习的例子。 ? ? ? ?在一些机器学习的问题中,可能不止会遇到一种特征值,我们通常会有更多的特征,有一些算法不仅能处理2种3种或者5种特征,还可以处理无限多种特征。在以后的学习种,会学习一个算法,叫支持向量积,里面有一个巧妙的数学技巧,能让计算机处理无限多个特征。 ? ? ? 监督学习的基本思想是,我们数据集中的每个样本都有对应的“正确答案”,我们根据这些样本做出预测,就像预测房价,预测肿瘤等一系列的回归问题。或是个人鸟类问题 1.3无监督学习 ? ? ? ?相较于监督学习,无监督学习中没有任何的标签或者有相同的标签或者说是没有标签,所以我们已知数据集,但是不知道如何处理,也不知道每个数据点是什么。仅仅知道此为一个数据集。针对数据集,无监督学习可有两个不同的聚集簇,这种处理方式被称为聚类算法,此类算法被应用在很多地方,例如每日的新闻推送,或者是下图DNA微观数据的例子。基本思想是输入一组不同个体,分析是否有一个特定基因,颜色表示特定基因已经表达的相对于强度。聚类算法能做的就是把不同的类或不同的组(人)进行聚类。 ? ? ?? ? ? ? ? 这个就是无监督学习,因为我们没有提前告知算法一些信息,比如,这是第一类的 人,那些是第二类的人,还有第三类,等等。我们只是说,是的,这是有一堆数据。我不知 道数据里面有什么。我不知道谁是什么类型。我甚至不知道人们有哪些不同的类型,这些类 型又是什么。但你能自动地找到数据中的结构吗?就是说你要自动地聚类那些个体到各个 类,我没法提前知道哪些是哪些。因为我们没有给算法正确答案来回应数据集中的数据,所 以这就是无监督学习。 ? ??无监督学习或聚集有着大量的应用。下面介绍鸡尾酒问题。有个宴会房间里满是人,全部坐着,都在聊天,这么多人同时在聊天,声音彼此重 叠,因为每个人都在说话,同一时间都在说话,你几乎听不到你面前那人的声音。所以,可 能在一个这样的鸡尾酒宴中的两个人,他俩同时都在说话,假设现在是在个有些小的鸡尾酒 宴中。我们放两个麦克风在房间中,因为这些麦克风在两个地方,离说话人的距离不同每个 麦克风记录下不同的声音,虽然是同样的两个说话人。听起来像是两份录音被叠加到一起, 或是被归结到一起,产生了我们现在的这些录音。另外,这个算法还会区分出两个音频资源, 这两个可以合成或合并成之前的录音,实际上,鸡尾酒算法的第一个输出结果是: 1,2,3,4,5,6,7,8,9,10, 所以,已经把英语的声音从录音中分离出来了。 第二个输出是这样: 1,2,3,4,5,6,7,8,9,10。 ? 机器学习一般使用Octave编程环境,一行代码可以解决问题。 [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x'); 新闻事件分类的例子, 可以用一个聚类算法来聚类这些文章到一起,所以是无监督学习。 ?细分市场的例子,可以当作无监督学习问题,因为我只是 拿到算法数据,再让算法去自动地发现细分市场。 糖尿病,这个其实就像是我们的乳腺癌,上个视频里的。只是替换了好、 坏肿瘤,良性、恶性肿瘤,我们改用糖尿病或没病。所以我们把这个当作监督学习,我们能 够解决它,作为一个监督学习问题,就像我们在乳腺癌数据中做的一样。 总结:第一周学习了一些机器学习的基础概念,对于如何实现这周由于时间有限还没有进行学习,下周预计学习这些算法如何工作的,例如单变量线性回归等知识。加油。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 15:55:34- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |