IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 吴恩达机器学习 向量机 -> 正文阅读

[人工智能]吴恩达机器学习 向量机

机器学习 支持向量机


学习日志 2136周

分类过渡到向量机

  • 请添加图片描述

  • img

  • img

  • img

  • img

  • c o s t 0 ( θ T x ( i ) ) cost_0(\theta^Tx^{(i)}) cost0?(θTx(i)) c o s t 1 ( θ T x ( i ) ) cost_1(\theta^Tx^{(i)}) cost1?(θTx(i))函数替换 l o g ( h θ ( x ) ) log(h_{\theta}(x)) log(hθ?(x))相关函数

  • 删去 1 m \frac{1}{m} m1?,形式: ( A + λ × B ) → ( C × A + B ) (A+\lambda\times B){\to}(C×A+B) (A+λ×B)(C×A+B)(类似于 C = 1 λ C=\frac{1}{\lambda} C=λ1?)

  • C = 1 λ C=\frac{1}{\lambda} C=λ1?

    • C C C较大时,相当于 λ \lambda λ较小,可能会导致过拟合,高方差。
    • C C C较小时,相当于 λ \lambda λ较大,可能会导致欠拟合,高偏差。
  • C C C不是非常非常大的时候,它可以忽略掉一些异常点的影响,得到更好的决策界

  • 最后有别于逻辑回归输出的概率。在这里,我们的代价函数,当最小化代价函数,获得参数 θ \theta θ时,支持向量机所做的是它来直接预测 y y y的值等于1,还是等于0。因此,这个假设函数会预测1。当 θ T x \theta^{T}x θTx大于或者等于0时,或者等于0时,所以学习参数 θ \theta θ就是支持向量机假设函数的形式。那么,这就是支持向量机数学上的定义。

S V M SVM SVM理解

  • img

  • 大间距分类器

    • 理解时假设: C C C非常大时(便于理解向量机;看公式:要求变为使A趋近0,目的变为最小化B,即最小化 θ \theta θ,忽略掉截距,令 θ 0 = 0 \theta_{0}=0 θ0?=0

    • 请添加图片描述

    • 支持向量机做的全部事情,就是极小化参数向量 θ \theta θ范数的平方,或者说长度的平方

    • img

    • 即便 θ \theta θ不等于0,支持向量机要做的事情都是优化这个目标函数对应着 C C C值非常大的情况,但是可以说明的是,即便 θ 0 \theta_{0} θ0?不等于0,支持向量机仍然会找到正样本和负样本之间的大间距分隔

核函数

  • img

  • 高级数的多项式模型来解决无法用直线进行分隔的分类问题,为了获得上图所示的判定边界,我们的模型可能是的 θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 1 x 2 + θ 4 x 1 2 + θ 5 x 2 2 + ? {{\theta }_{0}}+{{\theta }_{1}}{{x}_{1}}+{{\theta }_{2}}{{x}_{2}}+{{\theta }_{3}}{{x}_{1}}{{x}_{2}}+{{\theta }_{4}}x_{1}^{2}+{{\theta }_{5}}x_{2}^{2}+\cdots θ0?+θ1?x1?+θ2?x2?+θ3?x1?x2?+θ4?x12?+θ5?x22?+?的形式

  • 高阶项:确定是否需要且运算量大

  • 寻找比高阶项更好的特征:我们可以用一系列的新的特征 f f f来替换模型中的每一项 f 1 = x 1 , f 2 = x 2 , f 3 = x 1 x 2 , f 4 = x 1 2 , f 5 = x 2 2 {{f}_{1}}={{x}_{1}},{{f}_{2}}={{x}_{2}},{{f}_{3}}={{x}_{1}}{{x}_{2}},{{f}_{4}}=x_{1}^{2},{{f}_{5}}=x_{2}^{2} f1?=x1?,f2?=x2?,f3?=x1?x2?,f4?=x12?,f5?=x22?得到 h θ ( x ) = θ 1 f 1 + θ 2 f 2 + θ 3 f 3 + ? + θ n f n h_{\theta}(x)=\theta_{1}f_{1}+\theta_{2}f_{2}+\theta_{3}f_{3}+\dots+\theta_{n}f_{n} hθ?(x)=θ1?f1?+θ2?f2?+θ3?f3?+?+θn?fn?

  • 除了对原有的特征进行组合以外,可以利用核函数来计算出新的特征

  • 地标 ( l a n d m a r k ) l ( i ) (landmark)l^{(i)} landmarkl(i)地标的选取可以取样本本身),核函数 s i m i l a r i t y ( x , l ( i ) ) similarity(x,l^{(i)}) similarity(x,l(i))

  • 高斯核函数(Gaussian Kernel): f 1 = s i m i l a r i t y ( x , l ( 1 ) ) = e ( ? ∥ x ? l ( 1 ) ∥ 2 2 σ 2 ) {{f}_{1}}=similarity(x,{{l}^{(1)}})=e(-\frac{{{\left\| x-{{l}^{(1)}} \right\|}^{2}}}{2{{\sigma }^{2}}}) f1?=similarity(x,l(1))=e(?2σ2x?l(1)2?),其中 ∥ x ? l ( 1 ) ∥ 2 = ∑ j = 1 n ( x j ? l j ( 1 ) ) 2 {{\left\| x-{{l}^{(1)}} \right\|}^{2}}=\sum{_{j=1}^{n}}{{({{x}_{j}}-l_{j}^{(1)})}^{2}} ?x?l(1)?2=j=1n?(xj??lj(1)?)2,这个函数与正态分布没什么实际上的关系,只是看上去像而已

  • 作用:如果一个训练样本 x x x与地标 l l l之间的距离近似于0,则新特征 f f f近似于 e ? 0 = 1 e^{-0}=1 e?0=1,如果训练样本与地标之间距离较远,则 f f f近似于 e ? ( 远 距 离 大 数 ) → 0 e^{-(远距离大数)}{\to}0 e?()0

  • 我们通常是根据训练集的数量选择地标的数量,即如果训练集中有m个样本,则我们选取m个地标,并且令** l ( 1 ) = x ( 1 ) , l ( 2 ) = x ( 2 ) , . . . . . , l ( m ) = x ( m ) l^{(1)}=x^{(1)},l^{(2)}=x^{(2)},.....,l^{(m)}=x^{(m)} l(1)=x(1),l(2)=x(2),.....,l(m)=x(m)**:。这样做的好处在于:现在我们得到的新特征是建立在原有特征与训练集中所有其他特征之间距离的基础之上的

  • img

  • img

  • 下面我们将核函数运用到支持向量机中,修改我们的支持向量机假设为:

    ? 给定 x x x,计算新特征 f f f,当 θ T f > = 0 θ^Tf>=0 θTf>=0时,预测 y = 1 y=1 y=1,否则反之。

    相应地修改代价函数为: ∑ j = 1 n = m θ j 2 = θ T θ \sum\limits_{j=1}^{n=m}\theta _{j}^{2}={{\theta}^{T}}\theta j=1n=m?θj2?=θTθ m i n C ∑ i = 1 m [ y ( i ) c o s t 1 ( θ T f ( i ) ) + ( 1 ? y ( i ) ) c o s t 0 ( θ T f ( i ) ) ] + 1 2 ∑ j = 1 n = m θ j 2 min C\sum\limits_{i=1}^{m}{[{{y}^{(i)}}cos {{t}_{1}}}( {{\theta }^{T}}{{f}^{(i)}})+(1-{{y}^{(i)}})cos {{t}_{0}}( {{\theta }^{T}}{{f}^{(i)}})]+\frac{1}{2}\sum\limits_{j=1}^{n=m}{\theta _{j}^{2}} minCi=1m?[y(i)cost1?(θTf(i))+(1?y(i))cost0?(θTf(i))]+21?j=1n=m?θj2?

  • n n n个特征换为 m m m个新特征 f f f

  • ∑ j = 1 n = m θ j 2 = θ T θ \sum\limits_{j=1}^{n=m}\theta _{j}^{2}={{\theta}^{T}}\theta j=1n=m?θj2?=θTθ,我们用 θ T M θ θ^TMθ θTMθ代替 θ T θ θ^Tθ θTθ,其中 M M M是根据我们选择的核函数而不同的一个矩阵。这样做的原因是为了简化计算。

  • 理论上讲,我们也可以在逻辑回归中使用核函数,但是上面使用 M M M来简化计算的方法不适用与逻辑回归,因此计算将非常耗费时间

  • 支持向量机也可以不使用核函数,不使用核函数又称为线性核函数(linear kernel),当我们不采用非常复杂的函数,或者我们的训练集特征 n n n非常多而样本 m m m非常少的时候,可以采用这种不带核函数的支持向量机。

  • 下面是支持向量机的两个参数 C C C σ \sigma σ的影响(理解为 C = 1 / λ C=1/\lambda C=1/λ

    • C C C较大时,相当于 λ \lambda λ较小,可能会导致过拟合,高方差;

    • C C C较小时,相当于 λ \lambda λ较大,可能会导致低拟合,高偏差;

    • σ \sigma σ较大时,高斯函数较平缓,可能会导致低方差,高偏差;

  • σ \sigma σ较小时,高斯函数变化剧烈,可能会导致低偏差,高方差。

  • img

使用支持向量机

  • 尽管你不去写你自己的SVM的优化软件,但是你也需要做几件事:

    • 提出参数C的选择。我们在之前的视频中讨论过误差/方差在这方面的性质。

    • 需要选择内核参数或想要使用的相似函数。其中一个选择是:我们选择不需要任何内核参数,没有内核参数的理念,也叫线性核函数。

  • 从逻辑回归模型,我们得到了支持向量机模型,在两者之间,我们应该如何选择呢?下面是一些普遍使用的准则:(n为特征数,m为训练样本数)

    (1)如果相较于m而言,n要大许多,即训练集数据量不够支持我们训练一个复杂的非线性模型,我们选用逻辑回归模型或者不带核函数的支持向量机

    (2)如果n较小,而且m大小中等,例如n在 1-1000 之间,而m在10-10000之间,使用高斯核函数的支持向量机

    (3)如果n较小,而m较大,例如n在1-1000之间,而m大于50000,则使用支持向量机会非常慢,解决方案是创造、增加更多的特征(?),然后使用逻辑回归或不带核函数的支持向量机

  • 逻辑回归和不带核函数的支持向量机它们都是非常相似的算法,不管是逻辑回归还是不带核函数的SVM,通常都会做相似的事情,并给出相似的结果。

  • 神经网络在以上三种情况下都可能会有较好的表现,但是训练神经网络可能非常慢,选择支持向量机的原因主要在于它的代价函数是凸函数,不存在局部最小值。(当时GPU计算比较慢,神经网络还不流行。)

  • SVM具有的优化问题,是一种凸优化问题。因此,好的SVM优化软件包总是会找到全局最小值,或者接近它的值。

数是凸函数,不存在局部最小值。(当时GPU计算比较慢,神经网络还不流行。)

  • SVM具有的优化问题,是一种凸优化问题。因此,好的SVM优化软件包总是会找到全局最小值,或者接近它的值。

返回目录

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-05 10:51:48  更:2021-09-05 11:02:28 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 19:44:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码