IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 统计学习方法第七章——支持向量机 -> 正文阅读

[数据结构与算法]统计学习方法第七章——支持向量机

7.1线性可分支持向量机和硬间隔最大化

7.1.1 线性可分支持向量机

给定线性可分训练集,通过间隔最大化或等价地求解相应的凸二次规划问题学习得到的分离超平面为
w ? ? x + b ? = 0 w^*\cdot x+b^*=0 w??x+b?=0
以及相应的分类决策函数
f ( X ) = s i g n ( w ? ? x + b ? = 0 ) f(X)=sign(w^*\cdot x+b^*=0) f(X)=sign(w??x+b?=0)
称为线性可分支持向量机。

7.1.2 函数间隔和几何间隔

首先要知道点到超平面 w ? x + b = 0 w\cdot x+b=0 w?x+b=0的距离 d = ∣ w ? x + b ∣ ∣ ∣ w ∣ ∣ d=\frac{|w\cdot x+b|}{||w||} d=ww?x+b?(推导见这里)

函数间隔为:
γ ^ i = y i ( w ? x i + b ) {\hat{\gamma}}_i=y_i(w\cdot x_i+b) γ^?i?=yi?(w?xi?+b)
所有样本点 ( x i , y i ) (x_i,y_i) (xi?,yi?)的函数间隔之间的最小值,即
γ ^ = m i n i = 1 , ? ? , N γ ^ i \hat{\gamma}=\underset{i=1,\cdots ,N}{min}\hat{\gamma}_i γ^?=i=1,?,Nmin?γ^?i?
函数间隔可以表示分类预测的正确性及确信度。但是选择分离超平面时, 只有函 数间隔还不够。因为只要成比例地改变 w w w b b b, 例如将它们改为 2 w 2 w 2w 2 b 2 b 2b, 超平面并没有改变,但函数间隔却变成了原来的2倍。 γ ^ i = y i ( 2 w ? x i + 2 b ) = 2 y i ( w ? x i + b ) {\hat{\gamma}}_i=y_i(2w\cdot x_i+2b)=2y_i(w\cdot x_i+b) γ^?i?=yi?(2w?xi?+2b)=2yi?(w?xi?+b),这一事实启示我们,可以对分离超平面的法向量 w w w加某些约束,如规范化, ∣ ∣ w ∣ ∣ = 1 ||w||=1 w=1,这时函数间隔就变成了几何间隔。
γ i = y i ( w ∣ ∣ w ∣ ∣ ? x i + b ∣ ∣ w ∣ ∣ ) {\gamma}_i=y_i(\frac{w}{||w||}\cdot x_i+\frac{b}{||w||}) γi?=yi?(ww??xi?+wb?)
所有样本点 ( x i , y i ) (x_i, y_i) (xi?,yi?)的几何间隔的最小值,即
γ = m i n i = 1 , ? ? , N γ i \gamma = \underset{i=1,\cdots ,N}{min}{\gamma}_i γ=i=1,?,Nmin?γi?
∣ ∣ w ∣ ∣ = 1 ||w||=1 w=1时,函数间隔和几何间隔相等,如果超平面参数 w w w和b成比例地改变(超平面并没有改变),函数间隔也按此比例改变,而几何间隔不变。

7.1.3 间隔最大化

最大间隔分离超平面的存在唯一性,存在性书上证明很容易看懂,下面来证明唯一性。

假设存在两个最优解 ( w 1 ? , b 1 ? ) (w^*_1,b^*_1) (w1??,b1??) ( w 2 ? , b 2 ? ) (w^*_2,b^*_2) (w2??,b2??)。显然 ∣ ∣ w 1 ? ∣ ∣ = ∣ ∣ w 2 ? ∣ ∣ = c ||w^*_1||=||w^*_2||=c w1??=w2??=c,其中c是一个常数。令

w = w 1 ? + w 2 ? 2 , b = b 1 ? + b 2 ? 2 w=\frac{w_{1}^{*}+w_{2}^{*}}{2}, b=\frac{b_{1}^{*}+b_{2}^{*}}{2} w=2w1??+w2???,b=2b1??+b2???, 易知 ( w , b ) (w, b) (w,b) 也是解。
c ? ∣ ∣ w 1 ? + w 2 ? 2 ∣ ∣ ? 1 2 ∣ ∣ w 1 ? ∣ ∣ + 1 2 ∣ ∣ w 2 ? ∣ ∣ = c c\leqslant ||\frac{w^*_1+w^*_2}{2}||\leqslant \frac{1}{2}||w^*_1||+\frac{1}{2}||w^*_2||=c c?2w1??+w2????21?w1??+21?w2??=c
所以 ∣ ∣ w ∣ ∣ = 1 2 ∣ ∣ w 1 ? ∣ ∣ + 1 2 ∣ ∣ w 2 ? ∣ ∣ ||w||=\frac{1}{2}||w^*_1||+\frac{1}{2}||w^*_2|| w=21?w1??+21?w2??,因此 w 1 ? = λ w 2 ? , ∣ λ ∣ = 1 w^*_1=\lambda w^*_2, |\lambda|=1 w1??=λw2??,λ=1,若 λ = ? 1 , 则 w = 0 \lambda=-1,则w=0 λ=?1w=0不符合题意,所以 w 1 ? = w 2 ? w^*_1=w^*_2 w1??=w2??。下面再证 b 1 ? = b 2 ? b^*_1=b^*_2 b1??=b2??。设 x 1 ′ x_{1}^{\prime} x1? x 2 ′ x_{2}^{\prime} x2? 是集合 { x i ∣ y i = + 1 } \left\{x_{i} \mid y_{i}=+1\right\} {xi?yi?=+1} 中分别对应于 ( w ? , b 1 ? ) \left(w^{*}, b_{1}^{*}\right) (w?,b1??) ( w ? , b 2 ? ) \left(w^{*}, b_{2}^{*}\right) (w?,b2??) 使得问题的不等式等号成立的点, x 1 ′ ′ x_{1}^{\prime \prime} x1? x 2 ′ ′ x_{2}^{\prime \prime} x2? 是集合 { x i ∣ y i = ? 1 } \left\{x_{i} \mid y_{i}=-1\right\} {xi?yi?=?1} 中分别对应于 ( w ? , b 1 ? ) \left(w^{*}, b_{1}^{*}\right) (w?,b1??) ( w ? , b 2 ? ) \left(w^{*}, b_{2}^{*}\right) (w?,b2??) 使得问题的不等式等号成立的点。

IMG_0346

IMG_0347

7.1.4 学习的对偶算法

下面是对拉格朗日函数的一个补充解释

IMG_0348

下面是对(7.28)式的补充解释

IMG_0349

7.3 非线形支持向量机和核函数

证明运算*是空间S的内积的补充

IMG_0350

IMG_0351

IMG_0352

7.4 序列最优最小化算法

以下是对 α 2 \alpha_{2} α2?的取值范围进行的推导

IMG_0353

IMG_0354

补充 α 2 n e w \alpha_{2}^{new} α2new? 怎么得到 α 1 n e w \alpha_{1}^{new} α1new?

IMG_0355

7.4.2 变量的选择

关于SMO算法中第一个变量的选择的KKT条件的补充,可以看这个博客,下面是我自己对博客中的内容进行了优化,建议两个结合起来看。

IMG_0356

IMG_0357

参考:

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-04-27 11:31:56  更:2022-04-27 11:32:05 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/6 18:17:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码