IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 机器学习笔记-SMO序列最小最优化算法中关于解析方法的证明 -> 正文阅读

[人工智能]机器学习笔记-SMO序列最小最优化算法中关于解析方法的证明

SMO序列最小最优化算法中关于解析方法的证明

SMO这篇文档中,我们已经详细介绍了SMO从0实现的详细步骤,当时在学习到生成 α 2 n e w , u n c \alpha_2^{new,unc} α2new,unc?时,我们只给出了定理内容,并没有介绍定理的详细证明。
即如下定理:

在如下最优化问题中
min ? α 1 , α 2 ??????? W ( α 1 , α 2 ) = 1 2 K 11 α 1 2 + 1 2 K 22 α 2 2 + y 1 y 2 K 12 α 1 α 2 ? ( α 1 + α 2 ) + y 1 α 1 ∑ i = 3 N y i α i K i 1 + y 2 α 2 ∑ i = 3 N y i α i K i 2 s . t . ????? α 1 y 1 + α 2 y 2 = ? ∑ i = 3 N y i α i = k 0 ≤ α i ≤ C , ????? i = 1 , 2 \min\limits_{\alpha_1,\alpha_2}\,\,\,\,\,\,\,W(\alpha_1,\alpha_2)=\frac{1}{2}K_{11}\alpha_1^2+\frac{1}{2}K_{22}\alpha_2^2+y_1y_2K_{12}\alpha_1\alpha_2-\\(\alpha_1+\alpha_2)+y_1\alpha_1\sum\limits_{i=3}^N{y_i\alpha_iK_{i1}}+y_2\alpha_2\sum\limits_{i=3}^Ny_i\alpha_iK_{i2}\\ s.t.\,\,\,\,\,\alpha_1y_1+\alpha_2y_2=-\sum\limits_{i=3}^N{y_i\alpha_i}=k\\ 0\le\alpha_i\le C,\,\,\,\,\,i=1,2 α1?,α2?min?W(α1?,α2?)=21?K11?α12?+21?K22?α22?+y1?y2?K12?α1?α2??(α1?+α2?)+y1?α1?i=3N?yi?αi?Ki1?+y2?α2?i=3N?yi?αi?Ki2?s.t.α1?y1?+α2?y2?=?i=3N?yi?αi?=k0αi?C,i=1,2
沿着未经剪辑时的解是:

α 2 n e w , u n c = α 2 o l d + y 2 ( E 1 ? E 2 ) η \alpha_2^{new,unc}=\alpha_2^{old}+\frac{y_2(E_1-E_2)}{\eta} α2new,unc?=α2old?+ηy2?(E1??E2?)? 其中:
η = K 11 + K 22 ? 2 K 12 = ∣ ∣ ? ( x 1 ) ? ? ( x 2 ) ∣ ∣ 2 \eta=K_{11}+K_{22}-2K_{12}=||\phi(x_1)-\phi(x_2)||^2 η=K11?+K22??2K12?=?(x1?)??(x2?)2

这里只给出了定理的结果,下面将针对这个定理给出详细的证明。
证明:
首先引进记号:

v i = ∑ j = 3 N α j y j K ( x i , x j ) = g ( x i ) ? ∑ j = 1 2 α j y j K ( x i , x j ) ? b {v_i} = \sum\limits_{j = 3}^N {{\alpha _j}{y_j}K({x_i},{x_j}) = g({x_i}) - \sum\limits_{j = 1}^2 {{\alpha _j}{y_j}K({x_i},{x_j}) - b} } vi?=j=3N?αj?yj?K(xi?,xj?)=g(xi?)?j=12?αj?yj?K(xi?,xj?)?b
其中 g ( x i ) = ∑ j = 1 N α j y j K ( x i , x j ) + b g(x_i)=\sum\limits_{j=1}^N\alpha_jy_jK(x_i,x_j)+b g(xi?)=j=1N?αj?yj?K(xi?,xj?)+b,接着可以把 W ( α 1 , α 2 ) W(\alpha_1,\alpha_2) W(α1?,α2?)进行代换得到:

min ? α 1 , α 2 ??????? W ( α 1 , α 2 ) = 1 2 K 11 α 1 2 + 1 2 K 22 α 2 2 + y 1 y 2 K 12 α 1 α 2 ? ( α 1 + α 2 ) + y 1 α 1 v 1 + y 2 α 2 v 2 \min\limits_{\alpha_1,\alpha_2}\,\,\,\,\,\,\,W(\alpha_1,\alpha_2)=\frac{1}{2}K_{11}\alpha_1^2+\frac{1}{2}K_{22}\alpha_2^2+y_1y_2K_{12}\alpha_1\alpha_2-\\(\alpha_1+\alpha_2)+y_1\alpha_1v_1+y_2\alpha_2v_2 α1?,α2?min?W(α1?,α2?)=21?K11?α12?+21?K22?α22?+y1?y2?K12?α1?α2??(α1?+α2?)+y1?α1?v1?+y2?α2?v2?
既然我们的目的就是求 α 2 n e w \alpha_2^{new} α2new?那么我们可以借助等式将目标函数化成只有 α 2 n e w \alpha_2^{new} α2new?的函数。因此在约束条件中有: α 1 y 1 = k ? α 2 y 2 \alpha_1y_1=k-\alpha_2y_2 α1?y1?=k?α2?y2? y i 2 = 1 y_i^2=1 yi2?=1,于是有 α 1 \alpha_1 α1?:
α 1 = ( k ? α 2 y 2 ) y 1 \alpha_1=(k-\alpha_2y_2)y_1 α1?=(k?α2?y2?)y1?
然后将 α 1 \alpha_1 α1?的式子带入 w ( α 1 , α 2 ) w(\alpha_1,\alpha_2) w(α1?,α2?)中得到:
W ( α 2 ) = 1 2 K 11 ( k ? α 2 y 2 ) 2 + 1 2 K 22 α 2 2 + y 2 K 12 ( k ? α 2 y 2 ) α 2 ? ( ( k ? α 2 y 2 ) y 1 + α 2 ) + ( k ? α 2 y 2 ) v 1 + y 2 α 2 v 2 W(\alpha_2)=\frac{1}{2}K_{11}(k-\alpha_2y_2)^2+\frac{1}{2}K_{22}\alpha_2^2+y_2K_{12}(k-\alpha_2y_2)\alpha_2-\\((k-\alpha_2y_2)y_1+\alpha_2)+(k-\alpha_2y_2)v_1+y_2\alpha_2v_2 W(α2?)=21?K11?(k?α2?y2?)2+21?K22?α22?+y2?K12?(k?α2?y2?)α2??((k?α2?y2?)y1?+α2?)+(k?α2?y2?)v1?+y2?α2?v2?
上述式子中只有 α 2 \alpha_2 α2?这一个变量,于是对其求导并令其等于0得到:
? W ? α 2 = K 11 α 2 + K 22 α 2 ? 2 K 12 α 2 ? K 11 k y 2 + K 12 k y 2 + y 1 y 2 ? 1 ? v 1 y 2 + y 2 v 2 = 0 \frac{{\partial W}}{{\partial {\alpha _2}}} = {K_{11}}{\alpha _2} + {K_{22}}{\alpha _2} - 2{K_{12}}{\alpha _2} - {K_{11}}k{y_2} + {K_{12}}k{y_2} + {y_1}{y_2} - 1 - {v_1}{y_2} + {y_2}{v_2}=0 ?α2??W?=K11?α2?+K22?α2??2K12?α2??K11?ky2?+K12?ky2?+y1?y2??1?v1?y2?+y2?v2?=0
( K 11 + K 22 ? 2 K 12 ) α 2 = y 2 ( y 2 ? y 1 + k K 11 ? k K 12 + v 1 ? v 2 ) = y 2 [ y 2 ? y 1 + k K 11 ? k K 12 + ( g ( x 1 ) ? ∑ j = 1 2 y j α j K 1 j ? b ) ? ( g ( x 2 ) ? ∑ j = 1 2 y j α j K 2 j ? b ) ] \begin{aligned} ({K_{11}} + {K_{22}} - 2{K_{12}}){\alpha _2} &= {y_2}({y_2} - {y_1} + k{K_{11}} - k{K_{12}} + {v_1} - {v_2})\\ &={y_2}[{y_2} - {y_1} + k{K_{11}} - k{K_{12}} + (g({x_1}) - \sum\limits_{j = 1}^2 {{y_j}{\alpha _j}{K_{1j}} - b} ) - (g({x_2}) - \sum\limits_{j = 1}^2 {{y_j}{\alpha _j}{K_{2j}} - b} )] \end{aligned} (K11?+K22??2K12?)α2??=y2?(y2??y1?+kK11??kK12?+v1??v2?)=y2?[y2??y1?+kK11??kK12?+(g(x1?)?j=12?yj?αj?K1j??b)?(g(x2?)?j=12?yj?αj?K2j??b)]?
再将 k = α 1 o l d y 1 + α 2 o l d y 2 k=\alpha_1^{old}y_1+\alpha_2^{old}y_2 k=α1old?y1?+α2old?y2?带入得到:
( K 11 + k 22 ? 2 K 12 ) α 2 n e w , u n c = y 2 ( ( K 11 + K 22 ? 2 K 12 ) α 2 o l d y 2 + y 2 ? y 1 + g ( x 1 ) ? g ( x 2 ) ) = ( K 11 + K 22 ? 2 K 12 ) α 2 o l d + y 2 ( E 1 ? E 2 ) \begin{aligned} ({K_{11}} + {k_{22}} - 2{K_{12}})\alpha _2^{new,unc} &= {y_2}(({K_{11}} + {K_{22}} - 2{K_{12}})\alpha _2^{old}{y_2} + {y_2} - {y_1} + g({x_1}) - g({x_2}))\\ &=({K_{11}} + {K_{22}} - 2{K_{12}})\alpha _2^{old} + {y_2}({E_1} - {E_2}) \end{aligned} (K11?+k22??2K12?)α2new,unc??=y2?((K11?+K22??2K12?)α2old?y2?+y2??y1?+g(x1?)?g(x2?))=(K11?+K22??2K12?)α2old?+y2?(E1??E2?)?
η = K 11 + K 22 ? 2 K 12 \eta = {K_{11}} + {K_{22}} - 2{K_{12}} η=K11?+K22??2K12?带入,于是得到:
α 2 n e w , u n c = α 2 o l d + y 2 ( E 1 ? E 2 ) η \alpha_2^{new,unc}=\alpha_2^{old}+\frac{y_2(E_1-E_2)}{\eta} α2new,unc?=α2old?+ηy2?(E1??E2?)?
到这里所有的证明过程已经结束,其实细看证明步骤并不难,就是一些代换和无约束求导求极值的方法,在得到解析方法的证明后,我们就可以放心使用定理了。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-17 11:30:57  更:2022-01-17 11:33:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 21:24:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码