IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 感知机、支持向量机、神经网络的关系 -> 正文阅读

[人工智能]感知机、支持向量机、神经网络的关系

感知机模型

感知机是最早的人工智能算法,他是支持向量机和神经网络的基础。

它的基本思想是找到一条直线,将两类样本进行划分。其求解方法则类似与梯度下降法不断对w,b进行调整。

它的模型如下:

对每个训练样本(xi,yi),执行一下操作:

(i)若wx+b>0,且y=-1,则w=w-x,b=b-1;

(ii)若wx+b<0,且y=+1,则w=w+x,b=b+1;

其基本原理是

W_{new}^{T}*X+b_{new}=(W\pm X)^{T}X+b\pm 1=W^{T}X+b\pm (\left \| x \right \|^{2}+1)

保证每次更新至少拉扯了1个单位。

可以证明,这种算法的结果是收敛的。

支持向量机(svm)

支持向量机在解决小样本问题时有着不错的结果,因为它划分空间仅仅依赖于最靠近超平面的支持向量。它的基本思想与感知机一样,都是通过找到一个超平面对空间进行划分,不同的是,感知机是对每个样本点不断进行迭代更新参数值,SVM则同时考虑所有的样本点,建立二次规划模型,并对模型进行求解。

(i)当y=1时,恒有wx+b>0

(ii)当y=-1时,恒有wx+b<0

即y*(wx+b)恒大于0.

那么如何构建这一需要求解的二次规划模型呢?首先要刚清楚两件事情。

1、wx+b=0 与 awx+ab=0是等价的,都表示同一超平面。

2、点到直线的距离公式d=\left | wx+b \right |/\left \| w \right \|^{2}

对于样本中的支持向量,我们可以用a去缩放(w,b)得到(aw,ab),使得|wx+b|=1。

所以我们可以确定优化的目标是找到一个超平面,使两个类别的样本距离足够大,即两个类别的支持向量距离超平面最远。且根据之前要求的限制条件y*(wx+b)>0,得到一下优化模型:

min:\frac{1}{2}\left \| w \right \|^{2}

s.t.: y_{i}(w*x_{i}+b)\geq 1

对于此问题的求解问题涉及凸优化和运筹学相关内容,这里不再说(我也忘了)。

此外,这里和之前的感知机模型仅能解决线性可分的模型。

对于线性近似可分的情况,SVM模型可对优化模型增加惩罚项(松弛变量),且在限制条件中右侧改为1-\zeta进行求解。

对于线性不可分的情况,可以通过核函数的方法,将样本空间映射到高维空间中,在高维空间中则线性可分了。

多层神经网络

神经网络为解决感知机的线性问题,在网络层次中增加了非线性函数例如sigmoid等,且网络结构也更加复杂。

这里举两个例子可以很好的看到神经网络对样本进行划分的优势。

1、

?第一层每个神经元代表了一条直线,这里类似对三条直线采取交运算的方式构建神经网络模型。

当图中的三角形变成四边形或圆形可做类似推理。

2、

?这种某一类别散落了一部分出去,可以在之前的基础上,在下方再增加一个一样的模型。这种好像是解决了感知机异或问题的方式么,呜呜呜我也不太清楚了。

对模型的求解采用基于梯度下降的后向传播算法。

总结

感知机与SVM求解思想类似,都是找一个平面对空间中样本进行切割,但求解方式不一样,可以理解为感知机的求解方法较low,SVM有着丰富的数学基础,再其之上进行延申,进而找到了求解近似线性可分和不可分的求解方法。

神经网络在感知机的基础上,丰富了网络结构,增加了非线性函数,可以解决非线性问题和异或问题无法划分的情况。在求解方式上,二者较为相似,都是有点类似梯度下降的思想。

嗯嗯大概就这些,主要参考自浙大机器学习。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-06 13:50:16  更:2022-02-06 13:52:42 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/18 21:38:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码