| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 神经网络原理及反向传播公式推导 -> 正文阅读 |
|
[人工智能]神经网络原理及反向传播公式推导 |
神经网络简单原理逻辑回归只能解决线性可分问题,对于异或问题,无法找到一条直线分割两个类,则引入了神经网络,加入更多的神经元以及激活函数来拟合非线性问题。 神经网络结构神经网络包含一层输入层,输入数据的特征,至少一层的隐藏层,和输出层。 前向传播计算该图中最下边多出的神经元,用于表示偏置值,该神经元的值永远是1,与对应的权重相乘,可以表示偏置值 对于输出层 θ i j ( 3 ) \theta_{ij}^{(3)} θij(3)?表示第3层第i个神经元与第1层第j个神经元的连接权重 公式全部展开写: 该式子与矩阵相乘的运算规则类似,可以将前向运算过程转化为矩阵运算 代价函数当用与C(C>2)分类任务时,输出层是C个神经元,可以看成是C个二分类问题,例如一个三分类任务,判断一个动物是猫、狗还是猪,输出层是三个神经元,第一个神经元判断是猫还是非猫,第二个神经元判断是狗还是非狗,第三个神经元判断是猪还是非猪,哪个神经元输出值最大判定为哪一类。 y的标签值也不是1 2 3 ,而是one-hot编码后的值,一共三类第一类表示为[1,0,0],第二类表示为[0,1,0],第三类表示为[0,0,1] 反向传播公式推导定义变量l表示层索引,L表示最后一层的索引,jk均表示某一层神经元的索引 z j ( l ) = ∑ k = 1 N ( l ? 1 ) [ θ j k ( l ) a k ( l ? 1 ) + b j ( l ) ] z_{j}^{(l)}=\sum_{k=1}^{N^{(l-1)}}[ \theta_{jk}^{(l)}a_{k}^{(l-1)}+b_{j}^{(l)}] zj(l)?=∑k=1N(l?1)?[θjk(l)?ak(l?1)?+bj(l)?]表示第l层第j个神经元的输入 a j ( l ) = g ( z j ( l ) ) a_{j}^{(l)}=g(z_{j}^{(l)}) aj(l)?=g(zj(l)?)表示第l层第j个神经元的输出 g表示激活函数 第第l层第j个神经元残剩的残差为 ξ j ( l ) = ? J ? z j ( l ) \xi_{j}^{(l)}=\frac{\partial J}{\partial z_{j}^{(l)}} ξj(l)?=?zj(l)??J? 反向传播公式推导对于输出层: 对于连接权重和偏置值 然后根据代价J对每个参数的偏导数值,使用梯度下降法方可求解最优解。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 3:49:33- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |