| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 深度学习之 7 深度前馈网络2 -> 正文阅读 |
|
[人工智能]深度学习之 7 深度前馈网络2 |
本文是接着上一篇深度学习之 7 深度前馈网络_水w的博客-CSDN博客 目录 自动梯度计算
1、数值微分
用数值的方法来计算函数
𝑓 𝑥
的导数,函数
𝑓(𝑥)在点𝑥处的导数定义为:
?在实际应用中,经常使用下面的方式来计算梯度,以减小截断误差,
2、符号微分
3、自动微分
4、计算图
实例?: ? 正则化单隐层MLP计算图:?? ? ?5、静态计算图、动态计算图
神经网络参数优化的主要问题1、非凸优化
?
神经网络的优化问题是一个非凸优化问题
以一个最简单的1-1-1结构的两层网络为例:
其中𝑤1和𝑤2为网络参数,𝜎(?)为Logistic激活函数。
给定一个样本
1,1
,
平方误差损失
和
交叉熵损失
与参数
𝑤
1
和
𝑤
2
的关系如下图:
2、梯度消失? 误差在反向传播过程中不断衰减甚至消失?
?
回顾误差反向传播的迭代公式:
?误差在每一层传播时都要乘以该层激活函数的导数。
?
当采用
Sigmoid
型激活函数时,导数为:
?二者的导数的值域都小于或者等于1,在饱和区的导数更接近于0,这就会造成梯度的不断衰减,甚至消失,使得整个网络很难训练。 ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 0:22:05- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |