IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 神经网络中的数值稳定性问题 -> 正文阅读

[人工智能]神经网络中的数值稳定性问题

前言

数值稳定性,这个说起来简单但真正碰到确实一个非常难的问题,而且它十分的重要。
当神经网络在训练的过程中,碰到NANinf的时候,是最为恼火的,这严重地影响了训练。
有的时候,模型不断训练但没有结果也可能是数值稳定性问题。

次幂的恐怖

回想一些梯度求导的式子,采用的是链式求导法则,也就是说最终的结果是多个导数的乘积。
来计算两个式子:
1. 2 50 = 9 , 100.4381500021497733275852753426 0. 8 50 = 1.4272476927059598810582859694495 e ? 5 1.2^{50}=9,100.4381500021497733275852753426 \newline 0.8^{50}=1.4272476927059598810582859694495e-5 1.250=9,100.43815000214977332758527534260.850=1.4272476927059598810582859694495e?5
我们不妨假设,一个神经网络有50层,每层的导数为1.2,那么当这个梯度传导到输入层的时候,其已经是一个巨大无比的数了,这样的训练显然达不到我们想要的效果。
同样如果每层的导数是0.8,那么输入层的梯度就是一个非常小的数了,因此时就无法训练了。
第一种情况叫做:梯度爆炸,求出的梯度非常大,
第二种情况叫做:梯度消失,求出的梯度非常小。

解决方法

并没有特别好的方法,但是有一些办法可以缓解此类现象。

合理的初始化

一般来说,最开始的时候梯度是非常大的,但在接近极值点的时候,梯度会相对较小一些。
而最开始的时候,权重都是随机的,如果随机的权重都是几千,那么用不到几层的反向传播梯度就会爆炸;同样,随机出来的梯度都特别小也是不行的,因为会出现梯度消失的情况。

选择合适的激活函数

如果激活函数的导数都特别大,也非常容易造成梯度爆炸的情况。
不过一般常用的激活函数都不会出现这个问题。例如ReUL,其导数也就是1(x>0)。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-20 18:51:12  更:2022-07-20 18:52:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 0:54:40-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码