| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Pytrch深度学习与图神经网络实战系列_08 激活函数+Sigmoid+tanh+ReLU+Swish+Mish+GELU -> 正文阅读 |
|
[人工智能]Pytrch深度学习与图神经网络实战系列_08 激活函数+Sigmoid+tanh+ReLU+Swish+Mish+GELU |
1 Sigmoid函数
1.1 Sigmoid函数介绍1.1.1 表达式1.1.2 函数原型1.1.3 图像图像描述:在x趋近于正无穷与负无穷的情况下,函数值去想与1或者0,这种情况称为饱和。处于饱和状态的函数将意味着,x=10与x=1000在结果上无差别,使得在这个区间内的信息被丢弃。 1.1.4 LogSigmoid函数表示为? 图像表示为 LogSigmoid激活函数常常被用作与NULLoss损失函数一起使用,用作神经网络反向传播过程中的计算交叉熵的环节。 1.2 LogSigmoid()与Sigmoid???????()代码
2 tanh函数2.1 函数介绍
2.1.1 函数图像?2.1.2 代码
3 ReLU函数3.1 函数介绍3.1.1函数公式3.1.2 函数图像?3.1.3 函数解释
3.2 ReLU的变种函数3.2.1 ReLu6===》有效防止训练过程中的梯度爆炸现象函数代码:?relu6 = min(max(features, 0), 6) 特点:结果是把小于0的变成0,大于6的取6。 缺点:这个训练收敛比较快,但是收敛比较好后,目标检测网络回归框不太准。
3.2.2?Leaky ReLULeaky ReLU函数的特点:
Leaky ReLU函数的图像: 3.2.3?PReLUPReLU函数中,参数α \alphaα通常为0到1之间的数字,并且通常相对较小。
PReLU函数的特点:
3.2.4 ELUELU有负值,这会使激活的平均值接近零。均值激活接近于零可以使学习更快,因为它们使梯度更接近自然梯度。 ELU函数的特点:
ELU函数的图像: 3.3 ReLU对应的函数实现
4 SoftPlus函数4.1 函数介绍4.1.1 函数公式4.1.2 函数图像4.1.3 函数解释
?4.2 代码实现
参数threshold为激活函数输出的最大阈
5 Swish(更好的激活函数)5.1 Swish函数简介5.1.1 Swish函数公式PS:其中β为x的缩小参数,默认取1,但在使用批量归一算法的情况下,就需要对β进行调整。β可以手动调节,也可以由神经网络自动学习得到。 5.1.2 Swish函数图像? 6 Mish(更好的激活函数)6.1 Mish函数介绍6.1.1 函数公式Mish激活函数无边界(即正值可以达到任何高度) 6.1.2 函数图像?6.2 Swish与Mish函数的封装实现
7 GELU(NLP任务的激活函数)7.1 函数介绍 [ 高斯误差线性单元]GELU函数就是一个综合体,它实现了非线性加上泛化,特别占内存,计算量很大 这里Φ ( x ) 是正太分布的概率函数,可以简单采用正太分布N ( 0 , 1 ) , 当然可以使用参数化的正太分布N ( μ , σ ) , 然后通过训练得到μ , σ 。 对于假设为标准正太分布的GELU(x),,论文中提供了近似计算的数学公式,如下: 7.1.1 GELE激活函数将激活参数0或1的取值概率与神经网络的激活值结合,使得神经网络具有自我确定性决策,即神经网络的激活值越小,其所乘的激活参数为1的概率越小7.1.2 Swish与GELU函数的关系Swish激活函数属于GELU的一个特例,Mish函数也属于GELU的一个特例。 7.2 代码实现
?8 激活函数总结在神经网络中,特征见的差距会随着循环计算的推进而不断地被放大,当输入数据较大时,使用tanh()较为合理,输入数据差距较小时,使用Sigmoid()函数较为合适。 GeLU()激活函数,主要能够生成稀疏性更好的特征数据,即将数据转化为只有最大数值,其他为0 的特征,可以更好的突出输入特征,用大多数元素为0的稀疏矩阵来实现。 Swish与Mish函数是在ReLu基础上进一步优化产生,Mish()>Swish() |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 2:16:05- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |