IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 2021-11-13花书学习-chapter 6隐层单元 -> 正文阅读

[人工智能]2021-11-13花书学习-chapter 6隐层单元

整流线性单元——分段线性函数
??线性整流单元是隐藏层最常用的神经元单元,一般未经说明,隐藏层的单元多为经过仿射变换的输入输入到一个非线性的激活函数里。在整流线性单元广泛使用之前, s i g m o i d , t a n h sigmoid,tanh sigmoid,tanh为常用的激活函数,但是这些激活函数都不可避免的面对着当仿射变换后取值过大或者过小带来的饱和问题,导致当网络层数加深以后出现数值计算的下溢,或者梯度过小网络学习很慢的问题。线性整流单元及其扩展基于同一个原则,即当他们的表现越接近线性,在基于梯度的优化方法上表现会越好,避免出现梯度消失的问题。
??在除了前馈神经网络的场景下,如在循环神经网络,概率模型以及一些自编码器的特殊要求使得他们不能使用分段线性激活函数, s i g m o i d sigmoid sigmoid被广泛应用,尽管其存在着饱和性的问题。

  1. 常用的整流线性单元
    ??最常用的RELU单元,将输入x经过放射变换后输入relu函数 z = W ′ x + b z=W'x+b z=Wx+b r e l u ( z ) = m a x ( 0 , z ) relu(z)=max(0,z) relu(z)=max(0,z)在使用relu单元时,单元处于激活状态时,处处梯度为1保持一个较高的水平不变,且二阶导数为零,不会出现sigmoid在输入值很小或者很大时候的饱和现象。但是线性整流单元存在缺点,即当z为负数时不被激活,在激活值为0的样本上,基于梯度的优化方法失效。针对线性整流单元的缺陷,学者提出关于线性整流单元的扩展,其核心思想是在 z < 0 z<0 z<0时候,给予 z < 0 z<0 z<0的部分一个系数 α \alpha α
    ??1.1 绝对值整流——即绝对值函数,在 z < 0 z<0 z<0的部分, α = ? 1 \alpha=-1 α=?1
    ??1.2Leaky Relu——在 z < 0 z<0 z<0的部分, α \alpha α是一个很小的数值
    ??1.3参数化整流线性单元——可以理解为Leaky Relu中将参数 α \alpha α做为参数进行学习

  2. maxout单元——其他几类扩展可以视为是maxout单元的特殊形式
    ?? 其他几种整流线性单元加入非线性激活的方式是将仿射变换以后的输入,输入到一个非线性的激活函数中,但maxout不同,每个maxout单元可以直观理解为,将k个仿射变换的结果 z i z_i zi?输入到一个最大值 m a x max max函数里。最大值函数本身就是一个非线性函数。以二维情景为例:
    m a x o u t ( z i ) = m a x ( ? z 1 , z 2 ? ) = m a x ( ? W 1 ′ x + b 1 ? W 2 ′ x + b 2 ? ) maxout(z_i)=max(\ z_1,z_2\ )=max(\ W_1'x+b_1\, W_2'x+b_2\ ) maxout(zi?)=max(?z1?,z2??)=max(?W1?x+b1?W2?x+b2??)
    ??在二维情境下,如果 W 1 = 0 , b 1 = 0 W_1=0,b_1=0 W1?=0,b1?=0时,就时常用的relu。
    ??当 W 1 = ? α W 2 , b 1 = ? α b 2 , α > 0 W_1=-\alpha W_2,b_1=-\alpha b_2, \alpha>0 W1?=?αW2?,b1?=?αb2?,α>0时候,就是我们的leaky Relu
    ??maxout的特点:
    ??优点:maxout学习的是一个分段线性函数,理论上当分段个数k无穷大的时候,可以拟合任意凸函数,有很强的拟合性。具有整流线性单元的线性不饱和的优点,没有relu的缺点,如神经元一直为负数未激活,带来的神经元死亡
    ??缺点:和一般的整流线性单元相比,参数个数扩展了至多k倍

??除了整流线性单元和 s i g m o i d , t a n h sigmoid,tanh sigmoidtanh其他的隐藏单元激活函数,还有:
??径向基函数 G a u s s i a n ? R B F ? u n i t s Gaussian\ RBF\ units Gaussian?RBF?units R B F ( x ) = e x p { ∣ ∣ W ? x ∣ ∣ 2 σ 2 } RBF(x)=exp\lbrace\cfrac{||W-x||^2}{\sigma^2}\rbrace RBF(x)=exp{σ2W?x2?}?? s o f t p l u s softplus softplus函数,作为平滑后的整流线性激活函数(我觉得一般没必要,因为分段线性函数确实有不可导点,但是这不可导点对我们执行梯度下降不影响,但是我们在计算机计算时候,参考的是他的左导或者右导,这里整流线性单元的左右导数都是存在的但是不相等而已)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-14 21:38:18  更:2021-11-14 21:44:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 6:10:38-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码