IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 常见激活函数及tensorflow使用 -> 正文阅读

[人工智能]常见激活函数及tensorflow使用


激活函数

激活函数使输出的函数不再为线性,加入非线性因素,使得可以加入更多的网络层数,计算更多的函数。

唯一能使用线性激活函数的地方为机器学习的回归问题

下面介绍几种常用的激活函数:

一、sigmoid函数

σ ( x ) = 1 1 + e ? x \sigma(x) = \frac{ 1}{1+ e^{-x}} σ(x)=1+e?x1?
sigmoid

  • 输出在0~1之间,常用在二元分类的输出层,其他一般不用。
  • 在x=0处最大导数为0.25,会产生梯度消失现象。

二、tanh函数

t a n h ( x ) = e x ? e ? x e x + e ? x tanh(x) = \frac{ e^{x}-e^{-x}}{e^{x}+ e^{-x}} tanh(x)=ex+e?xex?e?x?

在这里插入图片描述

  • 输出在-1~1之间,收敛速度比Sigmoid函数快
  • 在x=0处最大导数为1

三、ReLU函数

f ( x ) = m a x ( 0 , x ) f(x) = max(0,x) f(x)=max(0,x)
在这里插入图片描述

  • 不会有梯度消失问题加快了训练速度,但是在z<0处值为0.
  • 由于梯度以指数方式在层中消失,导致网络较底层的训练速度非常慢。ReLU 对输入内容的所有值都应用了函数 f ( x ) = m a x ( 0 , x ) f(x) = max(0, x) f(x)=max(0,x)。用基本术语来说,这一层把所有的负激活(negative activation)都变为零。这一层会增加模型乃至整个神经网络的非线性特征,而且不会影响卷积层的感受野。

四、leaky ReLU函数(PRELU)

f ( x ) = m a x ( α x , x ) f(x)=max(αx,x) f(x)=max(αx,x)

在这里插入图片描述

  • 为了解决ReLu函数在z<0处值为0的情况,引入leaky ReLu函数,使在z<0处有值。

五、Swish函数

s w i s h ( x ) = x ? s i g m o i d ( β x ) swish(x)=x·sigmoid(βx) swish(x)=x?sigmoid(βx)
在这里插入图片描述

  • Swish是Sigmoid和ReLU的改进版,类似于ReLU和Sigmoid的结合,β是个常数或可训练的参数。
  • Swish 具备无上界有下界、平滑、非单调的特性。Swish 在深层模型上的效果优于 ReLU。

六、Mish函数

M i s h ( x ) = x ? t a n h ( l n ( 1 + e x ) ) Mish(x)=x·tanh(ln(1+e^{x})) Mish(x)=x?tanh(ln(1+ex))
在这里插入图片描述

  • Mish与Swish激活函数类似,Mish具备无上界有下界、平滑、非单调的特性。Mish在深层模型上的效果优于 ReLU。
  • 无上边界可以避免由于激活值过大而导致的函数饱和。

七、TensorFlow代码

在tensorflow中在建立模型时需要用到激活函数,其中activation为调用激活函数。

#激活函数为relu
tf.keras.layers.Dense(128, activation='relu')
#这是一层激活函数为softmax层,一般用于模型最后分类问题
tf.keras.layers.Dense(10, activation='softmax')
model.add(Conv2D(kernel_size=(3, 3), strides=(1, 1), padding="same", filters=384,
				 activation='relu', kernel_initializer='he_normal'))
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-17 11:30:57  更:2022-01-17 11:33:30 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 16:36:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码