| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 误差反向传播中的链式求导法则 -> 正文阅读 |
|
[人工智能]误差反向传播中的链式求导法则 |
误差反向传播中的链式求导法则1 复合函数和可微性有函数 y = f ( u ) y= f(u) y=f(u) , 同时有另一个函数 u = g ( x ) u= g(x) u=g(x), 当 y 表示为 x 的函数时,可以变为 y = f ( g ( x ) ) y= f(g(x)) y=f(g(x)) 的嵌套结构。嵌套结构 f ( g ( x ) ) f(g(x)) f(g(x)) 称为 f ( u ) f(u) f(u) 和 g ( x ) g(x) g(x) 的复合函数 对于函数 f 的可微性,我们说函数 f 在 x0 点可微,也即是函数 f 在点 x0 处的极限存在: 2 单变量函数链式法则单变量函数
y
=
f
(
u
)
y= f(u)
y=f(u), u 表示为单变量函数
u
=
g
(
x
)
u= g(x)
u=g(x) 时,复合函数
f
(
g
(
x
)
)
f(g(x))
f(g(x)) 的导函数可以通过下式求出: 例:对 x 的函数 y = 1 1 + e ? ( w x + b ) y=\frac{1}{1+e^{-(wx+b)}} y=1+e?(wx+b)1? (w, b 为常数)求导 解: 设函数
y
=
1
1
+
e
?
u
y=\frac{1}{1+e^{-u}}
y=1+e?u1?,
u
=
w
x
+
b
u=wx+b
u=wx+b,第一个式子为 sigmoid 函数,导数为
d
y
d
u
=
y
(
1
?
y
)
\frac{dy}{du}=y(1-y)
dudy?=y(1?y), 第二个式子
d
u
d
x
=
w
\frac{du}{dx}=w
dxdu?=w 补充: 关于 sigmoid 函数 s ( x ) = 1 1 + e ? x s(x)=\frac{1}{1+e^{-x}} s(x)=1+e?x1? 的求导:
3 多变量函数链式法则3.1 多变量函数求导多变量通用函数可以看作是 n 维的数据映射到 m 维数据, f : R n ? > R m f:R^n->R^m f:Rn?>Rm, 输出的 m个数据的每一个值都可以看作是由输入的 n 个变量计算而来的 如果我们将输出向量的每个分量
y
i
y_i
yi?
i
∈
[
1
,
m
]
i∈[1,m]
i∈[1,m] ,看作一个独立的多元变量函数,那我们就可以对
y
i
y_i
yi? 的每个
x
j
x_j
xj?
j
∈
[
1
,
n
]
j∈[1,n]
j∈[1,n] 求偏导数: 3.2 多变量函数链式法则根据输出为标量还是为向量,分为两种情况 情况1 如果多变函数形式为 f : R n ? > R 1 f:R^n->R^1 f:Rn?>R1 ,即输出为标量,而不是向量 下面是两个变量的情况, z 为 u,v 的函数,而 u , v 又分别为 x, y 的函数。从下图可以看出 x 对 z 的贡献有两条通道,一条经过 u, 一条经过 v,所以当 z 对 x 求导时也需要分成两部分,即: 情况2 如果多变函数形式为
f
:
R
n
?
>
R
m
f:R^n->R^m
f:Rn?>Rm ,即输出为向量,情形如下面的简图所示,输入
x
i
x_i
xi? 经过层层函数最后输出 y 向量
J
y
(
u
)
=
J
y
(
u
(
v
)
)
J
u
(
v
)
J_{y(u)}=J_y{(u(v))}J_u{(v)}
Jy(u)?=Jy?(u(v))Ju?(v) 参考1 The Chain Rule of Calculus |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 16:01:47- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |