IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 总结3个在机器学习种用到的比较多的矩阵求导公式 -> 正文阅读

[人工智能]总结3个在机器学习种用到的比较多的矩阵求导公式

总结矩阵求导以及矩阵求导在机器学子中的应用

在深度学习神经网络的反向传播时,需要根据最后输出的loss反向更新网络的参数,神经网络的训练过程实际上就是参数的更新过程,参数是根据梯度下降法更新的,而梯度的计算需要用到偏导数。因此本文总结了3种在机器学习种用到最多的矩阵求导公式。

考虑三种常见的情况:

case1 vector to vector

y = f ( x ) \mathbf{y}=f(\mathbf{x}) y=f(x),其中,y是m维列向量,x是n维列向量。

? y ? x = [ ? y 1 ? x 1 ? y 1 ? x 2 ? ? y 1 ? x n ? y 2 ? x 1 ? y 2 ? x 2 ? ? y 2 ? x n ? ? ? ? y m ? x 1 ? y m ? x 2 ? ? y m ? x n ] \frac{\partial \mathbf{y}}{\partial \mathbf{x}}=\left[\begin{array}{cccc}\frac{\partial y_{1}}{\partial x_{1}} & \frac{\partial y_{1}}{\partial x_{2}} & \cdots & \frac{\partial y_{1}}{\partial x_{n}} \\ \frac{\partial y_{2}}{\partial x_{1}} & \frac{\partial y_{2}}{\partial x_{2}} & \cdots & \frac{\partial y_{2}}{\partial x_{n}} \\ \vdots & \vdots & & \vdots \\ \frac{\partial y_{m}}{\partial x_{1}} & \frac{\partial y_{m}}{\partial x_{2}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}}\end{array}\right] ?x?y?=????????x1??y1???x1??y2????x1??ym????x2??y1???x2??y2????x2??ym????????xn??y1???xn??y2????xn??ym??????????

需要将y中的元素对x中的元素一一求导,那么求导结果是 m × n m\times n m×n 个元素,然后确定结果的形状, y , x \mathbf{y},\mathbf{x} y,x均为向量, y \mathbf{y} y 纵向拉, x \mathbf{x} x横向拉。

case2 向量内积形式求导

结果等于另一个向量,很重要,建议直接背!
y = a T x \mathbf{y}=\mathbf{a}^T\mathbf{x} y=aTx
? y ? x = a \frac{\partial \mathbf{y}}{\partial \mathbf{x}}=\mathbf{a} ?x?y?=a, ? y ? a = x \frac{\partial \mathbf{y}}{\partial \mathbf{a}}=\mathbf{x} ?a?y?=x

case3 二次型

y = x ? A x y=\mathbf{x}^{\top} \mathbf{A} \mathbf{x} y=x?Ax
注意,这里的y是一个标量,这个x是一个n维的列向量,A矩阵是n维的方阵
? y ? x = ( A + A T ) b \frac{\partial y}{\partial \mathbf{x}}=(A+A^T)\mathbf{b} ?x?y?=(A+AT)b

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 23:22:47  更:2022-04-01 23:24:33 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 0:36:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码