IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 梯度下降法的原理 -> 正文阅读

[数据结构与算法]梯度下降法的原理

之前一直就只知道朝着负梯度的方向走就能降Loss,却不知道是为什么,今天看了人工智能的课才明白了。

首先假设损失函数 f ( x ) f(x) f(x),下一步 x x x的移动方向与距离 Δ x \Delta{x} Δx,则有移动后的损失 f ( x + Δ x ) f(x+\Delta{x}) f(x+Δx),我们来思考怎样能让损失降低,也就是使得 f ( x + Δ x ) < f ( x ) f(x+\Delta{x})<f(x) f(x+Δx)<f(x)

首先对 f ( x + Δ x ) f(x+\Delta{x}) f(x+Δx)泰勒展开:
在这里插入图片描述
f ( x ) f(x) f(x)移到左边可得:
在这里插入图片描述
其中, ? f ( x ) \nabla{f(x)} ?f(x) f ( x ) f(x) f(x)的一阶导数
其中,左边也就是移动前后的损失差值

目标是使得差值为负,且尽可能小,也就是损失下降得越多越好
也即希望右边 < 0 <0 <0,且越小越好
我们看右边:
两个向量相乘=模相乘* c o s θ cos\theta cosθ
在这里插入图片描述
所以 arg ? min ? Δ x f ( x + Δ x ) ? f ( x ) = arg ? min ? Δ x ∥ ? f ( x ) ∥ ∥ Δ x ∥ c o s θ \mathop{\arg\min}\limits_{\Delta{x}}f(x+\Delta{x})-f(x)=\mathop{\arg\min}\limits_{\Delta{x}}\left \| \nabla{f(x)} \right \|\left \| \Delta{x} \right \|cos\theta Δxargmin?f(x+Δx)?f(x)=Δxargmin??f(x)Δxcosθ
其中,模必 > = 0 >=0 >=0,因此,为了使其为负且最小化, c o s θ cos\theta cosθ负且最小,而 c o s θ cos\theta cosθ就是参数变化的方向( Δ x \Delta{x} Δx和梯度 ? f ( x ) \nabla{f(x)} ?f(x)方向的夹角)。

要使得 c o s θ cos\theta cosθ为负且最小,即当 θ = π \theta=\pi θ=π,取最小值 c o s π = ? 1 cos\pi=-1 cosπ=?1

Δ x \Delta{x} Δx ? f ( x ) \nabla{f(x)} ?f(x)的夹角为 π \pi π,即取负梯度方向时,右边能取到最小值。

最终,

∥ Δ x ∥ \left \| \Delta{x} \right \| Δx是一个标量,x移动的大小,我们可以看成学习率 α \alpha α,最终,上式变为:
在这里插入图片描述
也就是说,取梯度的负方向,再根据学习率调整步长,就能降低损失

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-05-06 11:13:30  更:2022-05-06 11:15:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 0:22:53-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码