IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 驻点以及二阶导对驻点的判断 -> 正文阅读

[人工智能]驻点以及二阶导对驻点的判断

一、导数知识可以参考?

??????导数、偏导数、梯度、方向导数、梯度下降、二阶导数、二阶方向导数

二、微积分中几种重要的点

1、全局最大值点和全局最小值点

global minimum:在该点的函数值达到最小值。一个函数可能有1个或者多个全局最小值点。

global maximum:在该点的函数值达到最大值。一个函数可能有1个或者多个全局最大值点。

2、局部最小值点和局部最大值点

local minimum:在该点的函数值比周围点的函数值都要小。在附近移动极小步不会使函数值下降。

local maximum:在该点的函数值比周围点的函数值都要大。在附近移动极小步不会使函数值上升。

3、驻点(临界点)和鞍点

critical points / stationary points:对于一元函数,一阶导数为0的点叫做驻点(临界点),对于多元函数,驻点是所有一阶偏导数都为零(梯度向量为零向量)的点。驻点包括三种情况:最小值点(局部/全局)、最大值点(局部/全局)、鞍点。

saddle points:鞍点是驻点的一种情况。如果驻点既不是最小值点也不是最大值点,那么为鞍点。

可参考下图理解一元函数中的驻点的三种情况:

可参考下图理解多元函数的各种鞍点:

马鞍点:(函数z = x_{1}^2-x_{2}^2?中的点(0,0,0))(形状类似马鞍)

另一种鞍点:(函数z = x_{1}^2 +x_{2}^3?中的点(0,0,0))

另外一种鞍点:(函数z = x_{1}^3-x_{2}^3中的点(0,0,0))

??

三、二阶导对驻点(critical points) 的判断

当一阶导数为 0 或者梯度向量为零向量时,该点为驻点,如何判断该驻点是局部最小值点还是局部最大值点还是鞍点呢?我们可以利用二阶导数判断。

1、一元函数:

一阶导数二阶导数点类型
f'(x)=0f''(x)>0最小值点
f'(x)=0f''(x)<0最大值点
f'(x)=0f''(x)=0鞍点或者平线中的一点

一元函数的情况比较容易理解,就不多做解释了。

2、多元函数:

一阶偏导数Hessian矩阵二阶方向导数点类型
\triangledown _{\boldsymbol{x}}f(\boldsymbol{x}) = \boldsymbol{0}所有特征值>0所有二阶方向导数都>0最小值点
\triangledown _{\boldsymbol{x}}f(\boldsymbol{x}) = \boldsymbol{0}所有特征值<0所有二阶方向导数都<0最大值点
\triangledown _{\boldsymbol{x}}f(\boldsymbol{x}) = \boldsymbol{0}

至少有一个特征值>0

并且

至少有一个特征值<0

至少有一个二阶方向导数>0

并且

至少有一个二阶方向导数<0

马鞍点
\triangledown _{\boldsymbol{x}}f(\boldsymbol{x}) = \boldsymbol{0}

非0特征值有相同的方向

并且

至少有一个特征值为0

非0二阶方向导数有相同的方向

并且

至少有一个二阶方向导数为0

鞍点或者是平面上的一点

其中Hessian矩阵是二阶偏导数组成的矩阵,即\boldsymbol{H}_{i,j} = \frac{\partial ^{2}}{\partial _{x_{i}}\partial _{x_{j}}}f(\mathbf{\boldsymbol{x}})

在某一点处,如果二阶偏导数是连续的,那么求导操作是可以互换的,即:\frac{\partial ^{2}}{\partial _{x_{i}}\partial _{x_{j}}}f(\mathbf{\boldsymbol{x}})= \frac{\partial ^{2}}{\partial _{x_{j}}\partial _{x_{i}}}f(\mathbf{\boldsymbol{x}})? 。 也就是:\boldsymbol{H}_{i,j} = \boldsymbol{H}_{j,i}?。

所以该点的Hessian矩阵是对称的。(深度学习里的大多数函数几乎在任意点的Hessian矩阵都是对称的。)

表格中第2列(Hessian矩阵)如何推出第3列(二阶方向导数)的,解释如下:

因为某点处的Hessian矩阵是实对称矩阵,所以可以对该矩阵进行特征值分解 \boldsymbol{H} = \boldsymbol{Q}diag(\boldsymbol{\Lambda })\boldsymbol{Q^{T}}(其中\boldsymbol{Q}是特征向量组成的正交矩阵,diag(\boldsymbol{\Lambda })是对角线为特征值的矩阵),又因为二阶方向导数可以用Hessian矩阵表示为?\boldsymbol{d^{T}Hd}(其中\boldsymbol{d}?为任意单位方向向量)。所以如果?\boldsymbol{d}?是\boldsymbol{H}?的特征向量,那么沿着\boldsymbol{d}方向的二阶方向导数就是相应的特征值。如果?\boldsymbol{d}?不是\boldsymbol{H}?的特征向量,那么沿着\boldsymbol{d}方向的二阶方向导数是\boldsymbol{H}的所有特征值的加权和,和\boldsymbol{d}夹角越小的特征向量有越大的权重。最大的二阶方向导数是?\boldsymbol{H}的最大的特征值,最小的二阶方向导数是?\boldsymbol{H}的最小的特征值。相关特征值分解可以参考特征值分解

表格中第3列(二阶方向导数)如何推出第4列(点类型)的:

我们类比一元函数中对驻点的判断不难想象出二元函数中对驻点的判断,比较难想象的是马鞍点和各种鞍点,可以参考文章中展示出来的二元函数中各种鞍点的3维图像~。三元以及三元以上函数对驻点的判断和二元函数对驻点的判断没有差别。

好,结束,有不正确的地方欢迎各位大佬留言呀~

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-13 21:47:25  更:2022-03-13 21:48:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 17:00:03-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码