| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 改善深层神经网络:超参数调试、正则化以及优化(二)- 优化算法 -> 正文阅读 |
|
[人工智能]改善深层神经网络:超参数调试、正则化以及优化(二)- 优化算法 |
本次学习笔记主要记录学习深度学习时的各种记录,包括吴恩达老师视频学习、花书。作者能力有限,如有错误等,望联系修改,非常感谢! 改善深层神经网络:超参数调试、正则化以及优化(二)- 优化算法
第一版???????2022-05-23????????初稿 一、Mini-batch 梯度下降(Mini-batch gradient descent)
X的维数是(nx,m),Y的维数是(1,m),向量化能够相对较快的处理所有m个样本,m足够大处理速度仍慢,此时先让梯度下降法处理一部分,算法速度会更快。 可以把训练集分割为小一点的子集训练,这些子集被取名为mini-batch。x(1)到x(1000)取出来,称为X{1},以此类推。 (i)表示训练集里的值,(l)表示神经网络的层数,{t}表示不同的mini-batch。 上述为“一代(1 epoch)”的训练,一代意味着只是一次遍历了训练集。想要多次遍历训练集,还需为另一个while循环设另一个for循环,可以一直遍历训练集,直到最后能收敛到一个合适精度。 二、理解mini-batch梯度下降法(understanding mini-batch gradient descent)
mini-batch梯度下降法,不是每次迭代都是下降的,但走势向下,如图右。噪声产生的原因在于也许X{1}和Y{1}是比较容易计算的mini-batch,因此成本会低一些。每个mini-batch的计算难度不确定,因此出现这些摆动。 如图紫为随机梯度下降,蓝为batch梯度下降。绿色mini-batch大小设在两者之间。 mini-batch中,X{t}和Y{t}要符合CPU/GPU内存。 三、指数加权平均数(Exponentially weighted averages)
四、理解指数加权平均数(Understanding exponentially weighted averages)
五、指数加权平均的偏差修正(Bias correction in exponentially weighted averages)
六、动量梯度下降法(Gradient descent with Momentum)
若要优化成本函数,如图,红点代表最小值的位置,从蓝色开始梯度下降法,较大学习率则会成紫线。 在纵轴希望慢些,不要摆动;在横轴,希望加快学习,就用到了动量梯度下降法。 七、RMSprop
在第t次迭代中,该算法会照常计算当下mini-batch的微分dW、db,,用到新符号S_dw。如图W2数是针对这一整个符号的,这样做能保留微分平方的加权平均数。接着RMSprop会这样计算:W:=W-α(dW/根号下S_dW)、b:=b-α(db/根号下S_db)。 八、Adam 优化算法(Adam optimization algorithm)
首先,初始化;在第t次迭代中,计算微分用当前的mini-batch计算dW和db;接着计算Momentum指数加权平均数(这里β1,后边用β2);RMSprop计算;一般使用Adam算法时,要计算偏差修正;最后更新权重和b值。 九、学习率衰减(Learning rate decay)
要慢慢减少学习率α的话,在初期的时候,α学习率还较大,你的学习还是相对较快, 十、局部最优的问题(The problem of local optima)
但一个具有高维度空间的函数(图右),若梯度为0,那么在每个方向可能是凸函数,也可能是凹函数。高维度空间,更可能碰到鞍点。导数为0称鞍点。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/1 23:31:26- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |