IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 跟李沐学AI-动手学深度学习-权重衰退+Dropout -> 正文阅读

[人工智能]跟李沐学AI-动手学深度学习-权重衰退+Dropout

权重衰退

是最广泛使用的正则化的技术之一。

使用均方范数作为硬性限制

通过限制参数值的选择范围来控制模型容量。

?通常不限制偏移b（因为限制与不限制的差别不大）。

小的θ意味着更强的正则项。

使用均方范数作为柔性限制

对于每个θ，都可以找到λ使得之前的目标函数等价于下面

可以通过拉格朗日乘子来证明。

超参数λ控制了正则项的重要程度。

λ=0：无作用。

λ->是?，w*->0。

参数更新法则

计算梯度

时间t更新参数

通常在下ηλ <1，在深度学习中通常叫做权重衰退。

?总结

权重衰退通过L2正则项使得模型参数不会过大，从而控制模型复杂度。
正则项权重是控制模型复杂度的超参数。

?Dropout(丢弃法)

会比上述的权重衰退效果更好一些。

动机

一个好的模型需要对输入数据的扰动鲁棒。

使用有噪音的数据等价于Tikhonov正则。

丢弃法：在层之间加入噪音。（随机噪音）

无偏差的加入噪音

对x加入噪音得到x'，我们希望

丢弃法对每个元素进行如下扰动

?

?使用丢弃法

通常将丢弃法作用在隐藏全连接层的输出上。

?

?推理中的丢弃法

正则项只在训练中使用：他们影响模型参数的更新。

在推理过程中，丢弃法直接返回输入。

这样也保证确定性的输出。

总结

?丢弃法将一些输出项随机置0来控制模型复杂度。
常作用在多层感知机的隐藏层输出上。
丢弃概率是控制模型复杂度的超参数。

?

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2021-09-11 18:48:52 更:2021-09-11 18:49:19

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/28 9:05:27-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码