| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> 深度学习基础--拟合问题、权重衰减与倒置丢弃法 -> 正文阅读 |
|
|
[人工智能]深度学习基础--拟合问题、权重衰减与倒置丢弃法 |
深度学习基础–拟合问题、权重衰减与倒置丢弃法最近在阅读一本书籍–Dive-into-DL-Pytorch(动手学深度学习),链接:https://github.com/newmonkey/Dive-into-DL-PyTorch,自身觉得受益匪浅,在此记录下自己的学习历程。 本篇主要记录拟合问题(欠拟合与过拟合)以及应对的办法(权重衰减与倒置丢弃法): 拟合问题(欠拟合与过拟合)开始前先介绍欠拟合与过拟合的问题: 对于模型训练中经常出现的欠拟合与过拟合的理解,欠拟合指的是模型无法得到较低的训练误差的现象,即训练误差与泛化误差过高;过拟合指的是模型的训练误差远小于它在测试数据集上的误差的现象,即训练误差远小于泛化误差。 产生欠拟合与过拟合的因素有很多种,目前主要考虑模型复杂度与训练数据集大小这两个因素。给定一个数据集,如果模型的复杂度过低,则容易出现欠拟合现象;如果模型的复杂度越高,则容易出现过拟合现象。给定一个模型,如果数据集样本数量过小,则容易出现过拟合现象,但是泛化误差不会随训练数据集的样本数量增大而增大,因此训练数据集越大,拟合效果越好(不考虑其他限制因素)。 针对上述的过拟合现象而提出的,有学者便提出了权重衰减与倒置丢弃法。 权重衰减在pytorch中,权重衰减可以通过优化器中的 weight_decay 超参数来指定。
原理介绍:
其中w指的是权重参数,b指的是偏差参数。则带有L2范数惩罚项的新损失函数为:
其中λ为超参数,n为样本数。当超参数λ设置为0时,惩罚项完全不起作用;而λ设置越大时,惩罚项在损失函数中的比重也就越大。增加L2范数惩罚项后,权重的迭代方式的变化:
可见,L2范数正则化令权重w先?乘小于1的数,再减去不含惩罚项的梯度。通过约束权重参数的范数来减少过拟合现象。 倒置丢弃法在pytorch中,丢弃法通过在模型中添加Dropout层将以指定的丢弃概率随机丢弃上?层的输出元素;
原理介绍: 由于E(ξi)=1-p,因此:
END! |
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/24 10:02:53- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |