| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> 你的模型又过拟合了?不如试试L1、L2正则 -> 正文阅读 |
|
|
[人工智能]你的模型又过拟合了?不如试试L1、L2正则 |
|
导读 因为L1正则化、L2正则化是为了缓解模型过拟合而提出的,所以在这之前,我们先说一说什么是过拟合以及欠拟合。
正则化 正则化是机器学习中对原始的损失函数基础上引入额外信息,以防止过拟合和提升模型泛化性能的一类方法的统称。这里,常用的额外信息一般就是L1正则化和L2正则化,也叫做L1范数和L2范数。 L1正则化和L2正则化是损失函数里的额外惩罚项,就是就是对损失函数中的某些参数做一些限制,不让模型学习的过于复杂。对于我们上边举例的线性回归,线性回归 + L1 正则化 = Lasso回归,线性回归 + L2 正则化 = Ridge回归(岭回归)。其损失函数分别如下:
公式中ω是模型的参数,可以看到这两项正则化其实是对模型参数做了限制:
从式子(1) (2)可以看出,模型的训练目标是要最小化损失函数,如果我们在损失函数中加了L1正则化和L2正则化,那也就意味着,模型的参数也要尽可能的小(接近于0),即稀疏化。简单说一下稀疏化,稀疏化说白了就是模型参数很多都为零,不起作用。通常在机器学习中,我们做分类任务,数据的特征维度是很高的,有可能是10K+级别,那么多特征,并不是所有的都对我们做分类有帮助,因此我们就希望模型在训练过程中能自动找到对其分类有帮助的那些特征,忽略不重要的特征(即该特征对应的权重接近于零甚至等于零),这样一套组合拳打下来,模型只关注对应参数比较大的特征,忽略参数小的特征,相当于进行了一次自动的特征选择,提高模型的泛化能力,降低过拟合的风险。以上情况尤其针对样本数较小的情况。 L1正则化 前边说了正则化就是给损失函数加上约束项,从数学的角度来说就是给损失函数附加带约束条件,如式 (3) 所示。这样的话,问题就转变成了带约束条件的优化问题,立即推 ------>>>>>运用拉格朗日函数求解,如式 (4) 所示。 L2正则化 前边说完了L1正则化,同理,L2正则化只是约束条件的形式变了而已,由于L2正则化是平方和,所以它的函数图像画出来就是个圆形,如图所示。既然相比于L1正则化抹去了棱角,变得更加圆滑,那其与原始损失函数相交使得参数为零的概率就要变小好多,因此L2正则化不具备稀疏化的能力的原因。 拟合过程中通常都倾向于让权值尽可能小,最后构造一个所有参数都比较小的模型。因为一般认为参数值小的模型比较简单,能适应不同的数据集,也在一定程度上避免了过拟合现象。可以设想一下对于一个线性回归方程,若参数很大,那么只要数据偏移一点点,就会对结果造成很大的影响;但如果参数足够小,数据偏移得多一点也不会对结果造成什么影响,专业一点的说法是抗扰动能力强。 总结 这篇文章主要讲解了什么是过拟合以及欠拟合,以及正则化,又详细介绍了L1和L2正则化,并通过公式推导以及画图的形式生动地揭示了它们对模型进行稀疏化以及防止过拟合的内在原因。希望能够帮助到大家,谢谢浏览。如果有想法和疑问,欢迎大家评论区交流,觉得博主写的还行,对自己有帮助,可以给个赞呦。赠人玫瑰,手留余香~~ |
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年10日历 | -2025/10/29 16:41:18- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |