开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【李宏毅机器学习2021】Task03 误差和梯度下降 -> 正文阅读

[人工智能]【李宏毅机器学习2021】Task03 误差和梯度下降

【李宏毅机器学习2021】本系列是针对datawhale《李宏毅机器学习-2022 10月》的学习笔记。本次是对误差和梯度下降的学习总结。本节通过视频学习到对模型调优中面临的系列问题，李宏毅老师列出常见问题树状图，从train的loss开始，到test loss问题，引出训练中的问题并讲解原因，介绍改进方法。

误差和梯度下降

误差和梯度下降

在输入各种数据求得方程的过程中，必不可少的就是让方程计算的y和实际y相差最小，就是loss。从loss入手解决模型问题。?

解决loss问题的大纲如下~

Train data loss

?Model Bias

?模型参数选择的太简单就会导致loss下降过低，可以尝试增加模型复杂度，让模型更具有弹性。有更好的适应性让训练loss下降。

Optimization?

在做梯度下降操作不当也会导致loss不下降的情况。

?如何判断优化问题还是Bias问题？

首先强调一下，并不是说你的模型loss降不下去就是过拟合问题。在train阶段可不是这样。

在相同的模型下，减少模型的复杂度，比如100层见到50层看看情况，loss是不是下降的更好。如果更好，可以这样想，100层网络后面50层什么都不做，完全可以达到一样的效果，为什么loss不下降，只能说明是优化器的问题。?因此在无法判断的时候可以采用上述方法定位问题到底在哪里。

后面会介绍opt问题如何解决。

Testing data loss

当然下图是最理想的路线，希望大家的模型都会如期进行啦~

?Overfitting

过拟合在训练过程中往往是一个让人头痛的问题……不过也有办法处理。如何判断over fitting呢？就是你训练集loss很低，但是trainingloss高的离谱，这就是overfitting问题。

?产生的原因是拟合的函数与实际函数相差过大，但在训练时以为训练数据的原因导致数据匹配到曲线上误认为模型鲁棒性很好。

?可以加入更多数据，保证模型的准确性?。在学习阶段不建议扩充数据集，建议对数据按照逻辑进行变换扩充。例如楼下猫猫。

?为了减少模型弹性解决办法综述如上：

这里还一个问题，就是模型的复杂性和loss这里有些矛盾。模型不能太简单，训练效果不好，模型不能太复杂，会过拟合。

?这里为了解决这个办法大家肯定会选一个在测试集loss低一些的模型，但是有可能是因为测试集效果因为模型恰好匹配这里的数据。一般比赛会将数据分为公共和私用两个测试集。可能你在公共得了高分并不一定在私用也是高分……这个也可以推广到其它问题，比如你在A数据集分数很高，但是迁移后就不行了，可能并不具有很好的普适性……