| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 李宏毅《机器学习》丨3. Gradient Descent(梯度下降) -> 正文阅读 |
|
[人工智能]李宏毅《机器学习》丨3. Gradient Descent(梯度下降) |
一、误差来源误差(Error)主要有两个来源:偏差(Bias)和方差(Variance)。
1.1 欠拟合和过拟合简单模型(左边)是偏差比较大造成的误差,这种情况叫做欠拟合,而复杂模型(右边)是方差过大造成的误差,这种情况叫做过拟合。
1.2 模型选择主要是权衡偏差和方差,使得总误差最小。
二、梯度下降为什么需要梯度下降法?
归问题的第三步中,采用梯度下降法对模型进行优化,即解决下面的优化问题: θ ? = a r g ? min ? ? θ L ( θ ) \theta^* = arg\ \underset{\theta}{\operatorname{\min}} L(\theta) θ?=arg?θmin?L(θ)
目标:寻找一组参数 θ \theta θ 使得损失函数最小。(使用梯度下降法解决这个问题) 2.1 调整学习率参数是一维或者二维的时候,可以通过可视化来调整学习率,但是高维的情况就很难可视化。 解决方法:将参数改变对损失函数的影响进行可视化。 2.2 梯度下降法优化
2.3 特征缩放不同特征分布的范围差异很大,使用特征缩放使得不同输入的范围是一样的。 使得不同的特征对于输出的影响相当,便于参数的高效更新。 如下图所示,对每一个维度 i i i(绿色框)都计算平均数,记做 m i m_i mi? ;还要计算标准差,记做 σ i \sigma _i σi? 。然后用第 r r r 个例子中的第 i i i 个输入,减掉平均数 m i m_i mi? ,然后除以标准差 σ i \sigma _i σi? ,得到的结果是所有的维数都是 0,所有的方差都是 1。 三、梯度下降的限制
四、总结Datawhale组队学习,李宏毅《机器学习》Task3. Gradient Descent(梯度下降)。主要包括误差来源、欠拟合和过拟合的判断、梯度下降、调整学习率、梯度下降法的优化以及梯度下降的限制。 参考文献
如果以上内容有任何错误或者不准确的地方,欢迎在下面 👇 留言。或者你有更好的想法,欢迎一起交流学习~~~ 更多精彩内容请前往 AXYZdong的博客 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/30 1:01:49- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |