IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【机器学习】(李宏毅)3-误差、梯度下降Notes -> 正文阅读

[人工智能]【机器学习】(李宏毅)3-误差、梯度下降Notes

误差

误差来自哪

误差一般来自bias(偏差)和variance(方差)
偏差与方差这个链接里写的比较详细
最主要就是理解这个图:
在这里插入图片描述

偏差与方差大分别带来的影响

偏差大即欠拟合,一般是模型的设计有问题,需要考虑重新设计模型。
方差大即过拟合,可能是数据量不够导致机器会去学习某些不普遍的特征,从而导致过拟合。

交叉验证

交叉验证 就是将训练集再分为两部分,一部分作为训练集,一部分作为验证集。用训练集训练模型,然后再验证集上比较,确实出最好的模型之后,再用全部的训练集训练模型,然后再用测试集进行测试。
在这里插入图片描述

N折交叉验证

在这里插入图片描述

梯度下降

为什么要梯度下降

要让损失函数的值最小

步骤

  1. 小心调整学习率
    在这里插入图片描述
    红色表示学习率调得刚刚好,那么我们就能达到最低点;
    绿色表示学习率稍大,我们可能就会在两点之间反复横跳,一直找不到最低点;
    黄色表示学习率过大,就可能越找越大。
    当我们的参数超过2维后,我们无法将上图损失值可视化,但我们可以将参数与损失值的变化关系可视化。如下图所示:
    在这里插入图片描述

自适应学习率
一开始是随机生成的点,会离最低点比较远,所以学习率会大,后面慢慢靠近了,学习率就要减小。
学习率不能是一个值通用所有特征,不同的参数需要不同的学习率。
Adagrad 算法
何为Adagrad?即每个参数的学习率都把它除上之前微分的均方根。
此处参考笔记
在这里插入图片描述

随机梯度下降法

损失函数不需要处理所有数据,只需要计算某一个例子的损失函数,就可以进行梯度更新。
在这里插入图片描述
3. 特征缩放
常见的缩放方式
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-21 15:22:26  更:2021-08-21 15:23:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/1 12:35:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码