IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 从深度学习到CNN,RNN入门笔记 -> 正文阅读

[人工智能]从深度学习到CNN,RNN入门笔记

超级参数:手动输入的产生。
曼哈顿距离 是绝对值
欧氏距离 平方
损失值: 当前的权重,拟合是好还是不好,损失值越低越好,拟合越逼。

梯度下降:
从山上往下下降,沿着下降速度最陡峭的方向下降。
梯度方向:是当前值上升的方向的反方向。 负导数。
步长:太大,容易错过最低点。错过最优解。
太小,时长太长。
在这里插入图片描述
bachsize 批处理
一次传进来一张图像,更新参数,图像本身可能有问题,噪音,标注问题等。
1张图像数据传进来,未必会导致参数朝正确的方向更新。
bachsize 一次传进来一批数据,通过计算其平均更新方向,然后再去更新数据。这样更确保参数朝着正确的方向更新。

在这里插入图片描述

学习率:
在这里插入图片描述
学习率 通常需要调节的低一些
高学习率 会导致 不收敛
学习率偏低一些,尽管速度慢,但是会照着loss下降的方向
刚开始 学习率 偏大一些 ,随着迭代次数的增加,缩小学习率。
epoch 值 5w个数据 1次批处理100 epoch需要500次。

外循环 epoch
内循环batch size

神经网络分为三部分: 前向传播 反向传播 参数更新

链式法则
从后往前,一步一步去做求导
在这里插入图片描述
反向传播,遵循链式法则,层层求导
绿色是正向传播
红色是反向传播
在这里插入图片描述
在这里插入图片描述

神经网络:
X和W组合 算 得分值,和 实际值 做差 算 损失值,加上R 对权重参数惩罚,得到最后的损失函数,反向传播更新参数。
在这里插入图片描述

神经网络特点:
第一个特点:层次结构
输入层 小猫图像
隐藏层 猫的特征:眼睛,耳朵,爪子等 提取特征
输出层
神经网络会进行特征的自动提取。直接拿取原始的数据
特征工程: 针对数据,进行特征提取。

3 4 4 1
3个到4个,通过权重参数矩阵,进行转换。
4为中间隐藏的特征。
全链接层,将输入转换成特征。
第二个隐藏层又进行了下一步的特征提取。

第二个特点: 非线性
通过激活函数进行
在这里插入图片描述

中间神经元 是 特征提取 可以进行 维度的变换

中间神经元 是 1的时候,相当于 1组 权重参数 1个特征
中间神经元 是 2的时候,相当于 2组 权重参数 2个特征
中间神经元 是 3的时候,相当于 3组 权重参数 3个特征

针对非常难分割的数据,提升 中间隐藏层个数就 可以分割开
提升空间维度,每个维度上的映射不一样,把这个系统在高纬度空间就可展开了

神经网络缺点: 容易过拟合,缺乏泛化性。

过拟合:
最左边的图,就是过拟合,为了满足个别离群点,异常点,从而改变了分割结果。
在这里插入图片描述
模型越平稳,越好,泛化能力强。
增加 惩罚权重参数。
栏目大 调大栏目大值 增大惩罚项。
在这里插入图片描述
越多的神经元 过拟合的风险越高。

激活函数:
Sigmoid函数
在这里插入图片描述
中间 出现 某层 导函数 为 0,后面传递就废了,全都为0了。
无法满足神经网络的需求。

ReLU激活函数
梯度不会消失
计算简单
在这里插入图片描述

数据预处理:
在这里插入图片描述
原始数据 进行 中心化处理 通过减去 均值
归一化 除以 标准差

sklearn专门库 在处理数据不大情况下,足够了。

权重系数,初始化————高斯初始化
在这里插入图片描述

drop_out: 防止神经网络过拟合 的操作措施
训练的时候,使用部分神经元,测试的时候,使用全部神经元。
图中打叉神经元就不更新了,不进行反向传播和参数更新了。
drop_out是随机选择神经元保存。比如:每一层保存60%的神经元,剩余不更新。
目的是防止过拟合。
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-23 11:28:02  更:2021-09-23 11:28:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 12:49:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码