IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> CNN -学习笔记 -> 正文阅读

[人工智能]CNN -学习笔记

卷积神经网络和传统网络的区别:
数据是三维矩阵
整体架构:
输入层
卷积层(提取特征)
池化层(压缩特征)
全连接层
即:卷积层负责提取图像中的局部特征;池化层用来大幅降低参数量级(降维);全连接层类似传统神经网络的部分,用来输出想要的结果。

卷积层

在这里插入图片描述
可以由RGB的概念作为理解:假设一个5x5x3的网络,由RGB三层堆叠在一起,R层为1,B层为2,G层为3。则最终得到结果为6。
(把三个通道的数据叠加在一起)
对每个区域来说,做特征提取,得到特征值。在这里插入图片描述
具体计算如上图:

(7x7x3:每层是7x7大小的,一共有三层)
Filter:卷积计算的权重。
Bias:相当于初始化每一层的特征值,在权重计算过后要加上初始化值,才能得到每层的特征值。

可以理解为使用一个卷积核来过滤图像的各个小区域,从而得到这些小区域的特征值。

特征图个数

特征图个数 = 卷积核个数
可以采用不同的卷积核,这样就会得到许多特征值,得到许多特征图,从而丰富特征值。
可以认为,每个卷积核代表了一种图像模式,如果某个图像块与此卷积核卷积出的值大,则认为此图像块十分接近于此卷积核。

滑动窗口步长

步长太大,会导致有些数据不会重复计算,会有疏漏;
步长太小,有些数据重复计算数据大,重复区域面积大。
可以通过下图感知区别:

卷积核尺寸

卷积核越大看到的图片信息越多,因此获得的特征越好
普遍使用3x3的卷积核。
大的卷积核带来的参数量和计算量也会较大,小的卷积核是可以替代大的卷积核的,比如3个3x3卷积核来代替7x7卷积核,使用了2个3x3卷积核来代替5x5卷积核。
总的来说小卷积核的好处有:

  • 减少计算量和参数量,加快模型训练;
  • 可以添加更多卷积层,增强非线能力。

边缘填充

如果不使用边缘填充,会发生:输入图像与卷积核进行卷积后的结果中损失了部分值,输入图像的边缘被“修剪”掉了,这是因为边缘上的像素永远不会位于卷积核中心,而卷积核也没法扩展到边缘区域以外。
为解决这个问题,可以在进行卷积操作前,对原矩阵进行边界填充(Padding),也就是在矩阵的边界上填充一些值,以增加矩阵的大小,通常都用“0”来进行填充的。

池化层

作用:数据降维,避免过拟合。
之所以这么做的原因,是因为即使做完了卷积,图像仍然很大(因为卷积核比较小),所以为了降低数据维度,就进行下采样。
总结:池化层相比卷积层可以更有效的降低数据维度,这么做不但可以大大减少运算量,还可以有效的避免过拟合。

最大池化

选择最大池化的原因:特征值越大,表示越符合特征。
在这里插入图片描述

平均池化

在与最大池化的残酷战斗中惨烈败下阵来。因为容易被不符合的数据拉后腿…

全连接层

作用:输出结果
经过卷积层和池化层降维过的数据,全连接层才能”跑得动”,不然数据量太大,计算成本高,效率低下。
最后把矩阵转换为可以被全连接层计算的向量层。(贼拉长

计算

卷积结果计算公式

在这里插入图片描述

卷积参数共享

在这里插入图片描述

参考资料:
计算与理解:https://www.bilibili.com/video/BV1S64y1z7iX?p=68
卷积、填充、步长:https://zhuanlan.zhihu.com/p/77471866
代码学习:https://blog.csdn.net/weixin_43597287/article/details/97387801
https://zhuanlan.zhihu.com/p/112829371

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-26 12:06:37  更:2021-08-26 12:07:55 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 22:33:52-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码