IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> CNN-卷积核大小是奇数的原因 -> 正文阅读

[人工智能]CNN-卷积核大小是奇数的原因

绝大多数卷积核的大小尺寸都是奇数,类似最常见的3×3、5×5等,那么为什么不会出现2×2或者4×4大小的卷积核呢?

卷积核的最大作用就是将输入的图像数据提取成特征的形式并输出,关键就是提取操作。我们假设输入的图像数据是 n × n n\times n n×n的,且不是彩色图片,也就是它的通道数为1。设卷积核的大小为 m × m m \times m m×m,这里我们可以看到,卷积核和输入都是方阵。设卷积核在输入数据上的移动步长 s s s,padding操作的大小为 p p p,由此我们能得到经过卷积操作后输入的特征大小为 q q q q q q满足:
q = f l o o r ( n + 2 p ? m s + 1 ) q = floor(\frac{n+2p-m}{s}+1) q=floor(sn+2p?m?+1)
floor是向下取整函数,使用此公式我们可以计算输出矩阵的大小。

padding的中文意思是填充,这个操作是在卷积前的数据周围填充数据,从而改变卷积后的数据大小。一般情况下,这个操作可以分为三种,他们分别是same convolution、valid convolution、full convolution,他们在中文中分别叫:相同连接、有效连接和全连接,这个是deep learning中给出的。
valid convolution指的是不对卷积前的数据做padding操作,即给什么数据,卷积什么数据。这种操作不能无限卷积,因为每次卷积后的数据大小都会缩小。
same convolution是对卷积前的数据做padding操作,添加一些数据,使得添加后的数据经过卷积操作后大小和卷积前的数据大小相同。这种操作支持无限次数的卷积。
full convolution也是对卷积前的数据做padding操作,但是它添加数据的目的不是为了使得卷积前后数据大小相同,而是让原数据中每个像素点都能在每个方向上都能被访问k次,同时,输出的图像宽度为n+m-1。
通常最优的填充数量在same 和valid之间。

padding操作是在原数据的两端补充0元素,从而使得经过卷积后的数据规模不会变小。一般情况下步长 s s s取值都是1,而我们想要的卷积前的数据大小和卷积后的数据大小一样,那么就有:
n = n + 2 p ? m + 1 p = 2 m ? 1 2 n=n+2p-m+1\\ p = \frac{2m-1}{2} n=n+2p?m+1p=22m?1?
所以,要想在原数据的两端都补充数据,那么必须要让卷积核的大小 m m m是一个奇数才行。只有 m m m是奇数时, p p p才能是一个整数,这样才能在卷积前数据的两端都补充同样的数据。

第二个原因就是卷积核作为一个特殊的结构,当大小为奇数的时候,方便我们确定卷积核的位置,一般情况下,卷积核在源数据上的移动是以卷积核的中心点作为基准的,这个中心点非常重要。
其实这个解释感觉很牵强,因为当卷积核是偶数大小的时候,我们完全可以使用左上角或者右上角的数据作为基准来移动。至于为什么这个解释存在,个人认为应该是从实验中可以找到答案,卷积核大小为奇数的时候的学习效果会比卷积核大小为偶数的时候的学习效果好。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-10-31 11:56:46  更:2022-10-31 11:59:15 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 21:50:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码