IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 卷积与转置卷积的关系,pytorch里的转置卷积(反卷积)ConvTranspose2d的计算过程图解及转置卷积计算公式理解 -> 正文阅读

[人工智能]卷积与转置卷积的关系,pytorch里的转置卷积(反卷积)ConvTranspose2d的计算过程图解及转置卷积计算公式理解

前言

在我们用深度学习做图像处理需要上采样操作时,目前比较常用的两种上采样方式
一是转置卷积
二是PixelShuffle

这里先谈一下转置卷积的实现过程。谈到转置卷积肯定得与卷积联系起来,在pytorch中卷积类的参数如下:

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

这些都是我们很熟悉的卷积参数:

  • in_channels:输入的通道数
  • out_channels:输出的通道数
  • kernel_size:卷积核大小
  • stride:步长
  • padding:对输入进行填充
  • dilation:卷积核的空洞
  • groups:卷积的分组
  • bias:卷积结果后添加的偏置
  • padding_mode:填充的类型

在pytorch中转置卷积的类torch.nn.ConvTranspose2d参数如下:

torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)

可以看到pytorch中转置卷积的参数与卷积的参数一模一样!说明它们之间肯定是有联系的,在进行转置卷积操作时首先对输入的每行每列之间填充(stride-1)行(列)的0,然后再对填充的输入的外围填充(kernel_size-1)圈的0,然后再用旋转180°的卷积核对填充后的输入进行步长为1卷积,如果padding不等于0,则对卷积后的结果的外围进行去除padding圈,如果output_padding不等于0,则还需要对最后的结果右侧和下方填充output_padding的0.下面用图形来详细说明转置卷积的计算过程。

转置卷积图解

为了更好的验证结果的正确性,这里用torch.nn.functional.conv_transpose2d来进行结果的验证。

torch.nn.functional.conv_transpose2d(input, weight, bias=None, stride=1, padding=0, output_padding=0, groups=1, dilation=1) → Tensor

这里主要讨论kernel_size,stride,padding与output_padding对转置卷积结果的影响。

卷积核大小对转置卷积的影响

卷积核大小对转置卷积的影响主要是对输入的填充多少圈0——(kernel_size-1)圈
下面通过对kernel_size=2和kernel_size=3来进行验证。

kernel_size=2,stride=1,padding=0,output_padding=0

下面是用于转置卷积的输入与卷积核及转置卷积后的结果:
输入
输入
转置卷积核
卷积核
结果
结果
图形解释其过程:由于卷积核的大小为2,所以先对输入外围填充2-1=1圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积(步长始终为1)操作。
图1

kernel_size=3,stride=1,padding=0,output_padding=0

输入还是和之前一样,转置卷积核为下图所示:
在这里插入图片描述
转置卷积的输出结果:
在这里插入图片描述
图形解释其过程:由于卷积核的大小为3,所以先对输入外围填充3-1=2圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1)。
在这里插入图片描述

padding对转置卷积结果的影响

padding对转置卷积结果的影响主要体现在对转置卷积得到的结果进行去除

kernel_size=3,stride=1,padding=1,output_padding=0

输入
在这里插入图片描述
转置卷积核
在这里插入图片描述
结果
在这里插入图片描述
图形解释其过程:由于卷积核的大小为3,所以先对输入外围填充3-1=2圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1),又由于padding=1,所以对卷积得到的结果的最外一层去掉(这正好与卷积里的padding的用法相反,卷积里的padding是对输入进行填充)。
在这里插入图片描述

kernel_size=3,stride=1,padding=2,output_padding=0

输入和卷积核还是和上面一样,只是将padding设为2.
结果
在这里插入图片描述
图形解释其过程:由于卷积核的大小为3,所以先对输入外围填充3-1=2圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1),又由于padding=2,所以对卷积得到的结果的最外两层去掉
在这里插入图片描述

步长stride对转置卷积结果的影响

步长stride对转置卷积的影响主要体现在对输入进行0填充,输入的每行每列之间填充stride-1的0.
输入
在这里插入图片描述
转置卷积核
在这里插入图片描述

kernel_size=2,stride=2,padding=0,output_padding=0的结果

在这里插入图片描述
图形解释其过程:由于步长stride=2,则需对输入的每行每列之间填充2-1=1的0。又由于卷积核的大小为2,所以还需对输入外围填充2-1=1圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1)。
在这里插入图片描述

kernel_size=2,stride=3,padding=0,output_padding=0的结果

在这里插入图片描述
图形解释其过程:由于步长stride=3,则需对输入的每行每列之间填充3-1=2的0。又由于卷积核的大小为2,所以还需对输入外围填充2-1=1圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1)。
在这里插入图片描述

out_padding对转置卷积结果的影响——对输出填充0

out_padding对转置卷积的影响是对卷积得到的结果的右侧和下方进行0填充(注意stride的大小必须大于out_padding的大小)
输入
在这里插入图片描述

转置卷积核

在这里插入图片描述

kernel_size=2,stride=2,padding=0,output_padding=1的结果

在这里插入图片描述
图形解释其过程:由于步长stride=2,则需对输入的每行每列之间填充2-1=1的0。又由于卷积核的大小为2,所以还需对输入外围填充2-1=1圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1),又由于out_padding=1,所以还需对卷积得到的结果的右侧和下方进行1列/行的0填充。
在这里插入图片描述

kernel_size=2,stride=3,padding=0,output_padding=2的结果

输入和卷积核还是和上面一样,不过由于stride的大小必须大于out_padding的大小,所以stride设为3.输出如下
在这里插入图片描述

图形解释其过程:由于步长stride=2,则需对输入的每行每列之间填充2-1=1的0。又由于卷积核的大小为2,所以还需对输入外围填充2-1=1圈的0,然后用旋转180°的卷积核对填充后的结果进行常规卷积操作(步长始终为1),又由于out_padding=2,所以还需对卷积得到的结果的右侧和下方进行2列/行的0填充

在这里插入图片描述

转置卷积计算公式理解

有了上面的分析,对pytorch官方文档给出的转置卷积的计算公式就不难理解了。
假设输入的大小为 H × W H\times W H×W,这里只考虑对 H H H的影响,首先,由于参数sttride的影响需要对输入的每行每列之间填充(stride-1)行或列的0,则输入 H H H的大小变为 H + ( s t r i d e ? 1 ) × ( H ? 1 ) = ( H ? 1 ) × s t r i d e + 1 H+(stride-1)\times (H-1)=(H-1)\times stride+1 H+(stride?1)×(H?1)=(H?1)×stride+1,又由于参数kernel_size的影响需要对输入的外围填充 k e r n e l _ s i z e ? 1 kernel\_size-1 kernel_size?1圈的0,则输入的大小变为 ( H ? 1 ) × s t r i d e + 1 + 2 × ( k e r n e l _ s i z e ? 1 ) (H-1)\times stride+1+2\times (kernel\_size-1) (H?1)×stride+1+2×(kernel_size?1),接下来进行的是步长为1的常规卷积操作,则由卷积的计算公式有: ( H ? 1 ) × s t r i d e + 1 + 2 × ( k e r n e l _ s i z e ? 1 ) ? k e r n e l _ s i z e + 1 = ( H ? 1 ) × s t r i d e + 1 + ( k e r n e l _ s i z e ? 1 ) (H-1)\times stride+1+2\times (kernel\_size-1)-kernel\_size+1=(H-1)\times stride+1+(kernel\_size-1) (H?1)×stride+1+2×(kernel_size?1)?kernel_size+1=(H?1)×stride+1+(kernel_size?1),由于padding与out_padding的存在需要对卷积后结果的去除或填充,则:
( H ? 1 ) × s t r i d e + 1 + ( k e r n e l _ s i z e ? 1 ) ? 2 × p a d d i n g + o u t _ p a d d i n g (H-1)\times stride+1+(kernel\_size-1)-2\times padding+out\_padding (H?1)×stride+1+(kernel_size?1)?2×padding+out_padding.这就是pytorch官方文档给的转置卷积计算公式,当然这里没考虑dilation.

总结

这篇文章主要说明了转置卷积里的参数kernel_size, stride, padding, out_padding对转置卷积结果的影响。其中前两个参数影响输入的填充,后两个参数影响卷积后结果的去除或填充。总之,转置卷积还是卷积,只不过对输入和输出进行某些处理而已。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-03 11:10:51  更:2021-08-03 11:11:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 15:19:55-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码