IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 空洞卷积+转置卷积+反卷积 -> 正文阅读

[人工智能]空洞卷积+转置卷积+反卷积

1. 空洞卷积

在这里插入图片描述

  • 1.1 如上图所示,空洞卷积是为了增加感受野(pooling虽然能增加感受野,但是容易丢失原有信息);
  • 1.2 实现原理:
    • 图a为普通3*3卷积(注:该卷积也可视为空洞率=1的空洞卷积,见以下说明);
    • 图b是空洞率=2的空洞卷积,即向原有卷积核前中后都插入一个权重为0的格子;此时卷积核变为77,但是有值的格子还是只有原来的33;
    • 图c是空洞率=4的空洞卷积,情况如图b;
  • 1.3 空洞卷积的应用:如下是在语音里的应用(Dilation=2即空洞率为2)
    在这里插入图片描述
  • 1.4 补充:pooling容易丢失信息
    在这里插入图片描述

2. 转置卷积

  • 转置卷积是用来将卷积后的输出还原到输入的,但是只是shape上的还原,不是真正的完全还原,以下说明
  • 假设我们的输入 A ( s h a p e = 4 ? 4 ) A(shape=4*4) A(shape=4?4),卷积核 B ( s h a p e = 3 ? 3 ) B(shape=3*3) B(shape=3?3),普通卷积(no padding & stride=1)后得到形状为2*2的输出;
  • 实际计算该过程时,有一种方式是采用矩阵的形式进行处理的(还有其他更高效的方式);具体是对A reshape得到1*16,B根据计算需要,会变为16*4的矩阵(称为Toeplitz matrix,简记为 T T T矩阵),那么 A ? T = C = 1 ? 4 A*T=C=1*4 A?T=C=1?4,reshape C的形状为2*2
  • 如下示例3x3卷积核变成的T矩阵(注意下图是转置后的,即4x16)是什么样的,感兴趣的读者可以自行推导一下该矩阵方式计算的结果是否和概念上的普通卷积结果一致;
    在这里插入图片描述
  • 采用矩阵形式计算卷积,那么还原的过程就很自然了。输出的shape为2*2,将之reshape为 1*4,再与T矩阵的转置(4*16)进行矩阵计算,即可得到1*16,再reshape为4*4,就和原始输入A有一样的shape了;
  • 显然上一步不保证能得到真正的原始输入A;因为上述卷积的矩阵计算是 A ? T = C A*T=C A?T=C,此时对等式两边都乘以 T ( s h a p e = 16 ? 4 ) T(shape=16*4) T(shape=16?4)矩阵的转置 T ′ ( s h a p e = 4 ? 16 ) T'(shape=4*16) T(shape=4?16),变为 A ? T ? T ′ = C ? T ′ A*T*T'=C*T' A?T?T=C?T,如果 A ? T ? T ′ = C ? T ′ = A A*T*T'=C*T'=A A?T?T=C?T=A成立,那么要求 T ? T ′ = I T*T'=I T?T=I I I I为单位矩阵,显然不一定成立;

3. 反卷积

  • 举例如下
    普通卷积(no padding & stride=1)
    卷积
    对应反卷积(注意需要扩充)
    在这里插入图片描述
    普通卷积(padding & stride=2),
    在这里插入图片描述
    对应反卷积(注意需要扩充)
    在这里插入图片描述
  • 从最后一张图,可以看到反卷积需要对输入进行扩充(填充空洞);空洞卷积则是对卷积核进行扩充;从效果上看,反卷积减少了卷积核的视野,空洞卷积则增强了卷积核的视野;
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-07 11:11:01  更:2022-05-07 11:14:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/4 15:54:31-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码