| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 卷积核的类型及其作用 -> 正文阅读 |
|
[人工智能]卷积核的类型及其作用 |
目录 一、堆叠小卷积核1.为什么要用大卷积核代替小卷积核?
2.为什么堆叠小卷积核参数量要比大卷积核少?
3.输入输出图片通道数一致时堆叠小卷积核参数量才更小这是为什么呢?
????????这就是解释了为什么很多网络的第一层使用的都是7×7的大卷积核接受输入图片,因为网络开头使用小卷积核进行下采样参数量会更大。 4.感受野计算感受野的计算是迭代计算 感受野计算公式: 1个5×5卷积:RF = 5 2个3×3卷积:RF = 3+(3-1)×1 = 5 1个7×7卷积:RF = 7 3个3×3卷积:RF = 3+(3-1)×1+(3-1)×1 = 7 ? 二、空洞卷积:能否让固定大小的卷积核看到更大范围的区域?????????标准的3×3卷积核只能看到对应区域3×3的大小,但是为了能让卷积核看到更大的范围,dilated conv使其成为了可能。pooling下采样操作导致的信息丢失是不可逆的,这不利于像素级任务,用空洞卷积代替pooling的作用(成倍的增加感受野)更适用于语义分割。 ????????举例:ASPP ????????关于空洞卷积感受野的计算请见:空洞卷积 三、非对称卷积:卷积核一定是正方形吗?将标准3×3卷积分成一个1×3卷积和3×1卷积,在不改变感受野大小的情况下可减少计算量 标准卷积计算量:9×9 = 81次乘法 非对称卷积计算量:3×15+3×9 = 72次乘法 注意:非对称卷积用在分辨率为12-20大小的特征图上效果会比较好 标准卷积与非对称卷积感受野对比 四、深度可分离卷积五、分组卷积:卷积只能在同一组进行吗?????????组卷积是对输入特征图进行分组,每组分别进行卷积。假设输入特征图的尺寸为C*H*W(12×5×5),输出特征图的数量为N(6)个,如果设定要分成G(3)个groups,则每组的输入特征图数量为C/G(4),每组的输出特征图数量为N/G(2),每个卷积核的尺寸为(C/G)*K*K(4×5×5),卷积核总数仍为N(6)个,每组的卷积核数量为N/G(2),每个卷积核只与其同组的输入特征图进行卷积,卷积核的总参数量为N*(C/G)*K*K,可见,总参数量减少为原来的1/G。 ? ? ? ? 举例:ResNext ? ? ? ? 缺点:分组点卷积某个通道仅来自一小部分输入通道,阻止了信息流动,特征表示 ? ? 分组卷积能否对通道进行随机分组????????? ? ? ? ? 为达到特征之间的互相通信,除了采用dense pointwise convolution,还可以使用channel shuffle。如图b所示,就是对group convolution之后的特征图进行“重组”,这样可以保证下面的卷积其输入来自不同的组,因此信息可以在不同组之间流转。图c进一步的展示了这一过程,相当于“均匀的打乱”。 ? ? ? ? 举例:ShuffleNet ? ? 六、拓展卷积:每层卷积只能用一种尺寸的卷积核吗?????????传统的层叠式网络,基本上都是一个个卷积层的堆叠,每层只用一个尺寸的卷积核,例如VGG结构中使用了大量的3×3卷积层。事实上,同一层feature map可以分别使用多个不同尺寸的卷积核,以获得不同尺度的特征,再把这些特征结合起来,得到的特征往往比使用单一卷积核的要好,为了尽可能的减少参数,一般先用1×1的卷积将特征图映射到隐空间,再在隐空间做卷积。 七、通道注意力:通道间的特征都是平等的吗?????????无论是在Inception、DenseNet或者ShuffleNet里面,我们对所有通道产生的特征都是不分权重直接结合的,那为什么要认为所有通道的特征对模型的作用都是相等的呢?一个卷积层中往往有数以千计的卷积核,每个卷积核都对应了特征,于是那么多特征要怎区分?这个方法就是通过学习的方式来自动获取到每个特征通道的重要程度,然后依照计算出来的重要程度去提升有用的特征并抑制对当前任务用处不大的特征。 ????????举例:SENet ? 八、可变性卷积:卷积核形状一定是矩形吗?? ? ? ? 规则形状的卷积核(比如一般用的正方形3×3卷积)可能会限制特征的提取,如果赋予卷积核形变的特征,让网络根据label反传下来的误差自动的调整卷积核的形状,适应网络重点关注的感兴趣的区域,就可以提取更好的特征。例如,网络会根据原位置(a),学习一个offset偏移量,得到新的卷积核(b)(c)(d),那么一些特殊情况就会成为这个更泛化的模型的特例,例如图(c)表示从不同尺度物体的识别,图(d)表示旋转物体的识别。 ? ? ? ? 缺点:由于需要计算卷积核的偏移量,故其参数量会有一定增加。 ? ? ? ? 举例:该方法多用于目标检测 九、总结1.卷积核方面
2.卷积层通道方面
3.卷积层连接方面
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 1:43:35- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |