| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 高阶卷积——卷积神经网络总结 -> 正文阅读 |
|
[人工智能]高阶卷积——卷积神经网络总结 |
高阶卷积——卷积神经网络总结
高阶卷积——卷积的神经网络总结前面我们学习了AlexNet卷积神经网络模型,以及pytorch框架的搭建,根据对卷积神经网络的初步了解,有下列问题: 1、卷积核一定越大越好吗?–3x3卷积核AlexNet中用到了一些非常大的卷积核,比如11x11,5x5的卷积核,从前人们的观念是,卷积核越大,receptive field(感受野)越大,看到的图片的信息就越多,因此获得的特征就越好。虽然这么说,但是大的卷积核会导致参数增加没计算量暴增,不利于模型深度的计算,计算性能也会降低。于是在VGG(最早使用)、inception网络中,利用两个3x3的卷积核的组合比一个5x5的卷积核的效果更佳,同时参数量(3x3x2+1 VS 5x5x1+1)被降低,因此后来3x3的卷积核被广泛应用在各种模型中。 下图是用一个3x3的卷积核做两次卷积示意图: 2、每层卷积只能用同一尺寸的卷积核吗?–Inception结构传统的层叠式网络,基本上都是一个个卷积层堆叠,每层只用一个尺寸的卷积核。例如:VGG结构中使用了大量的3x3卷积层,事实上,同一层feature map 可以分别使用多个不同尺寸的卷积核,已获得不同尺寸的特征,再把这些特征结合在一起,得到的特征往往比使用单一的卷积核要好,谷歌的GoogleNet,或者说Inception系列的网络,就使用了多个卷积核结构 最初版本的Inception结构如上图所示,一个输入的feature map 分别同时经过1x1(不改变宽高,但是改变输出通道数,达到通道的扩张或者压缩的效果),3x3 ,5x5 的卷积核处理,得到的特征在结合在一起,获得更加的特征。 3、怎样才能减少卷积层的参数? --Bottleneck如下图所示:加入1x1卷积核的Inception结构:
4、越深的网络越难训练吗?Resnet残差网络
具体的结构如下图
5、深度不是最重要,Block(通道数)更重要,–Wide Resnet
6、 通道信息是否也具有局部性 --ResNext通道信息是否也具有局部性?换句话说,在处理通道时,我们是不是可以像处理长宽一样,不把所有信息考虑在内,像下面这张图这样?在ResNet模型中,坐着提出了Cardinality这个概念,他表示了通道分成的组,假如说,我们本来有这样一段模型结构“
但是随之而来的一个问题是——通道毕竟不同于长和宽,两者有明确的物理意义上的局部性,而通道的局部性却是人为想象出来的,因此这种做法缺少一定的说服力,到底要怎样处理通道这一维度呢? 7、通道信息是否具有局部性?分组卷积(group convolution)---- ResNext下图是一个正常的,没有分组卷积的结构,下面用第三维的视角展示了CNN的结构,一个Filter(卷积核)就对应了一个channel(输出通道数)。随着网络层数的加深,通道数急剧增加,而空间维度随之减少(H,W),因为卷积层的卷积核越来越多,但是随着卷积池化操作,特征图越来越小(越卷越小嘛)。所以在深层网络中,channel的重要性越来越大。
这个时候,如果我们做的分组卷积,就要影院来的组归一化GN。进行归一化。 到目前为止,所有的变形,都在控制参数 8、分组卷积能否对通道进行随机分组? – ShuffleNet有关group conv的解决方案也在不断探索中,其中ShuffleNet做出了一定的尝试。下图是直接从它的论文中截取的,可以从图(b)中看出,在完成一次group conv之后,通道的顺序会发生一定的变化。作者并不是让相近的几个通道一直做信息的汇集,而是不断地交换相邻的通道,从某种意义上,这样得到的通道融合会更加地均匀。 9、卷积操作时必须同时考虑通道和区域吗?–DepthWise操作—mobile-net
Xception网络就是基于上面的问题发明而来的,我们首先对每一个通道进行各自的卷积操作,有多少个通道,就有多少个过滤器,得到新的通道feature map之后,这时在对这批新的通道feature map进行标准的1x1跨通道卷积操作,这种操作被认为“DepthWise convolution” 缩写“DW” 我们来看一下参数变化:
参数缩减到原来的九分之一。 前面我们考虑的都是参数的问题,下面我们来考虑准确率的问题。 10、通道间的特征都是平等的嘛? --SEnet已经有很多工作在空间维度上来提升网络的性能,那么很自然的想到,网络是否可以从其他层面来考虑去提升性能,比如考虑特征通道之间的关系?
11、noisystudentnoisystudent模型是一种半监督模型,具体方法如下
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 18:43:45- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |