IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> ResNeXt、DesseNet、CSPNet网络模型总结 -> 正文阅读

[人工智能]ResNeXt、DesseNet、CSPNet网络模型总结

ResNeXt

在网络架构设计层面,常见的几种提升网络性能的方法:

  1. 网络的宽度width:每层卷积的输出通道数
  2. 网络的深度depth:网络的层数
  3. 网络的分辨率resolution:输入图像的分辨率大小
  4. 网络的增长率growth:随着层数的增加,每层卷积输出通道数的增长比例
  5. 网络的特征复用:如DenseNet可以使用更浅的网络,更少的参数,提升特征复用,达到与深度网络相当的性能
  6. 高效特征融合:InceptionNet的split-transforms-merge模式,将输入分别使用不同的转换分支提取特征,然后将多个分支的结果进行合并实现特征融合

ResNeXT借鉴了VGGNet、ResNet中连续堆叠多个相同或相似block的特性,以及借鉴InceptionNet中split-transforms-merge对特征进行高效融合的特性。

?????????如上图所示,右图在卷积核的大小,以及输出通道数量上做了设计,使得左右两种结构在参数量和浮点运算量方面相当。右图中,将原本ResNet中的一条分支扩展程32条分支,并且每条分支是完全相同的,最后将各分支的输出结果相加。上右图的网络结构与下图网络结构是等价的:

?????????ResNeXt网络在每个分支中使用了bottleneck的结构,也就是先使用1x1卷积进行降维,减少特征图的通道数,然后再进行分组卷积等提取体征,最后再使用1x1卷积进行升维,还原特征图的通道数。ResNeXt中每个block可以表示如下:

????????C代表block中分支的数量,T_i代表每个分支的子网络,x表示short-cut连接。

基数cardinality:在ResNeXt中,将上述block中的分支数量称作基数,并且认为基数和网络的宽度width、深度depth同等重要,这一点在DenseNet网络中也可以看出,DenseNet是将基数发挥到极致。

ResNeXt涉及的相关工作及概念

多分支卷积网络:ResNeXt中使用了多分支的子网络进行特征融合

分组卷积:ResNeXt中,使用分组卷积来控制网络的参数量和浮点计算量

压缩卷积网络:不同于常见的以损失模型精度为代价的压缩方法,ResNeXt使用多分支的分组卷积等操作,在控制模型参数量和浮点计算量的前提下,还能进一步提升模型的表达能力

集成算法:由于使用了多分支的子网络进行特征融合,这种操作类似于集成学习方法,不同于集成学习方法的是,ResNeXt中各个分支是完全相同的

ResNeXt与Inception-ResNet的关系

ResNeXt中block的每个分支是完全相同的结构,不需要进行特殊的设计,在Inception-ResNet中,block的每个分支是不同的,经过精心设计的。并且,在ResNeXt中,各个分支的结果使用加法进行合并。

ResNet50与ResNeXt50网络模型对比:

????????上表中的ResNeXt在block内部采用的是分组卷积的方式来实现多分支处理。其中,C=32表示在block中有32个分支或者32组分组卷积,d=4表示在block中的每个分支处理4个通道的输入数据,或者说每个分组卷积处理4个通道的输入。

Pytorch版本中ResNeXt的block结构如下:

?????????可以看到,在128 x 4 x 3 x3卷积部分,将128个通道的输入分成了32组,每组处理4个通道,每组输出4个通道,然后将32组的输出结果concat得到输出的128个通道。


DenseNet

????????鉴于ResNet等网络使用shot-cut来实现特征的融合,以及缓解梯度消失问题,DenseNet将这种shot-cut的思想发挥到极致,将网络每个Block中前面层所有分辨率相同的feature map进行融合,而不仅仅只融合上一层的feature map,所以DenseNet每个Block中网络层级之间具有L * (L + 1)/2个连接,所以网络起名叫DenseNet。并且,不同于ResNet的shot-cut采用加法运算,DenseNet采用concat进行feature map的连接。用公式表示如下:

????????DenseNet中,第i层的输入与第i层的输出做concat,作为第i+1层的输入,这就要求输入和输出的分辨率保持不变,就是不做下采样操作,下采样操作在transition层进行。

????????像上图这样,每一层都可以利用全面所有层学习得到的结果,在使用同样参数量的情况下,特征的重复利用率更高,不需要再进行重复的特征学习。同样的,这种密集连接方式也有利于网络的训练。

DenseNet的网络结构如下:

DenseNet包含以下模块:

Block模块:DenseNet将整个网络划分成多个Block,每个Block里面包含多个conv+BN+Relu的操作,Block内部不做下采样操作(包括卷积下采样和池化下次采样),并且对卷积操作做padding填充,所以这些操作输出相同分辨率大小的feature map,所以在每个Block内部各层的feature map是可以进行concat融合的,在Block模块内部,设置每个卷积层的卷积核数量k,叫做Growth Rate,每层卷积的输入通道为前面所有层的通道数求和k0+(l-1)k ,输出通道数为k

转换模块:在Block之间的层叫做转换层,转换层使用conv+BN+max pooling完成下采样操作。

瓶颈层Neck:为了进一步提升每个Block模块中卷积操作的效率,在进行每次conv+BN+Relu之前,使用1x1卷积先将输入的feature map在通道维度上进行降维,将原本通道数为k0+(l-1)k 的输入特征图的通道数减少到4k,然后在此基础上进行conv+BN+Relu操作。使用瓶颈层的DenseNet叫做DenseNet-B

通道压缩模块:为了继续降低计算量,提升速度,原本的转换模块使用conv+BN+max pooling完成下采样操作,降低feature map的分辨率大小,在压缩模块,进一步对feature map的通道数进行压缩,假设原本的通道数为m,经过压缩之后的通道数变为θmθ∈[0, 1] 。使用通道压缩的DenseNet叫做DenseNet-C。同时使用瓶颈层和压缩层的叫做DenseNet-BC。

Pytorch版本中DenseNet的部分dense block结构如下:?

?????????真是将Dense发挥到极致!!!


CSPNet???【CSPNet 解读】一种增强CNN学习能力的新型骨干网络_AI 菌的博客-CSDN博客_csp net有什么用

以DenseNet为例,DenseNet中,后面层的输入是前面层的输出做concat之后得到的,如下:

????????在使用后向传播更新参数时,后面层会包含前面层的梯度,如下:

????????其中f代表参数更新函数,g表示每一层的梯度,可以看出由于后面层的输入中包含前面层的输出,所以后面层计算的梯度也会包含前面层的梯度。这种就导致了梯度计算的重复,对此进行优化可以对模型进一步加速,因此,此种优化方式适用于使用short-cut的网络,比如DenseNet,ResNet, ResNeXt等。

?

CSPNet思想

????????在原本DenseNet中,前面层的feature map全部传入后面层作为输入,在CSPNet中,将前面层的feature map在通道上一分为二,一部分输入到后面层,一部分直接通过short-cut的方式连接到transition层,这样可以缓解一部分的梯度信息重复计算问题,从而减少模型的计算量和显存占用

Cross Stage Partial DenseNet

????????上图是在DenseNet上应用CSP的示意图。

????????传统的DenseNet中,第i层的输入与第i层的输出做concat,作为第i+1层的输入,这就要求输入和输出的分辨率保持不变,就是不做下采样操作,下采样操作在transition层进行。

????????在CSPDenseNet中,将输入特征数据在通道维度上划分为 输入到DenseNet中, 直接在transition层与DenseBlock的输出在通道维度上做concat。在CSPDenseNet的transition层,先将Dense Block的输出结果 经过一个conv卷积操作,然后和 进行concat得到 ,输入到另一个conv卷积操作得到

????????上述图(b)中CSPDenseNet的前向推理过程如下:

????????参数更新过程如下:

????????经过上述改进之后,CSPDenseNet将原来DenseNet中对于全部feature map的重复梯度计算降低了一半,因为另一半x0' 的feature map不在经过Dense Block,直接送入了transition层。所以这种网络结构叫做Cross Stage Partial DenseNet,就是跨Stage的部分的DenseNet。

????????在CSP结构中,几种不同的特征融合变体,其中Fusion Last效果最好:

????????CSP结构用于ResNeXT网络:

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 23:22:47  更:2022-04-01 23:25:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 0:24:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码