IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 分组卷积、SEnet模块、CBAM模块 -> 正文阅读

[人工智能]分组卷积、SEnet模块、CBAM模块

分组卷积、SEnet模块、CBAM模块

一、分组卷积

1、分组卷积的目的

分组卷积的目的是:类似于并行计算,通过分组卷积,降低参数的个数,从而提高模型效果。

2、分组卷积的过程

在高阶卷积部分我们简单的介绍了分组卷积机动原理,这里我们详细的看一看,我们还是从下图进行分析:
在这里插入图片描述
上面的图片中,左边的是传统的卷积机制,右边的是分组卷积机制,我们对比着看
首先你要有如下概念,这个概念贯穿分组卷积的全过程,说多少遍也不为过。

这里我们定义:
输入输出的高:H ,卷积核高:h1
输入输出的宽:W , 卷积核宽:w1
这两个都是空间维度
通道数:C
重点来了,一定要熟记于心:

  • 输入C(输入通道数) = kernel C(卷积核通道数)
  • kernel 个数 = out C (输出通道数)

我们先来看左边的,常规的卷积过程:
左边的是输入,右边的是输出,输入输出的H,W相同
分析卷积的过程,计算出参数的个数使我们的目的:

分析:
1、参数的个数等于什么?

  • 参数的个数 = 一个卷积核的一个通道有多少参数 x 一个卷积核的通道数 x 卷积核的个数

2、一个卷积核的一个通道的参数 = h1 x w1
3、一个卷积核的通道数 = 输入的通道数 = C1
4、卷积核的个数 = 输出通道数 = C2

参数总个数Q = h1 x w1 x C1 x C2

接下来,我们再看分组卷积的过程:
首先你要知道,所谓的分组分的是谁?

  • 是把原图即输入按照通道切分成g组。

同样,左边的是输入,右边的是输出,输入输出的H,W相同,但是这里我们定义了一个新的参数

定义:分成的组数 = g

分析卷积的过程,计算出参数:

分析:
1、参数的个数等于什么?

  • 每一组参数的个数 x 组数

2、每一组参数的个数等于什么?

  • 每一组参数的个数 = 一个卷积核的一个通道有多少参数 x 每一组一个卷积核的通道数 x 每一组卷积核的个数

3、一个卷积核的一个通道的参数 = h1 x w1
4、每一组一个卷积核的通道数 = 输入的通道数/z组数 = C1/g
5、每一组卷积核的个数 = 输出通道数的个数/组数 = C2/g
故:
参数总个数 = h1 x w1 x C1/g x C2/g x g = h1 x w1 x C1/g x C2 = Q/g

两种卷积方式的参数对比可得,分组卷积的参数个数仅仅为不分组的1/g,降低了参数的个数。

二、SEnet

SEnet相当于一个模块,这个模块可以嵌入到任何一个网络结构中,下面我们就来看一下这个模块都能作什么是事情。
简单的来书,就是行提高通道注意力上来提高模型效果。

已经有很多工作在空间维度上来提升网络的性能,那么很自然的想到,网络是否可以从其他层面来考虑去提升性能,比如考虑特征通道之间的关系?
我们的工作就是基于这一点并提出Squeeze-and-Excitation Networks(简称SENet)。在我们提出的结构中Squeeze和Excition是两个非常关键的操作,所以我们以此来命名。
我们的机动是希望显示的建模特征通道之间的相互依赖的关系。另外,我们不打算引入一个新的空间维度来进行特征通道之间的融合,而是采用一种全新的特征重标定策略,具体的说:就是通过学习的方式来自动获取到每个特征通道的重要程度,然后通过这个重要程度取提升有用的特征并抑制对当前任务用处不大的特征

在这里插入图片描述

说白了就是说每一个通道的特征都有一个权值在里边。决定了通道特征的重要程度。
给定一个输入X,特征通道数为C_1,通过一系列卷积等一般变换后,得到一个特征通道数为C_2的特征,与传统的CNN不一样的是,接下来我们通过三个操作来重标定前面得到的特征。
第一步:
Squeeze操作,我们顺着空间维度来进行特征压缩,将每个二维的特征通道变成一个实数,这样,这个实数某种程度上具有全局的感受野,并且输出的维度特输入的特征通道数相匹配。他表征着在特征通道上相应的全局分布,而且使得靠近输入的层也可以获得全局的感受野,这一点在很多任务中都是非常有用的
第二步:
Excitation操作,他是一个类似于循环神经网络中门的机制,通过参数w,为每个特征通道生成权重,其中参数w被学习用来显示的建模特征通道之间的相关性
第三步:
Reweight操作,我们将Excitation的输出的权重看做是通过特征选择后
的每个特征通道的重要性,然后通过乘法逐通道加权到向前的特征上,完成在通道维度上的对原始特征的重标定。
55

下面看一下代码的实现,会更明白一些,这里是

这里引用
在这里插入图片描述

看代码:

class SELayer(nn.Module):
    def __init__(self,channel,reduction = 16):
        super(SELayer, self).__init__()
        #均值池化,用来压缩
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        #全连接层,加权重
        self.fc = nn.Sequential(
            nn.Linear(channel,channel // reduction,bias=False),
            nn.ReLU(True),
            nn.Linear(channel // reduction,channel,bias=False),
            #归一化映射到0~1
            nn.Sigmoid()
        )
        
    def forward(self, x):
        b,c,_,_, = x.size()
        y = self.avg_pool(x).view(b,c)
        y = self.fc(y).view(b,c,1,1)
        return x * y.expand_as(x)

然后就是怎们把这个模块添加到网络中:作为网络中的一个组件放到网络中去

在这里插入图片描述
在这里插入图片描述
参考知乎文章:
https://zhuanlan.zhihu.com/p/65459972

三、CBAM

根据SEnet又有人做出了改进,产生了CBAM,他据他又是什么样的机制呢。

参考知乎文章:
https://zhuanlan.zhihu.com/p/102035273

他和SEnet很像,不同的是他的目的是保留的是空间上的维度,消除深度(通道),第一步操作时,他是对每一个通道进行两个池化,均值和最大值池化,这样池化以后就得到了2通道的特征,且特征的空间维度不变,然后在对这两个通道做一个1x1的卷积,目的是压缩通道,编程单通道。在作为组件添加到网络中,具体还是看代码。

在这里插入图片描述
通道注意力机制:在这里插入图片描述空间注意力机制
在这里插入图片描述
加到网络中
在这里插入图片描述
在这里插入图片描述
最后的使用一个类进行两个模块的集成,得到的通道注意力和空间注意力以后,使用广播机制对原有的feature map进行信息提炼,最终得到提炼后的feature map。以上代码以ResNet中的模块作为对象,实际运用可以单独将以下模块融合到网络中:
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-26 11:31:25  更:2022-02-26 11:31:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 3:04:12-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码