GhostModule

论文地址： https://arxiv.org/abs/1911.11907
论文名称：GhostNet
如下图，作者在实验过程中将ResNet50的第一个残差组的feature map进行可视化，发现里面有三对feature map（如下图中的红绿蓝三对feature map）它们极其相似，作者认为这些feature map对之间是冗余的（相关的）在这里插入图片描述
作者考虑到这些feature map层中的冗余信息可能是一个成功模型的重要组成部分，正是因为这些冗余信息才能保证输入数据的全面理解，所以作者在设计轻量化模型的时候并没有试图去除这些冗余feature map，而是尝试使用更低成本的计算量来获取这些冗余feature map。
在这里插入图片描述
上图为一个普通卷积。一部分是Intrinic，而另外一部分是可以由 intrinsic 通过cheap operations来生成的，因为本来就是由intrinsic feature maps 生成的，所以肯定会有很多的冗余信息，所以称其为 ghost feature maps。

Ghost Module：
第一步: 少量卷积（比如正常用32个卷积核，这里就用16个，从而减少一半的计算量）
第二步：cheap operations，如图中的 $Φ$ 表示， $Φ$ 是诸如3x3 或 5x5的卷积，并且是逐个特征图的进行卷积（Depth-wise convolutional）。

相关代码：

class GhostModule(nn.Module):
    def __init__(self, inp, oup, kernel_size=1, ratio=2, dw_size=3, stride=1, relu=True):
        super(GhostModule, self).__init__()
        self.oup = oup  
        # oup：GhostModule的输出通道数
        init_channels = math.ceil(oup / ratio) 
         # 图中黄色部分的通道数，通过ceil函数进行向上的取整，然后通过ratio计算黄色通道的占比
                                               
        new_channels = init_channels*(ratio-1)  
        #output红色部分的通道数（整体减去黄色即为红色通道）

        self.primary_conv = nn.Sequential(      
            nn.Conv2d(inp, init_channels, kernel_size, stride, kernel_size//2, bias=False),
                                                
            nn.BatchNorm2d(init_channels),
            nn.ReLU(inplace=True) if relu else nn.Sequential(),
        )

        self.cheap_operation = nn.Sequential(   
            nn.Conv2d(init_channels, new_channels, dw_size, 1, dw_size//2, groups=init_channels, bias=False),
                                                
            nn.BatchNorm2d(new_channels),
            nn.ReLU(inplace=True) if relu else nn.Sequential(),
        )

    def forward(self, x):
        x1 = self.primary_conv(x)
        x2 = self.cheap_operation(x1)
        out = torch.cat([x1,x2], dim=1)                                                         
        return out[:,:self.oup,:,:]

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-16 22:21:38 更:2022-03-16 22:23:41

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/29 12:10:37-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码