| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> BAM: Bottleneck Attention Module -> 正文阅读 |
|
[人工智能]BAM: Bottleneck Attention Module |
BAM: Bottleneck Attention Module
给定输入特征图,BAM得到一个3D attention map?,经过改进后的特征图通过下式得到 其中表示element-wise mulplication。首先通过两个不同的分支分别计算通道注意力和空间注意力,然后通过下式计算最终的attention map?
其中是sigmoid函数。注意,两个分支的输出需要先resize成,然后再进行相加。 通道分支的计算方法对于输入特征图,首先是通过全局平均池化得到向量,文中提到:"This vector softly encodes global information in each channel?"。然后接含一层隐藏层的MLP,即两层全连接层,为了减少额外的参数开销,隐藏层的size设置为,r是reduction ratio,第二个FC再还原回去,这里和SElayer是一样的操作。最后再接一个BN层。 空间分支的计算方法空间分支得到一个spatial attention map??to emphasize or suppress features in different spatial locations. 具体步骤为:input feature map?,首先经过1×1卷积映射到一个低维空间,这里的r和通道分支的相同;然后经过两层3×3卷积,注意为了增大感受野这里的3×3卷积采用了膨胀卷积dilated convolution;然后再使用1×1卷积映射到;最后再接一个BN层。 合并两个分支的结果然后需要融合两个分支的结果,在融合之前需要先将两个分支的结果都expand成,这里融合采用的是element-wise summation,然后接sigmoid函数得到最终的attention map。然后将与输入进行element-wise mulplication,再与相加就得到了最终结果refined feature map?。这里借鉴了residual的shortcut结构。 CIFAR-100消融实验Dilation value and Reduction ratio
论文最终采用dilation value=4, reduction value=16的配置。 Separate or Combined branches
虽然channel和spatial分支都可以提升模型的效果,但结合起来后效果的提升幅度更大。 Combining methods 同样是表(b)中的结果,可以看到,sum的效果最好 Comparison with placing orginal convblocks
作者为了证明BAM带来的效果提升并不是添加了额外的层导致模型更深的作用,因此作者把添加的BAM换成模型原本的block,然后比较两者的效果,从表中结果可以看出,BAM的效果更好。因此得到结论:BAM带来的效果提升并不是因为模型深度的增加,而是BAM本身的结构和注意力机制带来的。 Bottleneck: The efficient point to place BAM
这个实验比较了放置BAM的不同位置,bottlenecks or convolution blocks,结果证明,将BAM放在bottleneck位置可以带来更好的效果并且更少的参数。 官方代码
注意论文中是在每个分支的最终输出加上BN,而在代码中是中间的每一层卷积或是全连接层后都添加BN+ReLU,而最后一层BN和ReLU都不加。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 21:39:58- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |