| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Feature Boosting Suppression and Diversification for Fine-Grained Visual Classification论文阅读与复现 -> 正文阅读 |
|
[人工智能]Feature Boosting Suppression and Diversification for Fine-Grained Visual Classification论文阅读与复现 |
Feature Boosting, Suppression, and Diversification for Fine-Grained Visual Classification??这是一篇2021年放在arxiv上面的一篇关于细粒度识别的文章,提出了两个新颖的模块,称之为:FBSM特征增强和抑制模块,FDM特征融合模块。经验证、效果显著! 论文地址: https://arxiv.org/abs/2103.02782 Github地址: https://github.com/chaomaer/FBSD 机构:National Key Laboratory for Novel Software Technology Nanjing University, Nanjing 210023, China 论文阅读1.问题动机??从有区别的局部区域学习特征表示在细粒度视觉分类中起着关键作用。利用注意力机制提取零件特征已经成为一种趋势。然而,这些方法有两个主要的局限性:首先,它们通常只关注最显著的部分,而忽略了其他不明显但可区分的部分。其次,他们孤立地对待不同的零件特征,而忽略了它们之间的关系。 2.解决思路??通过引入两个轻量级模块,它们可以很容易地插入到现有的卷积神经网络中。一方面,引入了一个特征增强和抑制模块FBSM,该模块增强特征图中最显著的部分以获得特定于零件的表示,并抑制它以迫使后续网络挖掘其他潜在零件。另一方面,引入了一个特征多样化模块,它从相关的部件特定表示中学习语义互补的信息。结构图如下; 2.1FBSM??首先是从主干网络中的某一特定的层输出的特征图X开始,送入FBSM模块,具体来说: 3、然后跟上自适应的平均池化层进行压缩空间维度信息,使每一部分的空间高和宽大小变为1 × 1 、得到每一部分的重要性因子。 6、再使用torch.repeat_interleave函数将宽维度上的size恢复到输入到FBSM时的size。
??In short, the functionality of FBSM can be expressed as:
F
B
S
M
(
X
)
=
(
X
b
,
X
s
)
FBSM(X)=(X_b,X_s)
FBSM(X)=(Xb?,Xs?). Given feature maps X, FBSM outputs part-specific feature and potential feature maps 2.2FDM??看论文看的头大,还是看代码理解的更容易理解。下面结合代码讲述一下FDM的工作原理。
2、将得到的通道注意力送入FDM模块(进行特征的融合,即多样化处理),注意注意力向量两两结合的方式,1和2、1和3、2和3。最后可以得到两张注意图相互之间互补的信息。
??注意论文里面有这样一句话,我想可以这样理解:
Y
p
1
p
2
Y{^{p_2}_{p_1}}
Yp1?p2??表示P1相对于P2的互补信息,那么
Y
p
2
p
1
Y{^{p_1}_{p_2}}
Yp2?p1??表示P2相对于P1的互补信息,确实有点绕啊,但是却很好的表达了特征和融合的思想。
4、对上一步得到的增强后的特征图进行分层池化(TopK)
5、最后进行线性分类
至此结束! 论文复现1.环境
2.运行程序??修改config.py文件里的参数,然后运行:
2.1Resnet50主干??bs=20,epoch=200 2.2Densenet161主干??bs=10,epoch=265 3.训练得到的精度与论文里的比较
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 20:46:24- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |