IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文学习:Fully Attentional Network for Semantic Segmentation -> 正文阅读

[人工智能]论文学习:Fully Attentional Network for Semantic Segmentation

Fully Attentional Network for Semantic Segmentation

1. 摘要+引言

问题

通过压缩空间维度或通过压缩通道的相似图来描述沿通道或空间维度的特征关系,这种做法往往会沿着其他维度压缩特征依赖关系,从而导致注意力缺失,这可能导致小/薄类别的结果较差或大对象内部的分割不一致。

提出方法

全注意力网络 (FLANet),将空间注意力和通道注意力编码在单个相似度图中,同时保持高计算效率。对于每个通道图,我们的 FLANet 可以通过一个新颖的全注意力模块从所有其他通道图以及相关的空间位置中获取特征响应。

基本思想

在计算通道注意力图时利用全局上下文信息接收空间响应,从而在单个注意力单元中实现全注意力,计算效率高。具体来说,我们首先使每个空间位置能够从具有相同水平和垂直坐标的全局上下文中获取特征响应。其次,我们使用自注意力机制来捕获任意两个通道图和相关空间位置之间的完全注意力相似性。最后,通过整合所有通道图和相关全局线索之间的特征,使用生成的完全注意力相似性来重新加权每个通道图。
(The basic idea is to。。。。Specifically, we first。。。。Second, we use 。。。。Finally, the generated fully attentional similarities are)

2. Method

主干网络

(1)主干网络:ResNet-101 (He et al. 2016) and HRNetV2-W48 (Sun et al. 2019)。
(2)FLA作用于主干网络的最后特征层:输出特征图放大到输入图像的 1/8。输入图像由主干网络处理以生成特征图 X。之后,我们首先在 X 上应用卷积层以降低通道维度并获得特征图 Fin。然后,特征图 Fin 将被送入全注意力块 (FLA) 并生成新的特征图 Fo,该特征图聚合了所有维度的非局部上下文信息。最后,将密集的上下文特征 Fo 发送到预测层以生成最终的分割图。

Fully Attentional Block

在这里插入图片描述
如上图:共有三个计算支路:
(1) construction:见上图:利用全局平均池化结果作为全局上下文先验,将空间交互引入通道 NL 机制,池化核大小:H1,1W。Qw 和 Qh 分别表示水平和垂直方向的全局先验,它们将用于实现相应维度的空间交互。此外,我们沿 H 维切割 Qw,从中我们可以生成一组大小为 RC×W 的 H 切片。类似地,我们沿 W 维度切割 Qh。然后我们合并这两组以形成最终的全局上下文 Q ∈ R(H+W)×C×S。
(2) K: 沿着H维度切割,然后沿着W维度切割,将它们聚合形成特征K ∈ R(H+W )×S×C
(3) V: 沿着H维度切割,然后沿着W维度切割,将它们聚合形成特征K ∈ R(H+W )×S×C
Affinity 操作
在这里插入图片描述
然后我们在 A 和 V 之间执行矩阵乘法,以使用生成的全注意力更新每个通道图。之后,我们将结果重新整形为两组,每组的大小为 RC×H×W(即合并的逆运算)。我们将这两组相加以形成远程上下文信息。最后,我们将上下文信息乘以尺度参数 γ,并对输入特征图 Fin 进行元素求和运算,得到最终输出 Fo ∈ RC×H×W,如下所示:

在这里插入图片描述
值得注意的是,与通过将来自同一位置的空间信息相乘来探索通道相关性的传统 Channel NL 方法不同**,FLA 实现了不同空间位置之间的空间连接,**即,利用单个注意图。通过这种方式,我们的 FLA 具有更全面的上下文视图,并且对不同的场景更加稳健。此外,构建的先验表示带来了全局感受野,有助于提高特征辨别能力。
(It is noted that different from 。。。。。 which。。。our FLA enables 。。。。。In this way, our FLA
has。。。。。Moreover, the constructed prior representation brings a global receptive field and helps to boost the feature discrimination ability.)

Complexity Analysis:复杂性分析
(1) Spatial NL:O((HW )2C)
(2) Channel NL:O(C2HW )
(3) FLA block:O(C2(H + W )S)

3. Experiments:

数据集: Cityscapes (Cordts et al. 2016)、ADE20K (Zhou et al. 2017) 和 PASCAL VOC (Everingham et al. 2009)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
值得注意的是,FLA 的参与特征图比 Channel NL 的更结构化和更详细。例如,所有图像都会突出显示远处的极点和对象边界。特别是,FLA 还可以区分不同的类别,例如第三排的公共汽车和汽车。这些可视化结果进一步表明,全注意力模块可以捕获空间相似性并将其编码到通道注意图中以实现完全注意。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-03 10:48:33  更:2022-07-03 10:49:52 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/29 10:11:01-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计