IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 2022 AAAI | FLANet 全注意力网络用于语义分割 -> 正文阅读

[人工智能]2022 AAAI | FLANet 全注意力网络用于语义分割

?

香港中文大学

Fully Attentional Network for Semantic Segmentation

paper:?https://arxiv.org/pdf/2112.04108.pdf

摘要

????????最近的非局部自注意方法(non-local)已被证明在捕获语义分割的长期依赖关系方面是有效的。这些方法通常形成一个相似的通道特征图(通过压缩空间维度)或空间特征图(通过压缩通道)来描述沿通道或空间维度的特征关系。然而,这种做法倾向于在其他维度上压缩特征依赖性,从而导致注意力缺失,这可能导致小类别的结果较差或大对象内部不一致的分割。为了解决这一问题,文章提出了一种新的方法,即全注意网络(FLANet),在单一相似图的同时编码空间和通道注意,同时保持较高的计算效率。具体来说,对于每个通道图,FLANet可以通过一个新的完全注意模块,从所有其他通道图以及相关的空间位置中获取特征响应。该方法在三个具有挑战性的语义分割数据集上取得了最先进的性能,即在Cityscapes、ADE20K验证集和pascal VOC测试集上分别为83.6%、46.99%和88.5%?的精度。

论文背景? ? ? ?

? ? ? ? 近年来,语义分割模型通过捕获远程依赖关系取得了很大的进展。其中,基于非局部(NL)的方法是主流的。为了生成密集而全面的上下文信息,基于NL的模型利用自我注意机制来探索通道上的相互依赖关系或空间的维度上的依赖关系。FLANet将这两种NL块的变体分别表示为“通道NL”和“空间NL”,这两种变体的架构如下图所示。虽然这些探索对语义分割做出了巨大的贡献,但一个尖锐的问题,即注意力缺失,大多被忽略了。以通道NL为例,通道注意图是由维数为C×HW和HW×C的两个输入的矩阵乘法生成的。可以发现,每个信道都可以与所有其他信道图连接,而空间信息将被整合,在矩阵乘法过程中,每个空间位置都无法感知到其他位置的特征响应。同样,在空间NL中也缺少通道维度之间的相互作用。注意缺失的问题会损害3D上下文信息(CHW)的完整性,因此这两种NL变体只能以互补的方式部分受益。而FLANet在所有维度上生成相似特征图,并利用全局平均池化结果作为全局上下文先验,将空间交互引入到通道NL机制中允许在注意力图中进行充分注意 。

?论文主要思想

????????其基本思想是在计算通道注意图时,利用全局上下文信息接收空间响应,使在单个注意单元中充分注意,具有较高的计算效率。具体来说,首先使每个空间位置从具有相同水平和垂直坐标的全局上下文中获取特征响应。其次,使用自我注意机制来捕捉任意两个通道图和相关的空间位置之间的完全注意相似性。最后,通过整合所有通道图的特征和相关的全局线索,利用生成的完全注意相似性来重新加权每个通道图。

????????值得注意的是,与传统的信道NL方法通过乘以来自同一位置的空间信息来探索信道相关性的方法不同,FLANet支持不同空间位置之间的空间连接,即利用单一注意图在空间和信道维度上的充分注意。通过这种方式,FLANet具有更全面的上下文视图,并且对不同的场景更健壮。此外,所构建的先验表示法带来了一个全局的接受域,有助于提高特征识别能力。?

声明:本内容来源网络,版权属于原作者,图片来源原论文。如有侵权,联系删除。

创作不易,欢迎大家点赞评论收藏关注!(想看更多最新的注意力机制文献欢迎关注浏览我的博客)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-10 11:04:02  更:2021-12-10 11:04:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 0:02:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码