[人工智能] 【Attention】Visual Attention Network

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【Attention】Visual Attention Network -> 正文阅读

[人工智能]【Attention】Visual Attention Network

文章目录

论文链接：https://arxiv.org/abs/2202.09741
代码链接：https://github.com/Visual-Attention-Network

一、背景

源于 NLP 的 self-attention 机制在应用于 2D 图像的时候，有三个问题：
将 2D 的结果看做 1D 的序列，会损失 2D 空间结构
高分辨率的图像会导致很大的计算复杂度
一般的 self-attention 都是只会捕捉空间上的相关性，忽略了通道上的相关性
在这里插入图片描述

二、动机

为了解决上述问题，本文提出了一个适用于视觉任务的 large kernel attention (LKA)，使得 self-attention 能够自适应捕捉长距离关系。

三、方法

LKA 吸收了卷积和 self-attention 的优势——包括局部结构信息、长距离依赖、自适应性

基于 LKA，作者提出了新的视觉 backbone——visual attention network（VAN）。

3.1 Large Kernel Attention

在这里插入图片描述

如图 2，一个大尺寸的卷积可以分成三个部分：

空间上的局部卷积（depth-wise convolution）
空间上的 long-range convolution（depth-wise dilation convolution）
通道上的卷积（1x1 convolution）

也就是说，一个 $\times K$ 的卷积可以被拆分如下：

一个 $\frac{K}{d} \times \frac{K}{d} $ 的 depth-wise dilation convolution， $d$ 为膨胀率
一个 $\times (2d-1)$ 的depth-wise convolution
一个 1x1 卷积

在这里插入图片描述

拆分后的卷积可以捕捉长距离信息，并且节省计算资源，得到长距离关系后，能够估计每个点的重要程度，生成 attention map。

在这里插入图片描述

如图3a所示，LKA 模型如下：
在这里插入图片描述

3.2 VAN

VAN 结构简单，有四层，不同量级的模型结构如表 2 所示：
在这里插入图片描述

对图3d中的每个stage，首先将输入进行下采样，然后再进行后续操作。

复杂度分析：

在这里插入图片描述

实现细节如下，使用下面三种卷积实现类似 21x21 的卷积

1 个 5x5 depth-wise convolution
1 个 7x7 depth-wise convolution（d=3）
1 个 1x1 卷积

四、效果

4.1 分类

在这里插入图片描述

4.2 目标检测

在这里插入图片描述

4.3 语义分割

在这里插入图片描述

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-03 16:13:20 更:2022-03-03 16:14:23

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/30 10:48:56-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码