[人工智能] Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks(速读）

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks(速读） -> 正文阅读

[人工智能]Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks(速读）

abstract

传统注意力机制是一个二次的复杂度（quadratic complexity），这篇论文提出的外部复杂度是一个线性的，计算复杂度低而且内存消耗小。

introduction

在这里插入图片描述

外部注意力机制复杂度低，精读高
多头外部注意力机制，构建了一个MLP的架构
大量的实验

注：多层感知器（Multilayer Perceptron,缩写MLP）是一种前向结构的人工神经网络，映射一组输入向量到一组输出向量

method

在这里插入图片描述
这个图是对比self-attention和external-attention的

这个公式比较好理解，可以看一看（虽然可能并不太好写
）

传统self-attention:
$A=(\alpha)_{i,j}=softmax(QK^T)$
（Q是query K是key）
$F_{out}=AV$
(V是value)

mulit-head external attention:
$A=(\alpha)_{i,j}=Norm(FM^K_T)$

$F_{out}=AM_V$

在这里插入图片描述
这样利用额外的空间就是一个线性的了

experiment

这篇文章感觉提出来的东西不多，但是实验真的非常多，在主要是在不同的领域都进行了实验

在这里插入图片描述
这里主要是跟传统注意力做对比

底下主要就是跟其他网络了

conclusion

主要也是说了说自己提出了一个注意力机制

我是分隔线

再往底下翻了翻，发现居然是清华团队写的论文、、、、

可能感觉只提出了一个自注意力机制没有那么强，但是后面的实验可谓是涉及到了各个领域（感觉就是比较严谨的实验）

后来参考了一篇大佬的博客

大佬说它没有做消融实验（但是它确实有一个标题是ablation study）,不过看看底下的表格的话确实好像没有，虽然结果也非常不错。

大佬说用一层来储存信息有点太草率了，虽然结果还不错。但是有道理，可能要研究的就是简化一下这个机制，所以肯定是越变越草率？（buzhidao T_T）

小白的总结：

还行吧这篇读下来，感觉以后可能速读的时候也要看看实验了（因为虽然每个实验的结果肯定都是自己好，但是不同的论文会用不同的dataset和不同的ablation study ）所以还是看看。还有就是公式那块，有些推导可能没有那么重要，但是一些基本的输入输出的维度还是也要看看的。

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-02-06 13:50:16 更:2022-02-06 13:52:48

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/31 4:11:10-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码