IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> WACV 2020 | ULSAM: 超轻量级子空间注意力机制(keras实现) -> 正文阅读

[人工智能]WACV 2020 | ULSAM: 超轻量级子空间注意力机制(keras实现)

?

ULSAM: Ultra-Lightweight Subspace Attention Module for Compact
Convolutional Neural Networks

paper:https://arxiv.org/pdf/2006.15102.pdf?

code:https://github.com/Nandan91/ULSAM

摘要

注意机制建模长期依赖关系的能力使其在视觉模型中的部署迅速发展。与卷积算子不同,自注意提供了无限的接受域,并支持全局依赖关系的高效建模。然而,现有的最先进的注意机制产生了较高的计算和参数开销,因此不适合紧凑的卷积神经网络(CNNs)。在这项工作中,提出了一个简单而有效的“超轻量级子空间注意机制”(ULSAM),它为每个特征图子空间推断出不同的注意图。为每个特征子空间单独的实现注意图,从而实现多尺度和多频的特征表示,这对于细粒度的图像分类更为理想。子空间注意方法是正交的,并补充了现有的现有注意机制。ULSAM是端到端可训练的,可以作为一个即插即用模块部署在现有的紧凑型cnn中。值得注意的是,该工作是第一次尝试使用子空间注意机制来提高紧凑型cnn的效率。在MomileNet-V2的FLOPs和参数计数上分别降低了≈13%和≈25%,在ImageNet-1K和细粒度图像分类数据集上,Top-1的准确率分别提高了0.27%和1%以上。

论文背景

自注意力有效地捕捉了特征空间中特征的全局依赖性,规避了CNN中卷积算子的固有限制。然而,这些注意力机制的较高参数和计算开销对于在紧凑型CNN中是不可取的。由于紧凑型CNN的参数空间冗余度较低,与现有的注意力机制相比,紧凑型CNN的理想注意力机制应该具有更有效、更高效地捕捉全局相关性(融合语义和空间信息)的能力。

论文主要思想

论文提出了一种新的用于紧凑型cnn的注意块ULSAM,它可以学习每个特征子空间的个体注意映射,并在多尺度、多频率特征学习的同时实现跨信道信息的高效学习。具体地,将提取的特征分成g组,对每组的子特征进行空间上的重新校准,最后,把g组特征concatenate到一起。

Keras实现?

以下是根据论文和pytorch源码实现的keras版本(支持Tensorflow1.x)。


def _ULSAM(inputs, num_splits=4):
    channel_axis = 1 if K.image_data_format() == 'channels_first' else -1

    sub_feat = Lambda(lambda x: tf.split(x, num_splits, axis=channel_axis))(inputs)
    features = []
    for i in range(num_splits):
        x = sub_feat[i]

        out = DepthwiseConv2D(kernel_size=1, strides=1, padding='same')(x)
        out = BatchNormalization(momentum=0.9)(out)
        out = Activation(activation='relu')(out)

        out = MaxPool2D(pool_size=3, strides=1, padding='same')(out)

        out = Conv2D(1, kernel_size=1, strides=1, padding='same')(out)
        out = BatchNormalization(momentum=0.9)(out)
        out = Activation(activation='relu')(out)

        m, n, p, q = K.int_shape(out)
        out = Reshape((n, -1))(out)
        out = Activation(activation='softmax')(out)
        out = Reshape((n, p, q))(out)

        out = Multiply()([out, x])

        features.append(Add()([out, x]))
    return Concatenate(axis=channel_axis)(features)

声明:本内容来源网络,版权属于原作者,图片来源原论文。如有侵权,联系删除。

创作不易,欢迎大家点赞评论!

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-03 11:10:51  更:2021-08-03 11:12:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 15:00:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码