IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Dynamic Region-Aware Convolution论文解读 -> 正文阅读

[人工智能]Dynamic Region-Aware Convolution论文解读

DRConv(CVPR 2021)

本文提出了一种动态区域感知卷积Dynamic Region-Aware Convolution(DRconv)算法。它可以自动地将多个卷积分配给特征表示相似的空间区域,在local动态卷积的基础上引入了空间维度的分组。在提升性能的同时,还维持了一定的空间不变性。

引言

当前主流的标准卷积是在空间域上进行滤波器共享实现的(即同一个卷积通道),因此想要提取更丰富的信息只能通过增加通道层数实现。
在这里插入图片描述
local convolution,卷积核在空间维度不共享,每个像素进行单独的处理,公式如下:
在这里插入图片描述
论文中,作者设计了一个可学习的引导掩码(Learnable guided mask)模块和滤波器生成模块(Filter generator module)。引导掩码模块将特征图划分为多个区域,滤波器生成模块根据输入图片动态生成每个区域的卷积核,卷积过程中将不同卷积核分配到不同区域中。
在这里插入图片描述

Our Approach

作者提出DRConv,首先定义了一个引导掩膜 M = S 0 , ? ? ? , S m ? 1 M=S_{0},···,S_{m-1} M=S0?,???,Sm?1?来表示空间维度划分的区域,在每个区域中共享一个滤波器。作者将区域中的滤波器表示为 W = [ W 0 , ? ? ? , W m ? 1 ] W= [W_{0},···,W_{m-1}] W=[W0?,???,Wm?1?],因此DRConv可以表示为:
在这里插入图片描述
总的来说,DRConv主要分为两个步骤。首先,使用一种可学习的引导掩码模块将特征在空间维度上划分为若干个区域,如上图所示,引导掩码中具有相同颜色的像素被归到相同区域,类似于语义分割。
其次,在每个共享区域中,利用滤波器生成模块生成一个定制的滤波器,执行卷积操作。定制的滤波器可以根据输入图像的重要特征自动调整。

Learnable guided mask

在这里插入图片描述
可学习引导掩膜模块决定了滤波器在空间维度上的分布(哪个滤波器被分配到哪个区域),并通过损失函数进行优化,以便滤波器可以根据输入自适应地分配到相应位置。
假设需要有 m m m个区域地的 k × k k×k k×k滤波器。
首先使用 k × k k×k k×k卷积来生成 m m m个通道的引导特征,用 F ∈ R U × V × m F∈R^{U×V×m} FRU×V×m表示。对于每个位置 ( u , v ) (u,v) (u,v),选取通道上最大值的索引。因此,引导掩膜取值在 0 到 m ? 1 0到m-1 0m?1之间。
在这里插入图片描述
为了使引导掩码可学习,必须得到引导掩码的梯度。为了解决argmax无梯度的问题,作者提出了类似近似梯度的方法。

Forward propagation

获得引导掩膜(4)后,能得到每个位置 ( u , v ) (u,v) (u,v)的滤波器 W ^ u , v \hat W_{u,v} W^u,v?
在这里插入图片描述
其中 W M u , v W_{M_{u,v}} WMu,v??是由滤波生成器生成的滤波 [ W 0 , ? ? ? , W m ? 1 ] [W_{0},···,W_{m-1}] [W0?,???,Wm?1?]中的其中之一。m个滤波器于所有位置建立对应关系,并将整个像素空间划分为m个组。

Backward propagation

作者定义 F ^ \hat F F^,它是在反向传播时用来代替one-hot掩码的形式:
在这里插入图片描述
本质上是个softmax,作者通过在通道维度上进行softmax,期望 F ^ \hat F F^尽可能接近 0 ? 1 0-1 0?1
F ^ \hat F F^的梯度如下:
在这里插入图片描述
结合(6)可以得到 F F F最后的梯度:
在这里插入图片描述

Dynamic Filter: Filter generator module

在这里插入图片描述
卷积生成模块主要包含两个卷积层,卷积核为 1 × 1 1×1 1×1
首先通过自适应平均池化得到 k × k × c k×k×c k×k×c的特征图,之后使用两个 1 × 1 1×1 1×1的卷积。第一个卷积后接sigmoid激活函数,第二个卷积采用分组卷积,group=m,后面不加激活函数。如图(b)所示,分别根据每个样本的特征预测卷积滤波器。因此,每个滤波器都可以根据其自身的特性进行自动调整。

实验结果在这里插入图片描述

总结分析

改论文实际上是利用了特征图的空间特性显著提升了网络性能,缺点是非常不利于并行优化(batchsize的并行可以通过group 卷积实现),对硬件也非常不友好。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-09 18:22:35  更:2022-04-09 18:27:17 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 10:49:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码