IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 目标检测学习-ASFF -> 正文阅读

[人工智能]目标检测学习-ASFF

1.研究背景??

在绝大多数目标检测网络中,如下图Fig1特征金字塔(Feature Pyramid Network,FPN)是一个不可缺少的部分,FPN网络主要解决的问题是目标检测在处理多尺度变化问题的不足。FPN主要有以下两个作用:1)多尺度特征融合,提高了特征的丰富程度;2)使用分治法,将目标检测任务按照目标尺寸不同,分成若干个检测子任务。
?

2.存在的问题?

在检测分支当中低层特征适合检测图片中的小物体,高层特征适合检测图片中的大物体,中间层特征适合检测图片中的中等大小物体。而在FPN中采用的是concatenate或者element-wise这种直接拼接或者直接相加的方式,作者认为这样并不能充分利用不同尺度的特征。提出一种新的融合方式来替代concatenate或element-wise。

3.ASFF

3.1 网络结构

针对以上存在的问题,作者提出了如下图Fig2提出的ASFF自适应特征融合方式,图中以ASFF-3为例,图中的绿色虚线框中描述了文中提出的特征融合X^{1\rightarrow3},X^{2\rightarrow3},X^{3\rightarrow3}分别来自level-1,level-2,level-3的特征,将不同层的特征乘上相应的可学习权重{\alpha}^3,?{\beta}^3,?{\gamma}^3并相加得到新的融合特征ASFF-3,其中{\alpha}_{ij}^l,{\beta}_{ij}^l,{\gamma}_{ij}^l是第l层特征图学习到的参数,其中{\alpha_{ij}^l}为下式({\lambda_{\alpha_{ij}}^l},{\lambda_{\beta_{ij}}^l},{\lambda_{\gamma_{ij}}^l}为?X^{1\rightarrow\l},X^{2\rightarrow\l},X^{3\rightarrow\l}经过1×1卷积得到的):

?同时三个参数需要满足以下两个条件:

?

最终在第l层的输出结果为:y_{ij}^l?=?\alpha_{ij}^l\cdotX_{ij}^{ {1\rightarrow\l}}?+?\beta_{ij}^l\cdotX_{ij}^{2\rightarrow\l}?+?\gamma_{ij}^l\cdotX_{ij}^{3\rightarrow\l}

3.2 梯度计算

文中以level-1层的feature map上的点(i,j)为例,其梯度如下面的公式1所示:

由于文中使用的是插值进行上采样,使用池化进行下采样,所以这里将\frac{\partial{x_{ij}^{1\rightarrow\l}}} {\partial{x_{ij}^{1}}}\approx1这样上述公式1就简化为下面的公式2:

因为在Yolov3或者RetinaNet上对于特征融合的部分是element-wise或者concatenate,所以\frac{\partial{y_{ij}^1}}{\partial{x_{ij}^1}}等于一个常数,同理\frac{\partial{y_{ij}^l}}{\partial{x_{ij}^{1\rightarrow\l}}}也是一个常数,所以将其简化为1。那么公式2又简化为下面的公式3:

文中讲假设在level-1特征层上的点(i,j)位置上存在正样本,那么\frac{\partial{L}}{\partial{y_{ij}^1}}就为正样本梯度,那么其他level特征层上的点(i,j)位置上就被看作为背景的负样本,其梯度为负样本的梯度,这种不一致性(在反向传播中既包含负样本也包含正样本)会对梯度造成影响,而且也会降低训练效率。而文中提出的ASFF模块的方式的反向传播的表达式为下面的公式4:

在公式4中可以通过控制参数\alpha∈[0, 1]来实现,如果\alpha_{ij}^2,\alpha_{ij}^3?= 0那么在点(i,j)上的负样本的梯度就不会干扰正样本的梯度。

4.实验

从下图Fig3中可以看出在使用了ASFF模块后会比使用concat和sum的AP值有所提升。

从下图Fig4中可以看出图中所有的斑马都是由level-1层的特征图来预测的。这就说明了斑马的中心区域在level-1层预测,level-2,level-3层被过滤掉了。

从下图Fig5中可以看出网球拍虽然是在level-1里面预测,但是其中心区域的内的主要特征来自level-2,作者推测,虽然网球拍是从level-1被预测出来的,但来自level-2的特征在检测它时更具鉴别性,因为它们包含了更丰富的线条和形状的线索。

?上图Fig6为Yolov3+ASFF模块网络与其他one-stage和two-stage网络的一个AP的比较。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-20 15:05:55  更:2021-08-20 15:07:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 20:31:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码