| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文】ReDet:A Rotation-equivariant Detector for Aerial Object Detection -> 正文阅读 |
|
[人工智能]【论文】ReDet:A Rotation-equivariant Detector for Aerial Object Detection |
?摘要1.? 针对的问题
2.? 本文研究内容
一、引言1. 研究思路本研究提出了一个旋转等变检测器,用于从旋转等变的特征中提取旋转不变的特征。
2. 主要方法(1)旋转等变特征提取:将旋转等变网络引入骨干网络中,生成旋转等变的特征,可以直接准确地预测方向,减少方向变量建模的复杂性; (2)旋转不变特征提取:因为RRoI warping不能从旋转等变特征中提取旋转不变特征,因此本研究采用旋转不变的RoI Align (RiRoI Align)。它可以根据空间维度上的RRoI边界框对区域特征进行wrap操作,通过循环切换方向通道和特征插值对方向维度上特征进行对齐。 3. 主要贡献(1)为高质量的航空目标检测设计了一个旋转等变检测器,能够同时对旋转等变性和旋转不变性进行解码; (2)设计了一个用于从旋转等变特征中提取旋转不变特征的 RiRoI Align,可以同时在空间维度和方向维度上生成旋转不变的特征; (3)本研究的方法精度高超过了现有方法,并实现了模型大小和精度的更优平衡。 二、相关工作1. 旋转目标检测(1)采用大量具有不同方向、尺寸和长宽比的旋转anchors,提高了计算复杂性; (2)部分方法致力于改进目标表示或特征表示。 2. 旋转等变网络为了在更多方向上实现旋转等方差,有些方法通过插值重采样滤波器,而其他方法使用谐波作为滤波器,在连续域产生等等变特征,不过这些方法大多是在分类任务上取得了显著效果。 3. 旋转不变性的目标检测(1)CNN在旋转不变性建模上表现很差,因此需要更多参数来对旋转信息进行解码; (2)目标检测需要实例级别的旋转不变特征,因此部分方法将RoI warping拓展到了 RRoI warping,但仍然难以提取旋转不变性的特征。 三、预备知识(1)等变是一种性质,即对输入进行变换会以可预测的方式产生特征上的变换
(2)CNN具有平移等变性
(3)旋转等变性
1. 旋转等变网络(1)旋转等变网络是一堆具有更高权值共享程度(如平移和旋转)的旋转等变层组成。 (2)如果对输入进行旋转变换之后再输入网络,那么旋转变换可以被整个网络所保留 2. 旋转不变特征(1)旋转不变性:如果对输入进行任何的旋转变换,都不会引起输出的变化,就可以说该输出特征具有旋转不变性。 (2)旋转不变特征可以分为三个层级:影像级、实例级和像元级。这里主要关注实例级。 (3)如果和 分别表示输入影像I和特征图的RoI,即,为旋转不变的水平框, 是与方向θ有关的倾斜框,那么对于影像的RoI,旋转等变性可以被表示为: (4)如果将HRoI 认作是影像I中RRoI 的旋转不变表示,那么可以被认为是对应特征空间中 的旋转不变表示。 (5)旋转变化通常是方向的函数:,我们可以采用RRPN 或者 R-CNN来学习RRoI的方向变量θ以及变换。最终,旋转不变特征 可以通过逆变换 得到: 四、旋转等变检测器
1. 旋转等变的Backbone(1)以带有FPN的ResNet为基线,实现了一个旋转等变骨干,即具有ReFPN的旋转等变ResNet (ReResNet)。
(2)旋转等变骨Backbone的优势
2.? 旋转不变的RoI Align(RiRoI Align)(1)空间Alignment:空间对齐将RRoI从特征图f中wrap出来,产生空间维度上的旋转不变性区域特征,这与RRoI对齐一致。 (2)方向Alignmen:为了确保不同方向的RRoIs能够产生旋转不变的特征,本文在方向维度上进行方向对齐。因为旋转等变只在离散的空间上实现了,所以当时,需要对特征进行插值。 (3)与RRoI Align+MaxPool相比:方向池化在分类任务中应用更多。对于特征图的每个位置,方向池化只保留具有最强响应的方向信息,其他方向的特征均被舍弃。但是,在目标识别中,无论方向响应是强是弱,都是不可忽视的。因此,在本研究的 RiRoI Align中,所有方向的特征都被保留并align。 五、实验分析1.? 数据集
2.? 实验配置(1) ImageNet预训练 (2) Fine-Tune
3. 消融实验(在DOTA-1.5上进行测试)(1)旋转等变骨干网络:比较了不同的Backbone结构以及不同的检测网络。
(2)RiRoI Align的有效性:与RRoI Align相比效果有了显著提高
(3)与旋转增广相比:数据增广之后需要的模型收敛时间更长
(4)其他数据集上的表现(模型泛化能力测试)
4. 与现有模型相比(1)DOTA-v1.0结果:超过所有单尺度模型和大多数多尺度模型。 (2)DOTA-v1.5结果:优于RetinaNetOBB, Faster R-CNN OBB, Mask R-CNN 以及 HTC 等模型,尤其是在小目标和大尺度目标上,表现更好 (3)HRSC-2016结果:优秀! |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/30 14:27:58- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |