摘要

高分辨率遥感影像具有包含信息大厦，自然场景复杂等特点，一副遥感影像中往往包含大量的建筑物、场地、植被、农田等多类别地物和地貌要素信息，如何利用高干影响来实施精准快速的地物要素自动化检测提取，一直以来是热点的研究内容，随着深度学习技术的快速发展，许多基于卷积神经网络的目标检测模型被应用到了遥感影像目标检测任务中，取得了不错的成果。到目前为止，现有遥感影像目标检测模型大多有着深层次的结构以及复杂的连接通道，这类模型通常在占用较大内存的同时，运行过程中会也会产生大量的计算冗余量和额外参数，限制了模型在许多计算资源有限的场景下部署和使用。
关键词遥感影像；目标检测；卷积神经网络；特征学习

引言

遥感影像中飞机、船只以及近海海滩和岛屿的检测不仅在海洋军事信息研究领域是一个重要的应用方向, 在民用工业领域也同样发挥着重要的作用. 对于这类目标, 主要的任务需求是在海面、湖面或地面背景下对图像中的船只、海滩、岛屿以及机场中的飞机进行位置标注和掩膜分割. 而飞机和船只图像在尺度、分辨率上与自然图像存在差异, 海滩和岛屿也会因为崎岖的轮廓使得识别效果不明显. 针对高分辨率遥感图像中目标太小、识别掩码不清晰、输入影像模糊等问题, 本文提出了一种基于注意力机制和生成对抗网络的模型 Attention-GAN-Mask R-CNN 简称 AG-Mask R-CNN, 将注意力、生成对抗网络[1] 和 Mask R-CNN[2] 结合起来. 本文的主要研究工作为: (1) 针对数据中目标尺度不同, 开展多尺度特征融合研究. 针对多尺度的输入, 在主干网络中添加特征金字塔网络 (FPN)[3] . (2) 针对遥感图像中对象占比较小, 容易被漏检的问题, 开展注意力机制算法研究. 引入注意力机制, 嵌入在卷积层网络中, 产生注意力感知的特征, 使得网络关注更重要的区域, 以提升网络检测的精度. (3) 在 Mask (掩码) 分支中引入生成对抗网络. 由于 Mask 分支生成器与生成对抗网络中的生成器定义相同, 因此利用单独的生成对抗网络对 Mask 分支的 Mask 生成网络进行预训练, 从而提升原始 Mask 分支中生成器的精度. (4) 模型的训练与评估. 针对模型的训练结果进行验证分析, 并与初始 Mask R-CNN 网络等其他主流网络进行对比来说明模型的可行性和高效性.

1 数据预处理

遥感影像采集与人工标记是建立牡丹花品种识别模型的基础。本节主要介绍遥感影像图像数据集的构建过程。

1.1 数据采集

UCAS-AOD Dataset 是一个遥感影像数据集，其包含汽车和飞机两类目标以及背景负样本。该数据集由国科大于 2014 年首次发布，并于 2015 年补充，相关论文有《Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network》。
不同图层要素的性能如表1所示。
表1 不同图层要素的性能
在这里插入图片描述

(a) 汽车影像

(b) 飞机影像
图1. 汽车和飞机遥感影像的示例图像
1.2 图像分割
图像预处理——图像分割
所采用的深度卷积神经网络（AlexNet）的结构。我们使用 POOL5、FC6 和 FC7 图层特征，其尺寸分别为 9216、4096 和 4096。
在这里插入图片描述

为了提高深度卷积神经网络模型的泛化能力，对每幅遥感影像图像通过旋转、平移、扭曲、缩放、翻转等传统数字图像处理方法进行随机变换以扩充样本个数。针对车辆和飞机的图像进行数据增强后的部分样本如图2所示，通过图像分割对遥感图像进项图像预处理，对平面方向的分布程度进行统计，泛化后续需要的图像集。
在这里插入图片描述
图 2 车辆和飞机平面方向的分布程度

2 网络模型

2.1 网络结构

AG-Mask R-CNN 模型的网络结构如图 1 所示. (1) 对遥感数据进行预处理作为输入. (2) 骨干网络采用 ResNet101[4] , 并且在 ResNet 卷积层之间嵌入注意力模块以及特征金字塔网络, 以此来增强对小目标的语义提取和检测精度. 注意力模块如图 2 所示, 采用先加入通道域注意力再加入空间域注意力的方式, 在卷积层的每一层网络之间都嵌入一个封装好的注意力模块. (3) 沿用 Mask R-CNN 的模型架构, 针对 Mask 分支进行改进, 对 Mask 生成器进行生成对抗的生成器预训练. 初始操作是对输入图像中物体的信息进行表达和融合, 这个过程中 CNN[5] 模块充当特征提取网络, 对输入图像进行特征提取, 生成特征图. FPN 主要是减少尺度变换误差. 之后候选区域生成网络 (RPN) 根据预设框进行候选区域的推荐, 输出经过筛选的正样本回归框和特征图.
在这里插入图片描述

3 实验

遥感图像飞机目标检测与识别是一个非常值得研究的课题,同时也是一项复杂的工作，其关键技术是影响识别算法优劣的基石。本章首先阐述识别算法中的预处理;然后详细介绍飞机识别的特征和识别方法;最后分析影响算法优劣的影响因素和评价识别算法性能的常用指标。

3.1 实验设置

在完成飞机识别时，并不意味着研究工作已经结束，还需要对算法的整个效果与性能进行分析。分析有定性和定量分析两种方式，定性分析只能粗略的揭示算法的性能，定量分析能准确的给出算法效果的具体数值，因此对算法定量分析极为重要，同时也是和前人的方法对比的重要标准和依据。考虑现有算法自身的局限性和遥感图像的干扰因素众多等主观因素和客观原因，本文利用遥感图像飞机识别中常用的比例评价标准来进行算法的定量分析，这些指标包括:1)检测率;2）识别率;3）虚警率。另外根据现在的实际需求，时间也是一个考虑的因素，这里的时间即为完成飞机识别消耗的时间。在保证识别率的同时，当然是消耗的时间越少越好，这样离实时性的要求才能越来越近。

3.2 实验结果

3.2.1 最佳实验结果

飞机识别算法的性能包括飞机的检测率、识别率、虚警率、综合评价指标z和消耗时间。检测率和识别率采用文献[21]的方法计算，虚警率采用文献[20]的方法计算。Z是根据检测率和识别率定义的一个综合评价指标，，它综合评价了飞机识别算法的性能。消耗时间是指从遥感图像中识别出所有飞机目标所花费的时间。目标识别评价指标来衡量飞机识别算法的性能，评价指标如上所述。实验图像来自Google Earth 7.0.2，分辨率为0.61m。样本图像是从谷歌地图获取的不同地区的民用和军用机场的遥感图像中的适量飞机目标图像和背景图像，首先建立了8种飞机类型共300幅飞机图像库和40幅背景图片，并用Photoshop 处理8种图像的灰度变换以人工来模拟光照变化的影响，最终得到160幅图片。
表3. 算法比较
在这里插入图片描述

图4 不同样本对识别结果的影响
在这里插入图片描述

图5 文本识别飞机型
在这里插入图片描述

图6 飞机识别过程

3.2.2 优化算法对神经网络的影响

本算法可以识别8种飞机目标，以下是不同机场、不同背景的飞机检测结果，新算法可以识别出不同机场的不同的飞机机型，同时能克服不同背景和和光照变化的影响。
在这里插入图片描述
图7 军用机场图片图8 军用机场图片

图9 光线较好图片图10 光线较暗图片

图11 复杂背景图像图12 简单背景图像

图13不同机型图像图14 不同颜色图像
在粗定位阶段，首先利用改进的显著图算法快速提取遥感图像中存在的显著目标，然后用基于区域增长和线标记的新方法来确定显著目标的大小和位置,并将这些显著目标作为候选目标，为后续识别做好准备。在精识别阶段，首先提取候选目标和样本图像的MSA、Pseudo-Zernike矩和 Harris-Laplace特征描述子，提取的这三种特征可以全面描述飞机目标的多种信息,在一定程度上克服了单一特征描述目标信息不足的缺点;然后进行特征评估和融合;最后使用SVM进行训练识别，判断该候选目标是否为飞机目标以及飞机目标的种类。

2 结论

遥感图像飞机目标检测与识别无论是对军用还是对民用领域都有着非常重要的意义，因此已成为计算机视觉领域研究的热点和重点。本文以航天科技创新基金项目和省教育厅科研项目“基于尺度空间特征的多机动目标识别与跟踪关键技术研究”为研究目标，查阅国内外相关文献后，针对现有算法耗时长，不能满足快速以及实时性的要求等技术难题﹐提出了基于显著图和多特征结合的飞机识别算法来提高识别精度、同时减少耗时等技术难题，另外也克服了光照变化的影响

参考文献

[1] .https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&dbname=CJFDAUTO&filename=XTYY202206020&uniplatform=NZKPT&v=Jzk-Nu39AISiDTc9Nf7pyFivQafsAq17eQ5OHaGlluc3M37PPKz5oeQl0ewP_G-B
[2]https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&dbname= CJFDLAST2022&filename=BJCH202202014&uniplatform=NZKPT&v=Jzkab8RbFN0tzLyzdoO3JNbQwjpbCmX8EOzVjm08oTCQFI9P895A-HoBB6o0-L8e
欢迎大家加我微信交流讨论（请备注csdn上添加）
在这里插入图片描述