激光与光电子学进展, 2020, 57 (4): 041007, 网络出版: 2020-02-20   

基于深度学习的光学遥感图像飞机检测算法 下载: 1276次

Airplane Detection of Optical Remote Sensing Images Based on Deep Learning
作者单位
河北工业大学人工智能与数据科学学院, 天津 300100
摘要
光学遥感图像目标检测一直都是遥感领域研究的热点之一,但现有的检测方法对背景复杂且尺寸较小的目标检测准确率不高。针对以上问题,提出了一种以Mask-RCNN为基础框架的目标检测方法。该算法以ResNet50为特征提取网络并在此基础之上利用特征重用技术来更好地提取目标的语义特征,且针对不同类型的飞机尺寸比例不固定等特点,设计了一组更加合适的候选框尺度集合。实验结果证明,该方法与以往常用的检测算法相比在小物体检测上拥有更高的检测精度。
Abstract
Target detection for optical remote sensing images has always been one of the hotspots in the field of remote sensing. However, the accuracy of the existing detection methods for targets with complex background and small size is low. Aiming at the problem, a target detection method based on Mask-RCNN framework is proposed. The algorithm uses ResNet50 as the feature extraction network and uses the feature reuse technology to realize better extraction of the semantic features of the target. In view of the fact that the size ratio of different types of aircrafts is not fixed, a set of more suitable candidate frame scales is designed. The experimental results show that this method has higher detection accuracy for small object detection compared with the previous detection algorithms.

1 引言

近年来,遥感技术的进步及其在**和民用方面广阔的应用前景,引起了国内外研究人员对基于遥感图像的目标检测技术的广泛关注,但由于遥感图像经常受光照、复杂背景等因素的影响,传统目标检测算法在检测包含复杂背景的遥感图像方面效果不佳。例如:Haar+Adaboost检测方法可以快速抛弃没有目标的平滑窗,大大提高了检测效率,但该方法有一个很大的缺点,它使用了很弱的特征,用它进行分类的检测器也是弱分类器,分类结果仅比随机猜测的结果好一些;可形变部件模型(DPM)是目标检测方面较好的人工特征方法,该方法对方向梯度直方图(HOG)[1]特征进行了改进,并利用全局和局部两个模型,大幅提高人工特征在目标检测上的精度,DPM方法存在的缺点是特征相对复杂、计算速度慢、对于旋转或拉伸的物体检测效果不好。总之,传统算法存在泛化性能、旋转不变性较差等缺陷,因此在图像检测领域的表现并不理想。

随着深度学习的飞速发展,基于卷积神经网络的检测方法在越来越多的领域中得到了应用[2],其在遥感方面的应用也较多。例如:朱明明等[3]利用深度学习对机场进行识别;魏湧明等[4]利用YOLO(You Only Look Once)网络进行图像定位;宋明珠等[5]提出海面弱小舰船检测方法。这些深度学习算法的检测精度相对于传统检测算法有很大的提高,但对于小目标的检测效果不佳。随着目标检测技术的不断进步,一些新的检测算法,如掩码区域提案网络(Mask-RCNN)[6],因在图像分类与识别领域出色的表现引起了学者们的广泛关注,掩码区域提案网络为在快速区域提案网络(Faster-RCNN)[7-8]基础上改进的端到端检测算法,其在小目标检测方面相对于以往提出的算法表现更出色[9],如在针对COCO数据集的检测任务上,掩码区域提案网络相对于快速区域提案网络在平均检测精度方面提高了约5%,但掩码区域提案网络是针对自然图像提出的。本文针对遥感图像背景复杂、目标小、飞机尺寸不固定等特点[10-12],对掩码区域提案网络的特征提取阶段进行改进,增加候选框的种类和比例[13],提出了针对遥感图像的小物体掩码区域提案网络(SMask-RCNN)。

2 Mask-RCNN检测方法

He等[6]于2017年提出了掩码区域提案网络,并获得了ICCV 2017的最佳论文。掩码区域提案网络的基本结构与快速区域提案网络相似,都采用了两步法(图1):第一个阶段扫描图像并生成可能包含一个目标的建议区域;第二阶段分类区域并生成边界框和掩码。该算法的关键点有两个:1)ResNet50+FPN(特征金字塔结构)作为特征提取网络,相比于单一的ResNet50特征提取网络,能更好地提取浅层语义特征;2)将区域候选网络(RPN)后的感兴趣区域池化(RoIPooling)替换为感兴趣区域空间对称化(ROIAlign),这样有助于提高在小物体检测方面的准确度。图1中C代表ResNet50中的不同特征提取模块,L代表损失函数。

图 1. Mask-RCNN结构图

Fig. 1. Structural diagram of Mask-RCNN

下载图片 查看所有图片

第一个关键点中特征提取网络ResNet50+FPN的核心构架如图1所示。在以往的深度学习中,为获得更好的检测效果往往需要通过加深网络和扩宽网络来实现,但当网络达到一定的深度后训练精度和测试精度便迅速下降,这说明网络过深使得深度网络变得更加难以训练。残差网络的出现解决了随着网络加深准确率下降的问题,它允许网络尽可能地加深,其结构如图2所示。该网络的核心是采用了一种快捷连接的全新连接方式,设现有一个比较浅的网络已达到了饱和准确率,在其后面再加上几个恒等映射层,这样虽然加深了网络层数但误差变动很小,即更深的网络也没有带来误差的上升。这里提到的使用恒等映射直接将前一层输出传到后面的思想,便是深度残差网络的设计灵感来源。特征金字塔网络利用深度卷积神经网络固有的多尺度金字塔结构构建特征金字塔,即对卷积网络最高层的特征图进行上采样,然后与卷积层网络次高层输出的图像进行特征融合,形成特征金字塔网络的一层,依此类推生成P1、P2、P3、P4、P5层,再将各层生成的特征图送入区域候选网络进行处理。ResNet50+FPN特征提取网络将分辨率低但语义强的上层特征和分辨率高但语义弱的下层特征通过自顶向下的通路和横向连接相结合,该特征提取结构的使用使得网络的检测性能有了很大提高。

图 2. ResNet核心模块

Fig. 2. Core module of ResNet

下载图片 查看所有图片

第二个关键点是将以往目标监测框架中感兴趣区域池化替换为感兴趣区域空间对称化。以往监测框架采用的感兴趣区域池化存在两次量化的过程:1)将候选框边界量化为整数;2)将量化后的边界区域平均分割成K×K个单元,对每一个单元的边界进行量化。经过上述两次量化,候选框与最开始回归处理后位置有了一定的偏差,这个偏差会影响检测或者分割的准确度,这个问题在小目标检测方面更为突出[14]。感兴趣区域空间对称化的思路是取消量化操作,如图3所示,使用双线性内插的方法获得像素点上的图像数值,从而将整个特征聚集过程转化为一个连续的操作,在遍历每一个候选区域的过程中不对浮点数边界进行量化。将候选区域分割成K×K个单元,不对每个单元的边界进行量化。在每个单元中,根据边界点的值,采用双线性内插法计算出该单元中包含的候选区域关键点的坐标。感兴趣区域空间对称化的使用提高了该算法对遥感图像上小物体的检测精度。

图 3. ROIAlign 原理

Fig. 3. Principle of ROIAlign

下载图片 查看所有图片

3 SMask-RCNN目标检测框架

遥感图像与掩码区域提案网络处理的自然图像不同:1)自然图像尺寸往往比较小且包含的待检测物体数量少、目标尺寸相对较大、分辨率高;而遥感图像尺寸较大、背景复杂、包含的目标尺寸小,且分辨率一般较低;2)遥感图像中的飞机尺寸并不固定,既包含尺寸较小的战斗机、支线客机,也包含尺寸较大的预警机、加油机、轰炸机和执行洲际航线的大型干线客机等。因此设计的改进网络要兼顾不同尺寸的飞机。考虑到以上问题与挑战,本文根据遥感图像的特点提出基于掩码区域提案网络的小物体掩码区域提案网络。

3.1 多层特征融合

在掩码区域提案网络目标检测算法中,特征提取网络ResNet50分为C1,C2,C3,C4,C5五层,ResNet50的使用可以有效减少随着网络加深目标检测精度下降的问题。但在训练过程中,由于大部分参数作用范围有限,每一个模块处理后的特征直接被下一个模块调用,使得浅层模块的特征在深层没有被很好地利用,且在传递过程中浅层语义特征丢失严重。而遥感图像目标检测不同于自然图像检测,浅层语义的细节纹理信息对于小目标检测至关重要,故本文在ResNet50网络的基础上进一步增加特征融合,使浅层语义信息能够得到充分利用。图4(a)为原始ResNet50的结构,图4(b)为改进后的特征提取网络结构,本文将C1阶段输出的特征图经过通道数的降维后命名为R13,再对R13特征图进行1×1卷积处理,调整长和宽尺寸并进一步降维为R14。将经过第二层后的特征图进行降维使其和R13维数相同,将降维后的特征图与R13进行特征融合。同理将第三层输出的特征图进行降维使其通道数与R14相同,后与R14进行特征融合。因为遥感图像存在数据少、图像尺寸大、目标小的特点,本文在进行特征融合后均加入dropout结构来防止过拟合现象的发生。

图 4. ResNet50的特征提取网络结构。(a)原始结构;(b)改进结构

Fig. 4. Network structures of feature extraction for ResNet50. (a) Original structure; (b) improved structure

下载图片 查看所有图片

3.2 设计更加适合遥感图像的候选框

由于掩码区域提案网络目标检测算法是针对自然图像提出的,而自然图像的特点是图片中目标尺寸相对较大,所以掩码区域提案网络区域候选框使用的基准并不适合用在遥感图像目标检测上,本文根据数据集所包含的飞机类型,针对不同飞机的尺度特征设计了一组更加适合遥感图像飞机检测的候选框长宽比,数据集中所包含的不同型号飞机的真实尺寸如表1所示。

表 1. 不同型号飞机真实尺寸

Table 1. Real size table of different models of aircrafts

Aircraft typeAircraftlength /mAeroplanespan /mWingspan range ofaircraft length /m
F-1615.099.45
MV-2217.5014.0010--20
F-2218.9013.56
F-1519.4513.05
C-130H21.0030.0020--40
P-3C35.5730.36
B73742.1035.80
A32044.5134.10
B-1B44.5024.0040--60
B-52H49.0556.40
C-1753.2950.29
A12469.1073.30
A38072.7279.7560--80
A34075.3063.45
B747-876.4068.50

查看所有表

表1可知,飞机真实尺寸范围约为15.00~80.00 m,由于本数据集中既包含常用的民用飞机、加油机等大型飞机,也包含战斗机、教练机等小型飞机,所以尺寸比例相差较大。由表1可知,飞机长宽比处于0.3~2之间,原比例集合为{0.5,1,2},不能很好地覆盖多种尺寸比例的飞机目标。因此本文针对目标的特点设计了一组更加适合检测目标对象的候选框尺寸比例{1/3,1/2,2/3,1,3/2,2}。另外,原始算法的目标尺寸集合为{32 pixel,64 pixel,128 pixel,256 pixel,512 pixel},自然图像中包含的目标尺寸较大,采用此尺寸集合较为合适,而本数据集中飞机相对场景而言尺寸较小,目标尺寸在6~200 pixel之间,故新的尺寸集合采用{8 pixel,16 pixel,32 pixel,64 pixel,128 pixel,256 pixel },配合本文设计的候选框尺寸比例集合生成候选框,更加适合本数据集中的飞机检测。

4 实验与结果

4.1 数据集与训练参数

由于掩码区域提案网络较新,且原有数据集的标注信息及格式无法直接运用在该算法上,故本文实验中所用到的数据集为实验小组自己制作。数据集中共有1200张图像,分别为通过谷歌地图在美国、加拿大、澳大利亚、英国、日本、韩国、中国各地机场截取的包含飞机目标的机场遥感图像,其中包含的飞机样式较多,涵盖支线客机、干线客机、预警机、加油机、战斗机等多种尺寸和不同比例的飞机,具体涵盖的飞机类型可以参考表1。实验中训练集和验证集的图片数量为960和240,比例为4∶1,该数据集中图片的尺寸为1280 pixel×960 pixel,分辨率为0.5~1.0 m,将该数据集命名为AIRImage数据集。AIRImage数据集中各种尺寸范围所包含的飞机数量如图5所示,图5横轴为飞机真实长度/翼展(m)所处范围,纵轴为该范围内所涵盖的飞机数目。 不同尺寸范围飞机所占数量分布图Distribution map of number of aircrafts with different sizesFig. 5因为遥感图像不同于自然图像,遥感图像数据量相对较少,为了更加充分地训练小物体掩码区域提案网络,本文采用数据增强的方法、对原始数据集进行90°旋转以及水平镜像翻转,以及增加高斯噪声等方式对数据集进行扩充。本文实验所采用的硬件设备为两块NVIDIA TESLA K80,GPU 显存11 G,操作系统为ubuntu16.04。使用的深度学习框架为Keras。本文实验中,模型训练的初始学习率为0.001,优化方式为随机梯度下降法,训练的epoch为50。

4.2 实验结果与分析

4.2.1 目标检测的评价标准在遥感图像目标检测中,平均精度mAP(XmAP)是一个常用的检测标准。平均精度的计算与召回率(recall, R)和精确率(precision, P)有关,召回率和精确率是二分类问题中常用的评价指标,通常以关注的类为正类,其他类为负类,具体含义如下: XTP表示对象本来为正例,网络识别为正例;XTN表示对象本来为负例,网络识别为负例;XFP表示对象本来为负例,网络识别为正例;XFN表示对象本来为正例,网络识别为负例。精确率P为在识别出的所有正例中,识别正确的正例所占的比例,表示为 P=XTPXTP+XFP(1)召回率R为样本包含全部真正的正例中,识别正确的正例所占的比例,表示为 R=XTPXTP+XFN(2)XAP为精确率-召回率曲线与两个坐标轴围成的面积,即P-R曲线,其积分为 XAP=01P(r)dr(3)对所有XAP进行平均就得到了最后需要的平均精度,即 XmAP=0q-1XAPQ,(4)式中:Qq为类别数目。为了更好地理解(1)~(4)式,假设在数据集上训练了一个识别飞机的模型,测试集包含100个样本,其中60张为飞机,另外40张为汽车。测试结果中,显示为飞机的图片共有52张,检测正确的图片共50张,有10张飞机图片没有被检测出来,而且在检测结果中有2张为误检图片。这里将飞机认为是正类:所以XTP=50,XTN=40-2=38,XFN=10,XFP=2,P=50/(50+2),R=50/(50+10)。由于平均精度可以很好地评价出目标检测算法在遥感数据集中的性能,故本文通过平均精度来进行实验结果评价。4.2.2 实验结果本文通过测试快速区域提案网络、快速区域提案网络+FPN、掩码区域提案网络以及改进后的小物体掩码区域提案网络在AIRImage数据集上的表现,来判定各个算法在遥感图像飞机检测方面的优劣。测试结果如表2所示。

表 2. 不同IOU(Iou)值下不同模型mAP值对比

Table 2. Comparison of mAP values of different models at different IOU values%

ModelmAP
Iou=40Iou=50Iou=60
Faster-RCNN90.789.362.6
Faster-RCNN+FPN93.091.265.9
Mask-RCNN95.394.179.7
SMask-RCNN97.495.780.2

查看所有表

表1中IOU为检测目标候选框与真实目标候选框交集的面积/两个候选框的并集面积,从不同模型的检测结果可以看出,掩码区域提案网络的检测性能均优于快速区域提案网络和快速区域提案网络+FPN结构,这是感兴趣区域空间对称化的使用及多任务训练产生的结果。无论是比较优异的掩码区域提案网络,还是应用较广的快速区域提案网络,都是针对自然场景而设计的目标检测算法,均不能很好地应对遥感图像中飞机尺寸小、比例多样化的特点。本文针对遥感图像目标检测的特点,设计新的网络结构,进一步加强了浅层特征的提取和运用,针对飞机比例多样化的特点,设计了一组不同尺度的候选框集合,因此本文提出的算法在遥感图像目标检测领域有更好的效果。

4.2.3 检测结果展示

实验结果展示分为两组,第一组为图6,第二组为图7图6(a)表示原始图像,图6(b)为经过掩码区域提案网络检测过的图像,图6(c)为经过小物体掩码区域提案网络检测过的图像。从第一组图像中可以看出,掩码区域提案网络漏检了1架飞机,而小物体掩码区域提案网络将所有飞机都检测出来,明显发现改进网络在遥感图像上要优于原网络。

第二组的检测目标为不常见的战斗机,图7(a)为原图,图7(b)为经过掩码区域提案网络处理过的图像,图7(c)为小物体掩码区域提案网络处理过的图像。从第二组图中可以发现,掩码区域提案网络漏检了两架战斗机,小物体掩码区域提案网络漏检了一架战斗机,虽然两种检测框架都出现漏检,但小物体掩码区域提案网络性能要优于掩码区域提案网络,两种检测框架在战斗机检测方面都有漏检情况,造成该现象的原因主要是战斗机相对一般民用客机遥感影像信息较少,网络针对这方面训练不足。

图 6. 第一组对比图片。(a)原始图片;(b) Mask-RCNN检测过的图片;(c) SMask-RCNN检测过的图片

Fig. 6. First set of contrast pictures. (a) Original picture; (b) picture detected by Mask-RCNN; (c) picture detected by SMask-RCNN

下载图片 查看所有图片

图 7. 第二组对比图片。(a)原始图片;(b) Mask-RCNN检测过的图片;(c) SMask-RCNN检测过的图片

Fig. 7. Second set of contrast pictures. (a) Original picture; (b) picture detected by Mask-RCNN; (c) picture detected by SMask-RCNN

下载图片 查看所有图片

5 结论

提出了一种基于深度学习的高精度遥感图像飞机检测网络,该网络以原始掩码区域提案网络为基础,针对遥感影像中图像尺寸较大、检测目标较小和尺寸多样化的特点,提出了一种更加适合在遥感图像上应用的小物体掩码区域提案网络。从实验结果可以看出,改进后的小物体掩码区域提案网络与传统的快速区域提案网络相比,检测精度有较大的提高,在遥感图像飞机检测中有很好的应用前景。

参考文献

[1] ShaoW, YangW, LiuG, et al. Car detection from high-resolution aerial imagery using multiple features[C]∥2012 IEEE International Geoscience and Remote Sensing Symposium, July 22-27, 2012, Munich, Germany. New York: IEEE, 2012: 4379- 4382.

[2] 孙熊伟, 徐青山, 蔡熠, 等. 基于边缘相位编码的复杂背景下海天线检测[J]. 光学学报, 2017, 37(11): 1110002.

    Sun X W, Xu Q S, Cai Y, et al. Sea sky line detection based on edge phase encoding in complicated background[J]. Acta Optica Sinica, 2017, 37(11): 1110002.

[3] 朱明明, 许悦雷, 马时平, 等. 改进区域卷积神经网络的机场检测方法[J]. 光学学报, 2018, 38(7): 0728001.

    Zhu M M, Xu Y L, Ma S P, et al. Airport detection method with improved region-based convolutional neural network[J]. Acta Optica Sinica, 2018, 38(7): 0728001.

[4] 魏湧明, 全吉成, 侯宇青阳. 基于YOLO v2的无人机航拍图像定位研究[J]. 激光与光电子学进展, 2017, 54(11): 111002.

    Wei Y M, Quan J C. Hou Y Q Y. Aerial image location of unmanned aerial vehicle based on YOLO v2[J]. Laser & Optoelectronics Progress, 2017, 54(11): 111002.

[5] 宋明珠, 曲宏松, 金光. 含噪光学遥感图像海面弱小舰船目标检测[J]. 光学学报, 2017, 37(10): 1011004.

    Song M Z, Qu H S, Jin G. Weak ship target detection of noisy optical remote sensing image on sea surface[J]. Acta Optica Sinica, 2017, 37(10): 1011004.

[6] He KM, GkioxariG, DollárP, et al. Mask R-CNN[C]∥2017 IEEE International Conference on Computer Vision (ICCV), October 22-29, 2017, Venice, Italy. New York: IEEE, 2017: 2980- 2988.

[7] Ren SQ, He KM, GirshickR, et al. Faster R-CNN: towards real-time object detection with region proposal networks[C]∥Advances in Neural Information Processing Systems, December 7-12, 2015, Montreal, Quebec, Canada. Canada: NIPS, 2015: 91- 99.

[8] Cheng G, Zhou P C, Han J W. Learning rotation-invariant convolutional neural networks for object detection in VHR optical remote sensing images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(12): 7405-7415.

[9] SzegedyC, IoffeS, VanhouckeV, et al. Inception-v4, inception-ResNet and the impact of residual connections on learning[C]∥Thirty-First AAAI Conference on Artificial Intelligence, February 4-9, 2017, San Francisco, California, USA. Palo Alto: AAAI, 2017: 4278- 4284.

[10] Abdullahi HS, Sheriff RE, MahieddineF. Convolution neural network in precision agriculture for plant image recognition and classification[C]∥2017 Seventh International Conference on Innovative Computing Technology (INTECH), August 16-18, 2017, Luton, UK. New York: IEEE, 2017: 17354082.

[11] Li W M, Liu H Y, Wang Y, et al. Deep learning-based classification methods for remote sensing images in urban built-up areas[J]. IEEE Access, 2019, 7: 36274-36284.

[12] CozzolinoD, di MartinoG, PoggiG, et al. A fully convolutional neural network for low-complexity single-stage ship detection in Sentinel-1 SAR images[C]∥2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), July 23-28, 2017, Fort Worth, TX, USA. New York: IEEE, 2017: 886- 889.

[13] Zhang S, He G H, Chen H B, et al. Scale adaptive proposal network for object detection in remote sensing images[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(6): 864-868.

[14] XianX, HongL, Yang RF, et al. Oil tank extraction in high-resolution remote sensing images based on deep learning[C]∥2018 26th International Conference on Geoinformatics, June 28-30, 2018, Kunming, China. New York: IEEE, 2018: 18293574.

董永峰, 仉长涛, 汪鹏, 冯哲. 基于深度学习的光学遥感图像飞机检测算法[J]. 激光与光电子学进展, 2020, 57(4): 041007. Yongfeng Dong, Changtao Zhang, Peng Wang, Zhe Feng. Airplane Detection of Optical Remote Sensing Images Based on Deep Learning[J]. Laser & Optoelectronics Progress, 2020, 57(4): 041007.

本文已被 8 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!