基于深度特征金字塔和级联检测器的SAR图像舰船检测 下载: 1278次
1 引言
目前,最为常见的船只目标检测识别方法主要应用于可见光和合成孔径雷达(SAR)方面[1],利用SAR图像对海上舰船进行检测是SAR图像应用领域的一个研究热点。He等[2]将卷积神经网络(CNN)应用于目标检测,提出了R-CNN(Region-CNN)[3]。相关研究人员在此基础上提出了Fast R-CNN[4]和Faster R-CNN[5]等目标检测模型,均取得了良好的检测效果。杜兰等[6]充分利用数据集的多种特征信息,在样本不足的情况下,对于SAR图像中的目标检测效果提升显著。Kang等[7]利用CFAR(Constant False-Alarm Rate)对Faster R-CNN检测结果中分数较低的候选框进行检测,提高了舰船检测的准确率。
对李健伟等[8]建立的SAR舰船目标检测数据集(SSDD)开展实验,分析并总结该数据集与目标检测算法存在的问题:1)数据集中尺寸不一和角度不同的舰船为检测和识别带来很大困难;2)标准的Faster R-CNN检测算法由于后几层的感受野较大,空间信息损失严重,无法有效提取特征,从而出现漏检小目标的现象[9];3)SAR图像中舰船目标较为稀疏,目标与背景的准确分类在一定程度上影响目标检测精度。
针对上述问题,本文利用小目标数据增强(SDA)算法对数据进行预处理,在此基础上,利用深度特征金字塔(DFP)网络替换原特征提取网络,提取图像目标区域的语义成分与形状-空间关系特征,保留目标区域的空间信息,同时保护其他特征不丢失,为小尺寸目标的类别判定和边框定位奠定良好基础。SAR图像中舰船目标较为稀疏,级联结构(CS)具有更大优势,实验对原Faster R-CNN结构进行扩展并与多任务联合优化,使得目标检测的准确度得到较明显的提升。
2 算法原理
2.1 小目标数据增强
近年来,小目标检测领域的检测算法精度较差的原因之一是训练数据中缺少对小目标的再现。SAR图像中目标尺寸普遍较小,实验中发现真实目标(Ground-Truth object)与预测锚点(anchor)的重叠区域远远小于期望的IoU(Intersection-over-Union)值。无论从图像本身还是从像素的角度,训练的检测模型都无法学习到足够的小目标特征信息,原因在于:1)数据集中小目标的样本数量较少,检测模型无法学习到足够的特征信息;2)图像中小目标所在区域较小,且位置缺乏多样性。
针对第一个问题,对包含小目标的样本进行过采样促使模型更加关注小目标。实验中依次改变过采样率,分别为2、3和4,通过改变过采样率解决只有少部分样本包含小目标的问题,该方法最能直接缓解数据集样本不足并能够有效改善检测模型的性能。
针对第二个问题,对包含小目标的样本进行多次复制粘贴小目标来解决。粘贴前,将目标尺寸在±20%范围内进行缩放,在±15°范围内进行旋转,与图像边界保持至少5 pixel的距离且不与现有目标重叠。该方法增加了小目标位置的多样性,同时保证新的小目标出现在图像中合适区域。
先在训练过程中对包含小目标的图像进行过采样,再使用复制粘贴方法有效提高了小目标位置的多样性,检测模型的准确度得到了1.39%的提升,平衡了检测器在小目标与大目标中的表现。
2.2 Faster R-CNN的基本原理
基于CNN的目标检测框架先从待检测图像中生成尽可能多的目标区域,即候选区域的提取,在训练好的CNN中提取候选区域特征,最后利用这些特征对候选区域进行分类和边框回归,即位置微调。Faster R-CNN的基本思想:提出生成候选区域的区域推荐网络(RPN),将RPN和Fast R-CNN整合为一个可以端到端学习的网络,在不损失精度的前提下提升速度[10]。
Faster R-CNN检测框架如
2.3 深度特征金字塔提取网络
Faster R-CNN在PASCAL VOC数据集上的检测效果显著,却不适用于检测SAR图像中舰船目标,主要原因如下。
1) 舰船在图像中包含的像元数目较少,经采样后得到特征图的空间信息损失严重,难以预测小尺寸物体类别及边框[11]。
2) 从光学图像数据集学习到的特征不适用于SAR图像,因此Faster R-CNN的大部分特征仍需从SSDD数据集中去学习,才会有更好的检测效果。
针对上述两个问题,将Faster R-CNN的特征提取网络替换成DFP网络,如
该网络结构使用两个参数共享的网络来提取目标图像的语义信息。卷积层的低层响应描绘了特定的组成成分,高层响应看似抽象,但仍保持目标与背景的对应关系,这些成分对物体变化和背景变化具有很强的鲁棒性。卷积网络定义为fCNN(X;θ),其中X为输入,θ为参数,语义成分的表达式为
式中:
SAR图像中目标普遍较小且位置多变,颜色与纹理特征不明显,提取目标的颜色、纹理特征显然不可行,所以使用另外一个金字塔匹配网络学习图像中目标的形状-空间关系特征,确定目标间的相对位置及形状大小。形状-空间关系特征表达式为
式中:
2.4 级联检测器
Faster R-CNN用于目标检测所面临的问题:选择前景、背景作为正、负样本时,IoU的阈值不同会对结果产生较大影响,阈值太小会造成正样本(前景)中存在很多负样本(背景),阈值太大会造成正样本数量太少,加剧正负样本数量的不均衡。级联检测器将几个级联的卷积层中前几层的输出作为后几层的输入,界定正负样本的IoU阈值不断增加,逐层优化预测结果。目的是高准确率和高实时性地检测目标,VGG16(Visual Geometry Group 16)[13]因其拓展性强、泛化性好,被广泛应用在很多领域,以VGG16为例介绍级联的设计原理。
3 实验结果与分析
实验环境:利用Pytorch框架在SSDD数据集上训练检测器,操作系统为Ubuntu 16.04,计算机处理器为IntelR Xeon (R) CPU E5-1650v4@3.60 GHz和两块NVIDIA GTX1080ti GPU(12 G内存),利用CUDA9.0和CuDNN7.0加速。
在数据集SSDD上进行5种方法的实验,方法有Faster R-CNN、经过SDA改进的Faster R-CNN、基于DFP改进后的Faster R-CNN、基于CS改进的Faster R-CNN及结合上述方法改进后的检测模型。上述方法的检测结果如
从
表 1. 舰船检测结果
Table 1. Ship detection results
|
从数据集中选出不同尺寸的图像,及2月份渤海湾的SAR图像样张,如
图 4. 不同尺度和角度舰船检测结果。(a)(b)(c)大面积海域;(d)(e)(f)港口区域;(g)(h)(i)存在航迹干扰
Fig. 4. Ship detection results of different scales and angles. (a)(b)(c) Large areas of sea; (d)(e)(f) port areas; (g)(h)(i) track interference
从
4 结论
小目标数据增强算法解决了数据集样本不足的问题,使检测模型学习到更多特征,提升了检测器的性能。通过深度特征金字塔网络提取待检测目标的语义成分与形状-空间关系特征的相关性,与级联协同优化Faster R-CNN检测模型,提高各种尺寸和不同角度样本检测的鲁棒性。基于上述改进,在数据集上进行实验,实验结果表明:检测精度和召回率由原来的95.83%和82.31%提升到98.52%和84.59%,同时验证了每一点改进可提升的检测效果。基于深度学习的方法解决SAR图像中舰船检测问题,无需对图像进行去噪和海陆分割等操作,大大提高了检测效率。
[1] 王文秀, 傅雨田, 董峰, 等. 基于深度卷积神经网络的红外船只目标检测方法[J]. 光学学报, 2018, 38(7): 0712006.
[2] He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition[C]∥2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 27-30, 2016, Las Vegas, NV, USA. New York: IEEE, 2016: 770- 778.
[3] GirshickR, DonahueJ, DarrellT, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]∥2014 IEEE Conference on Computer Vision and Pattern Recognition, June 23-28, 2014, Columbus, OH, USA. New York: IEEE, 2014: 14632381.
[4] Sun X D, Wu P C. Hoi S C H. Face detection using deep learning: an improved Faster RCNN approach[J]. Neurocomputing, 2018, 299: 42-50.
[5] Ren S Q, He K M, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.
[6] 杜兰, 刘彬, 王燕, 等. 基于卷积神经网络的SAR图像目标检测算法[J]. 电子与信息学报, 2016, 38(12): 3018-3025.
Du L, Liu B, Wang Y, et al. Target detection method based on convolutional neural network for SAR image[J]. Journal of Electronics & Information Technology, 2016, 38(12): 3018-3025.
[7] KangM, Leng XG, LinZ, et al. A modified Faster R-CNN based on CFAR algorithm for SAR ship detection[C]∥2017 International Workshop on Remote Sensing with Intelligent Processing (RSIP), May 18-21, 2017, Shanghai, China. New York: IEEE, 2017: 16981074.
[8] 李健伟, 曲长文, 彭书娟, 等. 基于卷积神经网络的SAR图像舰船目标检测[J]. 系统工程与电子技术, 2018, 40(9): 1953-1959.
Li J W, Qu C W, Peng S J, et al. Ship detection in SAR images based on convolutional neural network[J]. Systems Engineering and Electronics, 2018, 40(9): 1953-1959.
[9] 侯冰基, 杨明辉, 孙晓玮. 基于改进Faster RCNN的毫米波图像实时目标检测[J]. 激光与光电子学进展, 2019, 56(13): 131009.
[10] 冯小雨, 梅卫, 胡大帅. 基于改进Faster R-CNN的空中目标检测[J]. 光学学报, 2018, 38(6): 0615004.
[11] 任之俊, 蔺素珍, 李大威, 等. 基于改进特征金字塔的Mask R-CNN目标检测方法[J]. 激光与光电子学进展, 2019, 56(4): 041502.
[12] Chen Y C, Zhu X T, Zheng W S, et al. Person re-identification by camera correlation aware feature augmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(2): 392-408.
[13] SimonyanK, Zisserman A. Very deep convolutional networks for large-scale image recognition[EB/OL]. ( 2015-04-10)[2019-10-13]. https:∥arxiv.org/abs/1409. 1556.
[14] 张松龙, 谢林柏. 基于级联全卷积神经网络的显著性检测[J]. 激光与光电子学进展, 2019, 56(7): 071501.
赵云飞, 张宝华, 张艳月, 谷宇, 王月明, 李建军, 赵瑛. 基于深度特征金字塔和级联检测器的SAR图像舰船检测[J]. 激光与光电子学进展, 2020, 57(12): 121019. Yunfei Zhao, Baohua Zhang, Yanyue Zhang, Yu Gu, Yueming Wang, Jianjun Li, Ying Zhao. Ship Detection Based on SAR Images Using Deep Feature Pyramid and Cascade Detector[J]. Laser & Optoelectronics Progress, 2020, 57(12): 121019.