基于改进生成对抗网络的水下激光图像后向散射光修复方法 下载: 1155次
1 引言
水下激光成像技术是利用主动光源对目标进行照明,同时用成像器件对目标进行成像,获得目标图像的过程。相比声探测,它具有更高的分辨率;相比普通光成像,它具有更远的探测距离。但由于水体对光的吸收和散射,导致图像质量下降严重,尤其是视场中近距离水体的后向散射光会增强背景光噪声,虽然目前常采用距离选通成像技术[1]、同步扫描技术[2]和水下偏振成像技术[3]等来减小后向散射光的影响,但由此获得的水下激光图像仍然具有目标边缘模糊、细节难以分辨的特点,需采用图像处理技术对其进行处理,以获得目标清晰可见的图像[4]。
目前水下激光成像技术主要采用均匀照明的激光作为照明光源,以获得亮度均匀的目标图像,这在近距离成像时能够获得较好的效果,但无法解决强烈的后向散射光背景噪音和视距受限的问题[5]。如果直接增大光功率,并不能对图像质量和探测距离有较大的提升[6],而如果直接采用激光束进行照明,可极大地提升探测距离,但由于后向散射光的积累效应,图像存在一条明显的光束,同时复杂的水下环境会导致图像噪声增大,且噪声类型复杂。针对水下激光图像低对比度和低信噪比问题,常用的图像处理研究主要集中在去噪和增强对比度两个方面,提出的方法有小波去噪[7]、三维块匹配去噪(BM3D)[8]、分段直方图均衡化[9]、中值滤波[10]和暗通道先验[11]等以及一些传统的图像去噪和对比度增强方法。针对后向散射光束问题,处理方法较少,且处理结果有待提高。
近年来,基于深度学习的图像修复技术得到了广泛的关注和研究。自2014 年Goodfellow[12]创造性地提出生成对抗网络(GAN)之后,生成对抗网络就成为了深度学习方面的一个研究热点,学者们利用生成对抗网络对图像进行填补修复,同时去除噪声、提升信噪比。如Yeh等[13]利用生成对抗对图像缺失部分进行语义修复,完成对人脸图像大面积缺失区域的修复; Iizuka等[14]提出利用基于全局和局部的生成对抗网络填充任意形状的缺失区域来完成图像修复工作; Liu等[15]利用盲图像修复的方法对被任意文字覆盖的图像进行修复。在利用激光束照明的水下激光图像中,后向散射光束为一条明显的白色条形区域,这可近似理解为一幅完整的噪声图像缺失了该区域。因此本文引入生成对抗网络方法,采集后向散射光严重的真实水下激光图像,再加入高斯噪声和椒盐噪声,建立训练集和测试集,利用改进的具有跳跃结构和空洞卷积的生成对抗网络对水下激光图像进行修复,实现后向散射光和噪声的去除。基于深度学习的图像修复方法是依靠数据驱动的,直接从待修复图像和样本图像之间学习修复参数,是一种端对端的处理方式,不需要对水下退化模型进行模拟推测,可以快速完成图像修复工作且获得较好的质量。
2 水下激光图像修复模型设计
2.1 网络结构概览
生成对抗网络是一种近年来广受欢迎的深度学习模型,生成对抗网络由一个判别网络(discriminator) 和一个生成网络(generator)组成。在训练过程中,生成网络的目标是生成尽量真实的、接近自然的图像去欺骗判别网络,而判别网络的目标则是尽量把生成网络生成的图像和采集的真实目标图像区分出来(real or fake),利用生成网络和判别网络构成动态“博弈过程”,最终达到纳什平衡[16],此时生成网络能够生成接近原始学习内容的自然水下图像,完成对图像的修复工作。
生成网络的结构设计多种多样,如Alex网络(AlexNet)、残差网络(ResNet)、VGGNet(Visual Geometry Group Net)和谷歌网络(GoogleNet)等,这些结构并不能直接用于水下激光图像的修复。针对水下激光图像的修复需要去除噪声和后向散射光、提高对比度和改善非均匀性照明等,本文设计一种包含编解码结构、空洞卷积和跳跃结构的生成网络,与判别网络相结合,形成生成对抗网络,编解码结构用于改变特征图尺寸,空洞卷积用于提升卷积核的感受野,跳跃结构使后层特征图能够提取到最前层特征图信息。网络结构如
2.2 生成网络设计
为了使训练能够有一个稳定的开始,本研究不是从噪声图像中生成图像,而是从采集的有严重后向散射的水下激光图像生成接近于目标的图像。生成网络首先利用编码结构降低图像尺寸以减少内存消耗和计算时间,再使用转置卷积层将输出恢复到原始尺寸。空洞卷积使用离散的卷积核,在不改变网络参数和计算能力的条件下,使每个输出像素对应更大的输入区域,提升感受野[17]。
表 1. 生成网络的详细配置信息
Table 1. Detailed configuration information of the generator networkpixel
|
2.3 判别网络设计
判别网络的任务是判断图像是真实的还是生成的。本文中的判别网络将一个256 pixel×256 pixel图像作为输入,对步幅设置为2,并逐渐减小输入特征图尺寸,同时增加输出特征图的维度。与生成网络不同的是判别网络中所有的卷积核尺寸都为5 pixel×5 pixel,这既可以增大卷积核的感受野,也可以快速缩小输出特征图尺寸。最后通过全连接层和sigmoid激活函数将网络的输出限制为[0,1]区间内的一个连续概率值,该值表示输入判别网络的图像是真实图像的概率,
表 2. 判别网络的详细配置信息
Table 2. Detailed configuration information of the discriminator networkpixel
|
2.4 模型的训练
由2.1节可知,生成对抗网络训练时,判别网络用来区分图像的真假,生成网络用来欺骗判别网络,整个网络优化的是一个最小化和最大化相冲突的目标,因此会极不稳定,需要谨慎地进行训练。本文训练过程分为3个步骤:
1) 训练
2) 固定生成网络的权重,训练
3) 联合训练生成网络和判别网络,直到训练结束。
为了使整个网络完成水下激光图像后向散射光的修复工作,本文选择均方根误差损失函数(MSE)和生成对抗网络损失函数(GAN loss)[12],其中,MSE用于提高训练的稳定性,GAN loss用于提高输出结果的真实性,使用两种损失函数可输出更加真实的高性能网络模型。
用
GAN损失函数将神经网络的标准优化问题转化为最小-最大优化问题,表达式为
式中:
式中:
联合训练过程中,生成网络和判别网络的权重和偏差不断改变,用
对于判别网络,训练方式与生成网络相同,但参数更新的方向与生成网络相反。
3 模型分析
3.1 数据集与训练
在水下光电图像采集系统中进行水下激光图像数据集的采集时,将中心波长为532 nm的激光入射到清水中,放入训练集目标,利用CCD(Charge Coupled Device)相机采集待修复的水下激光图像,此时可获得带有严重后向散射光的水下激光图像,然后将激光器换为光源尺寸为9 cm×9 cm的LED(Light Emitting Diode)白光面光源,调节亮度使得图像亮度与待修复的图像亮度相近并能清晰观察到目标细节,采集与待修复图像对应的样本图像。本研究主要研究对后向散射光的去除,但为模拟真实水下环境中既有后向散射又有噪声的情况,在采集的待修复水下激光图像上加入均值为0、方差范围为20~25的高斯噪声和噪声密度范围为0.01~0.015的椒盐噪声,作为训练集。
图 2. 训练集示意图。(a)样本图像;(b)后向散射光图像;(c)添加混合噪声的图像
Fig. 2. Schematic of training set. (a) Sample image; (b) image with backscattered light; (c) image with mixed noise
利用带有混合噪声的水下激光图像和对应的样本图像构成训练集,再通过镜像和旋转等方法扩充训练集。为减小内存消耗并提高模型的训练速度,在训练时将图像大小缩小为256 pixel×256 pixel。此外将训练目标换为测试目标,用同样的方法建立测试集,最终用于训练和测试的数据集结构,如
表 3. 数据集结构
Table 3. Structure of data set
|
深度学习需要调节的超参数多,调试过程复杂,本研究通过实验分析确定核心参数,最终确定优化函数(Optimizers),选择Adam,初始学习率(Learning rate)选择0.001,批次规模(Batch size)选择4,训练次数选择240。对其余优先级较低的超参数采用常规默认设置,如网络的权重初始化采用he_normal,偏差全部初始化为0,激活函数采用线性整流激活函数(ReLU),网络优化目标函数中的权重超参数
3.2 模型结构分析
本研究对模型的改进主要体现在生成网络的跳跃结构和空洞卷积上,如果去掉生成网络的跳跃结构,则为常规深度卷积神经网络(VGG)风格的神经网络[18],网络的深度会导致深层网络无法更多地提取底层特征信息;空洞卷积让生成网络能够对输入特征图进行不同尺度特征的提取,使得最终修复图像保留原始目标的更多细节结构。
3.2.1 空洞卷积
空洞卷积能够有效增加网络的感受野,但空洞卷积的加入也可能造成网络参数冗余,甚至引起过拟合,通过对比空洞卷积层数对结果的影响来确定最佳空洞卷积数量。如
3.2.2 跳跃结构
跳跃结构通过将底层特征图与后续层特征图相互组合,使后续层卷积核能够提取到底层特征图的特征,保证了特征的有效传递。对比模型在有无跳跃结构时的测试误差,如
4 实验测试结果
采用第3节选取的超参数和结构对模型训练完毕后,利用训练好的模型对测试集进行测试,并与目标图像进行对比。训练时的训练集和验证集收敛曲线如
在图像处理过程中,如果直接对噪声图像进行增强,会使得噪声被放大,不易滤除,因此均采用先去噪再增强对比度的顺序对图像进行处理。先后用传统BM3D和中值滤波(Median filter)方法对图像去除高斯噪声和椒盐噪声,再增强图像对比度,增强方法选择暗通道先验方法(DCP)和一种结合直方图均衡化与带彩色恢复的多尺度视网膜增强联合图像增强算法(HEMSRCR)。HEMSRCR是由李锦等[19]2014年提出的将直方图均衡化(HE)和MSRCR增强进行加权求和的图像增强方法,本研究通过实验最终选取HE权重为0.05,MSRCR权重为0.95。将所提方法结果与传统混合方法结果进行对比,衡量所提方法去噪和增强对比度的能力。由于还未出现针对水下激光图像的光束修复方法,因此所提方法对后向散射光的去除效果只能通过人眼直观感受进行评价。
图 6. 噪声参数为(0,20 dB,0.01)的处理结果。(a)目标图像;(b)待修复图像;(c) Denoise+DCP;(d) Denoise+HEMSRCR;(e)所提方法
Fig. 6. Processing results of noise parameter (0, 20 dB, 0.01). (a) Target image; (b) image to be repaired; (c) Denoise+DCP; (d) Denoise+HEMSRCR; (e) proposed method
图 7. 噪声参数为(0,25 dB,0.015)的处理结果。(a)目标图像;(b)待修复图像;(c) Denoise+DCP;(d) Denoise+HEMSRCR;(e)所提方法
Fig. 7. Processing results of noise parameter (0, 25 dB, 0.015). (a) Target image; (b) image to be repaired; (c) Denoise+DCP; (d) Denoise+HEMSRCR; (e) proposed method
图 8. 噪声参数为(0,30 dB,0.02)的处理结果。(a)目标图像;(b)待修复图像;(c) Denoise+DCP;(d) Denoise+HEMSRCR;(e)所提方法
Fig. 8. Processing results of noise parameter (0, 30 dB, 0.02). (a) Target image; (b) image to be repaired; (c) Denoise+DCP; (d) Denoise+HEMSRCR; (e) proposed method
最后对多个测试结果的峰值信噪比(PSNR)和特征相似度(FSIM)进行计算,FSIM在各种全参考图像质量评价算法中准确度相对较高,值越高说明目标的细节保留越好[20],结果如
表 4. 不同测试图像的PSNR
Table 4. The PSNR of different test imagesdB
|
表 5. 不同测试图像的FSIM
Table 5. The FSIM of different test imagesdB
|
在Intel Core i7-7700 CPU@4.20 GHz平台上分别对尺寸为256 pixel×256 pixel、512 pixel×512 pixel和960 pixel×960 pixel的图像进行耗时测试,结果如
表 6. 不同方法的时间
Table 6. Time of different methods
|
5 结论
通过改进获得了一种用于水下激光图像修复的生成对抗网络,网络由跳跃结构、空洞卷积和转置卷积组成,学习从水下激光图像到样本图像的端到端映射参数。卷积层充当特征提取器,利用空洞卷积捕获图像不同尺度的特征,同时消除噪声,转置卷积用于恢复图像尺寸。跳跃结构允许输入图像几乎直接连接到生成网络的底层,保证底层信息的有效传递。利用自建训练集对模型进行训练和测试,结果表明所提方法能够快速去噪并去除后向散射光,同时改善图像的非均匀性照明问题,使图像更符合人眼视觉感受。
本研究主要是探索对水下激光图像强后向散射光的去除,同时考虑到生成对抗网络需要极大规模的数据集,大规模采集一一对应的噪声图像和对应样本图像难度大,因此采用添加模拟噪声的方式。下一步需改进数据集结构,增加带有严重后向散射光和真实水下噪声的激光图像,减小网络规模,提升网络的泛化能力和运算速度。
[1] 王磊, 徐智勇, 张启衡, 等. 距离选通水下激光成像系统设计及实验[J]. 激光与光电子学进展, 2012, 49(5): 051101.
[2] 卢明腾, 苏显渝, 曹益平, 等. 同步扫描的调制度测量轮廓术三维面形重建算法[J]. 中国激光, 2016, 43(3): 0308006.
[3] 杨力铭, 梁健, 张文飞, 等. 基于非偏振光照明的水下偏振成像目标增强技术[J]. 光学学报, 2018, 38(6): 0611003.
[4] 黄子吉, 肖杰, 陆安江, 等. 几种图像去噪方法的比较研究[J]. 通信技术, 2017, 50(11): 2465-2471.
[6] 韩宏伟, 张晓晖. 水下激光图像增强方法研究[J]. 激光与红外, 2007, 37(10): 1105-1108.
[7] 淦元柳, 李富栋. 水下图像的噪声滤波与仿真[J]. 激光与红外, 2013, 43(3): 306-310.
[8] Xie JY, Xu LL, Chen EH. Image denoising and inpainting with deep neural networks[C]∥NIPS'12 Proceedings of the 25th International Conference on Neural Information Processing Systems, December 03-06, 2012, Lake Tahoe, Nevada. New York: ACM, 2012: 341- 349.
[9] 韩宏伟, 张晓晖, 葛卫龙. 水下激光距离选通成像系统的模型与极限探测性能研究[J]. 中国激光, 2011, 38(1): 0109001.
[10] 刘雪明, 张明德, 孙小菡. 一种新型水下激光成像系统[J]. 中国激光, 2000, 27(3): 206-210.
[11] 闻东海, 江月松, 张绪国, 等. 激光偏振成像散斑统计特性和抑制方法研究[J]. 光学学报, 2013, 33(3): 0311003.
[12] Goodfellow IJ, Pouget-AbadieJ, MirzaM,et al. Generative adversarial nets[C/OL]∥International Conference on Neural Information Processing Systems, June 10, 2014.[S.l.:s.n.], 2014: 2672- 2680.
[13] Yeh RA, ChenC, Lim TY,et al. Semantic image inpainting with deep generative models[C]∥IEEE Conference on Computer Vision and Pattern Recognition, July 21-26, 2017, Honolulu, HI, USA. New York: IEEE, 2017: 6882- 6890.
[15] LiuY, PanJ, Su Z. Deep blind image inpainting[EB/OL]. ( 2017-12-27)[2018-08-11].
[16] Ratliff LJ, Burden SA, Sastry SS. Characterizationand computation of local nash equilibria in continuous games[C]∥Annual Allerton Conference on Communication Control and Computing, October 2-4, 2013,Monticello, IL, USA. New York: IEEE, 2013: 917- 924.
[18] SimonyanK, Zisserman A. Very deep convolutional networks for large-scale image recognition[EB/OL]. ( 2015-04-10)[2018-08-12].
[19] 李锦, 王俊平, 万国挺, 等. 一种结合直方图均衡化和MSRCR的图像增强新算法[J]. 西安电子科技大学学报(自然科学版), 2014, 41(3): 103-109.
[20] ZhangL, ZhangL, Mou XQ, et al. A comprehensive evaluation of full reference image quality assessment algorithms[C]∥IEEE International Conference on Image Processing, September 30- October 3, 2012, Orlando, FL, USA. New York: IEEE, 2012: 1477- 1480.
Article Outline
张清博, 张晓晖, 韩宏伟. 基于改进生成对抗网络的水下激光图像后向散射光修复方法[J]. 激光与光电子学进展, 2019, 56(4): 041004. Qingbo Zhang, Xiaohui Zhang, Hongwei Han. Backscattered Light Repairing Method for Underwater Laser Image Based on Improved Generative Adversarial Network[J]. Laser & Optoelectronics Progress, 2019, 56(4): 041004.