基于深度学习的二值测量矩阵自适应构建方法 下载: 617次
1 引言
近年来,计算鬼成像(CGI)[1-2]作为一种新颖的单像素成像技术,已引起了研究人员的广泛关注。该技术利用空间光调制器件(SLM)或数字微镜阵列(DMD)产生特定的光强度分布,代替传统鬼成像技术中的参考光路,仅用单探测光路和单像素探测器即可完成成像过程。该成像方式具备高分辨、高灵敏度和抗环境干扰等特征,结合激光雷达技术将有助于突破现有成像技术在自动驾驶、三维场景构建、环境探测等应用中的技术瓶颈,推动该技术的实用化进程。然而为了得到高质量的图像,计算鬼成像需要大量的测量次数,不仅影响系统的运行效率,还对硬件的性能和资源空间提出了很高的要求。然而压缩感知理论(CS)[3-6]的发展,给计算鬼成像带来了新的解决思路。
压缩感知理论作为一种新的图像采集和重建的技术,可以在保证信号不受损失的情况下,用比Nyquist-Shannon采样定理少得多的样本来恢复信号。压缩感知中的压缩即使用测量矩阵对信号中的重要信息进行采样。因此,测量矩阵的质量直接影响到信号的重构效果。目前,主要存在两种矩阵的设计方式,一种是随机测量矩阵,另一种是确定性测量矩阵。随机测量矩阵,例如随机高斯矩阵[7-8]、伯努利矩阵[9]等通常在硬件的实现上比较困难,限制了它们的应用范围。因此确定性矩阵,如托普利兹矩阵、多项式矩阵等[10]成为人们研究的对象。文献[ 11-12]分别利用多项式映射矩阵和光正交码作为确定性测量矩阵的构造方法。文献[ 13]利用非相干性准则[14]提出了一种设计确定性测量矩阵的方法,该方法通过降低测量矩阵与稀疏基的相干性,进而减少压缩采样所需要的测量次数。文献[ 15]对稀疏循环矩阵进行研究,提出了一种0-1稀疏循环矩阵。文献[ 16]考虑到硬件平台实现的复杂性,基于小波变换和伪随机序列矩阵构建了一种新型的确定性二值测量矩阵,并将其用于嵌入式视觉系统。文献[ 17]提出了一种基于“Russian Dolls”的Hadamard基的优化排序方法,该方法可以利用场景中的稀疏性,达到确定性采样的目的,同时可以显著加快图像的重建速度。文献[ 18]也对Hadamard矩阵的优化排序算法进行研究,提出了一种基于Haar小波变换系数的最优排序算法,可以实现低采样率条件下的快速重建。然而,确定性矩阵虽然改正了随机测量阵的缺点,但是矩阵的稀疏度不足,还将需要更多的观测次数来获得高质量的图像。
考虑到卷积神经网络[19]强大的学习能力,研究人员提出了一些用于压缩感知测量与重建任务的卷积神经网络[20-24]。文献[ 24]提出了一种残差编解码网络进行压缩感知成像,其使用二值化的全连接层替代高斯随机阵实现图像的采样过程,但是由于全连接层包含大量的训练参数,只能使用小的图像块进行重构。
本文根据压缩感知理论,从观测矩阵的稀疏性、硬件实现的简单性等角度出发,设计了一种构造自适应二值测量矩阵的采样网络。该网络利用卷积层模拟图像的压缩采样过程,并通过图像训练对测量矩阵进行自适应更新,避免了使用全连接层引起的参数量大的问题。同时,搭建了激光主动照明计算鬼成像系统,对构造的二值测量矩阵进行实验,验证其可行性。
2 基本原理
2.1 基于压缩感知的计算鬼成像原理
压缩感知理论允许将高维信号投影到低维空间中,同时当信号在某个域中稀疏时,可以从投影空间中精确地恢复信号。对于N维的离散信号x,假设其在变换域Ψ下稀疏,利用与Ψ不相关的测量矩阵对其进行M(M=N)次测量,即可得到观测向量y,表示为
式中:Φ为M×N的测量矩阵;y∈RM为信号x的观测向量;s为信号x在变换域Ψ下的一组K-稀疏信号。根据压缩感知理论,x的求解过程可以转化为l1最小化问题[25-26],表示为
如果信号x本身就满足稀疏性条件,则(2)式可以重新表示为
在计算鬼成像系统中,假设A为探测矩阵,T为目标物体的透射函数,则基于压缩感知的计算鬼成像模型表示为[27]
为了求解(4)式中的优化问题,常用的方法有凸优化方法[28]、贪婪算法[29-30]等。本文使用的求解算法为交替方向乘子(ADMM)法[28]。
2.2 采样网络模型
式中:S(Ι)代表图像的采样函数;Ι表示输入的图像信号;WS表示卷积层的权重参数;而符号“
网络的第二个卷积负责对信号进行复原操作,称之为复原卷积。为了得到复原的图像信号
式中:Winv表示复原卷积层的权重参数。对于每一个图像块,采样卷积层输出大小为1×1×nB的向量,因此复原卷积的滤波器大小应为1×1×nB。为了恢复信号到原始维度,复原卷积的通道数应设置为lB2。因此,
2.3 二值测量矩阵训练方法
在实际的应用环境中,如DMD[31]只能加载二值型(0-1)的稀疏测量矩阵,而卷积层的训练参数为浮点型。为了得到二值型(0-1)的测量矩阵,目前常用的方式是将网络中的采样参数WS限制为0-1后重新训练,然而此方式必然会带来精度上的损失。同时由于网络结构比较简单,单纯将卷积层中的参数二值化后很难使网络收敛。因此本文在
该网络与
式中:WB为二值化后的权重参数;t为阈值,用于控制测量矩阵的稀疏性。但是如果仅仅对参数进行二值化会造成网络难以收敛,同时也会造成精度的下降。因此,在该层后面加入了一个卷积核为1×1×nB的卷积层,来模拟参数二值化步骤的逆过程,该层不改变特征通道大小,也即该层的输入输出通道数相同,则整个采样模块可以表示为
式中:WI表示求逆层中的权重参数;
网络的训练策略如下:1)对
网络训练使用BSDS500数据集[32],首先将图像进行灰度化并使用数据扩增方式扩充数据集;其次将图像统一缩放为128×128分辨率大小,同时设置图像块大小为8×8,也即B=8,这里B需要满足被图像的宽和高整除;最后使用均方误差(MSE)损失进行优化训练。
本文所提出的二值化采样网络具有以下几个优点:1)网络模型简单,只使用了3个卷积层,且可以训练任意大小的图像块;2)二值化采样网络可以自适应的构造二值测量矩阵;3)通过修改(7)式中的参数t,可以控制二值测量矩阵中每行1的个数。
3 数值模拟与成像实验
3.1 图像数值模拟实验
根据本文提出的采样网络,分别构造了三种不同采样率下的二值测量矩阵,采样率(SR)分别为10%、20%和50%。同时为了加以比较,使用随机高斯阵,基于沃尔什优化排序的哈达玛矩阵和托普利兹矩阵在相同条件下进行实验。图像的分辨率大小为128×128,评价指标为峰值信噪比(PSNR)[33]和结构相似度(SSIM)[34],其中SSIM的取值范围为0到1,其值越大越好。
图 3. 本文仿真实验使用的图像。(a)Ball;(b)Face
Fig. 3. Original images used in simulation experiment. (a) Ball; (b) Face
图 4. 不同测量矩阵的仿真结果。(a)~(f)随机高斯阵的结果;(g)~(l)托普利兹矩阵的结果;(m)~(r)哈达玛矩阵的结果;(s)~(x)本文测量矩阵的结果
Fig. 4. Simulation results of different measurement matrices. (a)--(f) Results of random Gaussian matrix; (g)--(l) results of Toeplitz matrix; (m)--(r) results of Hadamard matrix; (s)--(x) results of proposed matrix
比较
表 1. 不同测量矩阵在不同采样率下的PSNR结果
Table 1. PSNR results of different measurement matrices under different sampling rates
|
表 2. 不同测量矩阵在不同采样率下的SSIM结果
Table 2. SSIM results of different measurement matrices under different sampling rates
|
3.2 激光成像实验
为了验证本文提出的二值化测量矩阵的实际效果,搭建激光主动照明计算鬼成像系统,其结构和实物分别如
图 5. 基于压缩感知的计算鬼成像装置图。(a)原理图;(b)实物图
Fig. 5. Ghost imaging system structure based on compressed sensing. (a) Principle diagram; (b) picture
实验时,物体放置于激光探测器的正前方约6 m的位置,重构图像的分辨率为128×128,确定采样次数M,将本文构造的二值测量矩阵生成M幅图像,并依次被DMD加载。激光器发射光束经过DMD调制后照射在目标物体上,经探测器接收后即可得到每次测量的光强波形图,将波峰作为观测值yi。M次探测后即可得到观测向量y,经压缩感知算法可计算得到x,将x的范围归一化到0~255,即可得到反演的图像。为了进一步统计重构图像的PSNR和SSIM,根据激光在目标图像上的光斑范围,从相机拍摄的图像中匹配出目标图像。
图 6. 激光成像实验目标图像。(a)Target1; (b)Target2
Fig. 6. Target images of laser imaging experiment. (a) Target1; (b) Target2
图 7. 不同采样率(SR)下的激光成像实验结果。(a)~(f)随机高斯阵的结果;(g)~(l)托普利兹矩阵的结果;(m)~(r)哈达玛矩阵的结果;(s)~(x)本文测量矩阵的结果
Fig. 7. Results of laser imaging under different sampling rates. (a)--(f) Results of random Gaussian matrix; (g)--(l) results of Toeplitz matrix; (m)--(r) results of Hadamard matrix; (s)--(x) results of proposed matrix
表 3. 不同测量矩阵下的激光成像结果的PSNR
Table 3. PSNR of laser imaging results under different measurement matrices
|
表 4. 不同测量矩阵下的激光成像结果的SSIM
Table 4. SSIM of laser imaging results under different measurement matrices
|
4 结论
结合压缩感知实际的应用情况,本文提出了一种基于深度学习的二值测量矩阵的构建方法:通过卷积来模拟图像的压缩采样过程,卷积参数在网络训练阶段自适应的学习,减少了人为设计测量矩阵的难度。然后,对设计的测量矩阵进行压缩感知成像模拟,仿真结果显示:所提测量矩阵相比其他常用测量矩阵拥有最好的图像重构效果,并且使得系统在低采样率条件下实现高质量的重构,有助于提高系统运行效率。最后搭建了激光主动照明计算鬼成像系统,验证了所构造的测量矩阵在实际应用中的可行性,也进一步说明了基于深度学习的二值测量矩阵设计方法可以满足实际的应用需求。今后的工作以提高成像效率为目标,将围绕基于深度学习的重构网络进行持续性的研究。
[1] Zhai X, Cheng Z D, Liang Z Y, et al. Computational ghost imaging via adaptive deep dictionary learning[J]. Applied Optics, 2019, 58(31): 8471-8478.
[2] Erkmen B I. Computational ghost imaging for remote sensing[J]. Journal of the Optical Society of America A, 2012, 29(5): 782-789.
[3] Donoho D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.
[4] Candes E J, Wakin M B. An introduction to compressive sampling[J]. IEEE Signal Processing Magazine, 2008, 25(2): 21-30.
[5] Huang YK, Wei JB, Yue SS. High-order Markov random fields-based compressed sensing for multispectral reconstruction[C] //2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), July 10-15, 2016, Beijing, China.New York: IEEE Press, 2016: 7208- 7211.
[7] Candes E J, Tao T. Decoding by linear programming[J]. IEEE Transactions on Information Theory, 2005, 51(12): 4203-4215.
[8] Candès E J, Romberg J K, Tao T. Stable signal recovery from incomplete and inaccurate measurements[J]. Communications on Pure and Applied Mathematics, 2006, 59(8): 1207-1223.
[9] 柯钧, 张临夏, 周群. 压缩感知在光学成像领域的应用[J]. 光学学报, 2020, 40(1): 0111006.
[10] 王强, 张培林, 王怀光, 等. 压缩感知中测量矩阵构造综述[J]. 计算机应用, 2017, 37(1): 188-196.
Wang Q, Zhang P L, Wang H G, et al. Survey on construction of measurement matrices in compressive sensing[J]. Journal of Computer Applications, 2017, 37(1): 188-196.
[11] DeVore R A. Deterministic constructions of compressed sensing matrices[J]. Journal of Complexity, 2007, 23(4/5/6): 918-925.
[13] 李炳杰, 吕园, 叶萌, 等. 基于非相干准则的压缩感知观测矩阵设计的极大极小方法[J]. 空军工程大学学报(自然科学版), 2011, 12(5): 81-84, 94.
Li B J, Lü Y, Ye M, et al. The minimax method of design of measurement matrices for compressed sensing based on incoherence criterion[J]. Journal of Air Force Engineering University (Natural Science Edition), 2011, 12(5): 81-84, 94.
[14] Blanchard J D, Cartis C, Tanner J. Decay properties of restricted isometry constants[J]. IEEE Signal Processing Letters, 2009, 16(7): 572-575.
[15] 程涛, 朱国宾, 刘玉安. 基于0-1稀疏循环矩阵的测量矩阵分离研究[J]. 光学学报, 2013, 33(2): 0220001.
[16] 刘继忠, 金明亮, 马如远, 等. 一种基于小波稀疏确定性简单二值观测矩阵的嵌入式视觉压缩传感实现方法[J]. 中国激光, 2013, 40(11): 1109002.
[17] Sun M J, Meng L T, Edgar M P, et al. A Russian Dolls ordering of the Hadamard basis for compressive single-pixel imaging[J]. Scientific Reports, 2017, 7(1): 3464.
[18] 李明飞, 阎璐, 杨然, 等. 基于Hadamard矩阵优化排序的快速单像素成像[J]. 物理学报, 2019, 68(6): 064202.
Li M F, Yan L, Yang R, et al. Fast single-pixel imaging based on optimized reordering Hadamard basis[J]. Acta Physica Sinica, 2019, 68(6): 064202.
[19] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90.
[20] MousaviA, Baraniuk RG. Learning to invert: signal recovery via deep convolutional networks[C] //2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), March 5-9, 2017, New Orleans, LA, USA. New York: IEEE Press, 2017: 2272- 2276.
[21] KulkarniK, LohitS, TuragaP, et al.ReconNet: non-iterative reconstruction of images from compressively sensed measurements[C] //2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 27-30, 2016, Las Vegas, NV, USA. New York: IEEE Press, 2016: 449- 458.
[22] Shi W Z, Jiang F, Liu S H, et al. Image compressed sensing using convolutional neural network[J]. IEEE Transactions on Image Processing, 2020, 29: 375-388.
[23] Xie XM, Wang YX, Shi GM, et al. Adaptive measurement network for CS image reconstruction[M] //Yang J F, Hu Q H, Cheng M M, et al. CCCV 2017: computer vision. Communications in computer and information science. Singapore: Springer, 2017, 772: 407- 417.
[24] 管焰秋, 鄢秋荣, 杨晟韬, 等. 基于残差编解码网络的单光子压缩成像[J]. 光学学报, 2020, 40(1): 0111022.
[25] Donoho D L. For most large underdetermined systems of linear equations the minimal 1-norm solution is also the sparsest solution[J]. Communications on Pure and Applied Mathematics, 2006, 59(6): 797-829.
[26] Candès E J, Wakin M B, Boyd S P. Enhancing sparsity by reweighted ℓ1 minimization[J]. Journal of Fourier Analysis and Applications, 2008, 14(5/6): 877-905.
[27] 闫国庆, 杨风暴, 王肖霞, 等. 基于正交化正弦散斑的计算鬼成像[J]. 激光与光电子学进展, 2020, 57(4): 041019.
[28] Lu C Y, Feng J S, Yan S C, et al. A unified alternating direction method of multipliers by majorization minimization[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(3): 527-541.
[30] 王丽, 王威, 刘勃妮. 高光谱图像的埃尔米特压缩感知重构算法[J]. 激光与光电子学进展, 2020, 57(14): 141032.
[31] Duarte M F, Davenport M A, Takhar D, et al. Single-pixel imaging via compressive sampling[J]. IEEE Signal Processing Magazine, 2008, 25(2): 83-91.
[33] Wang Z, Bovik A C. A universal image quality index[J]. IEEE Signal Processing Letters, 2002, 9(3): 81-84.
[34] Wang Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
Article Outline
韩捷飞, 连博博, 孙立颖. 基于深度学习的二值测量矩阵自适应构建方法[J]. 激光与光电子学进展, 2021, 58(22): 2220001. Jiefei Han, Bobo Lian, Liying Sun. Adaptive Construction Method for Binary Measurement Matrix Based on Deep Learning[J]. Laser & Optoelectronics Progress, 2021, 58(22): 2220001.