基于张量截断核范数的高光谱图像超分辨率重构 下载: 998次
1 引言
高光谱图像(HSI)已广泛用于医学诊断、文献成像、犯罪现场分析等众多领域[1-2]。但由于受到成像设备和环境等限制,HSI的空间几何分辨率很低,难以满足实际应用需求。因此,提高HSI的空间分辨率,实现HSI的超分辨率重构(SR),是一个非常重要的问题。图像的SR是由一个或多个低分辨率图像获取高分辨率图像的过程。针对HSI的SR问题,一种简单的做法就是将自然图像的SR模型算法直接推广应用到HSI的SR问题[3]中。尽管自然图像和HSI存在相似之处,但是随着HSI光谱维度的急剧增加,这类直接推广的做法存在很多难题。因此在自然图像的SR模型算法基础上,充分考虑并结合HSI的特点,直接针对HSI的SR算法成为近来一个重要的研究方向。
另外一种可行方案是发掘HSI蕴含的先验信息,在正则化理论框架内重构出高分辨率的HSI结果。在高光谱成像机理的基础上,文献[ 4-5]认为HSI可以分解为终端单元字典和该字典下的稀疏表示系数。在这样的先验约束下,可利用高分辨率辅助图像来获取重构高分辨率HSI的信息。文献[ 6]提出的SSGS(Spatial-Spectral Group Sparsity)方法则是在此基础上添加了光谱稀疏先验和基于块的稀疏先验,利用光谱混合分析和空谱块的稀疏性来构建HSI的超分辨框架,实验证明此方法在空谱域不仅保持了光谱的一致性,而且保留了较清晰的纹理特征。另外,由于高光谱成像波段狭窄,HSI不同光谱通道间具有很强的相关性,即HSI的光谱低秩先验;同时同一波段的HSI,与灰度图像类似,其临近像素间也具有很强的相关性,即HSI的空间稀疏先验。在HSI复原问题中,经常用全变差(TV)最小化来表示空间稀疏性[7],用核范数最小化来近似光谱低秩性[8],或用两者线性组合的正则化[9]来重构未知的HSI。其中同时利用空间稀疏和光谱低秩先验的模型算法在HSI复原实验中已被证实取得了较好的重构结果,但是目前极少有文献将这种模型推广到HSI的SR问题中,而文献[ 10]将这种方法率先应用到核磁共振图像(MRI)的SR问题上,提出了三维全变差正则化的超分辨重构模型(LRTV),并用实验验证了该模型的有效性。
二维光谱矩阵低秩表示中,核范数即矩阵的特征值之和是矩阵秩函数最紧密的凸下界,因此,在众多HSI复原问题,通常使用核范数作为秩函数的凸松弛[9]。近来的研究结果表明HSI的不同特征值包含不同的信息,其中较大的特征值主要包含原始数据信息,而较小的特征值主要包含观测噪声或者人为的结构信息。但是基于核范数最小化的重构方法将所有的特征值同等对待,对应的模型算法利用相同阈值对特征值进行收缩处理,在拟制噪声或者人为结构的前提下丢失了大量的图像信息,这是该方法的一个重要缺陷。为了解决这个缺陷,Hu等[11]充分利用上述特征值的性质,建立了仅惩罚较小特征值的截断核范数最小化模型(TNN模型),实现了对秩函数更加精确和稳健的逼近,并且将该模型成功运用于矩阵填充问题中,补全了低秩矩阵中丢失的值且保留了大量的原始图像信息。在此基础上,Cao等[12]又将截断核范数应用在RPCA(Robust Principal Component Analysis)模型上。但基于截断核范数最小化问题属于非凸优化问题,之后相关学者对其求解方法进行了研究,文献[ 11,13-15]中给出了多种截断核范数的最小化问题求解算法,这使得截断核范数和替换核范数用于HSI的SR问题成为可能。
不同于矩阵的秩,张量秩的定义不唯一。基于不同的张量分解方法,定义张量秩的研究有很多[16-19],例如:基于CP(CANDECOMP)分解的CP秩、基于Tucker分解的Tucker秩等。CP秩[16]和Tucker秩[18]是张量秩中两个最具代表性的定义。CP秩定义为张量所需要的秩1张量最小数,虽然CP秩的度量与矩阵的度量是一致的,但是很难建立一个可解的松弛形式;Tucker秩被定义为一个向量,它的元素是由张量沿每一个模的展开矩阵的秩组成,该定义基于矩阵分解来计算。为了有效地最小化张量秩,Liu等[20]考虑张量各个模的相关性,将一个张量核范数的定义作为张量秩的凸松弛,并应用于张量填充问题中。随后有大量文献[ 10,21-22]将张量核范数应用于张量复原等问题中,而且实验证明该方法能同时探索图像的空间维和光谱维的低秩先验。
为了改善HSI的超分辨率重构结果,本文结合张量核范数和矩阵的截断核范数的各自优势,将矩阵的截断核范数扩展到张量截断核范数,随后利用空谱全变差和张量截断核范数最小化方法来表示HSI的稀疏和空谱低秩先验,建立新的HSI的SR模型。实验表明新的SR模型能够重构出较好的高分辨率HSI。
2 相关工作
2.1 HSI超分辨率重构框架
假定原始的高分辨率HSI为
式中:
式中:
2.2 张量核范数
由HSI的成像特点可知,HSI的光谱维相邻带之间表现出强相关性,即光谱低秩先验。而HSI的邻近像素间也具有很强的相关性,即空间稀疏先验。在探索图像低秩先验时,由于张量的秩函数是非凸和不连续的,因此求解低秩问题非常困难。目前,求解该问题的一种有效方法就是寻找秩函数的凸替代。由压缩感知理论可知,核范数即矩阵的特征值之和是矩阵秩函数最紧密的凸下界;同时,它与矩阵秩函数的关系类似于向量
式中:Rank(
2.3 张量截断核范数
尽管矩阵核范数是矩阵秩函数最紧密的凸下界,可使基于矩阵核范数最小化理论达到良好的重构效果,但是文献[
11]研究发现在低秩数据的奇异值分解过程中,数据信息主要集中在较大的特征值中,而大部分较小的特征值包含了数据中的噪声、缺损或人为结构等信息;并且核范数最小化约束方法将所有特征值均等惩罚,丢失了原始数据中的大量信息。所以,为了防止数据信息的丢失,提出了仅约束惩罚较小特征值的截断核范数最小化模型,并在矩阵填充应用中得到较好的效果。由此引出矩阵截断核范数的定义:对于秩为
式中:
则核范数与截断核范数的关系为
式中:‖ ‖
张量是矩阵概念的推广,文献[
10,20,22]通过使用矩阵化将张量转化为矩阵,引入张量核范数并且将其用于张量填充、张量复原等问题中,该方法可以同时在3个维度探索图像的低秩先验。因此,结合矩阵的截断核范数和张量核范数的各自优势,提出张量截断核范数,即对于大小为
2.4 LRTV重构模型
低秩与其核范数的近似表示形式,仅能表征HSI中的光谱相关性先验。而HSI的邻近像素之间也具有很强的相关性,即空间稀疏先验。文献研究表明,空间稀疏先验有多种表示工具,其中Rudin等[23]提出的全变差正则化是一种被广泛应用的方法,其相应的ROF(Rudin Osher Fatemi)模型[23]利用TV正则化方法可以有效地保存边界信息,并促使空间分片光滑化。为了综合使用两种低秩先验信息,Shi等[10]提出了基于张量核范数的低秩先验和LRTV模型,并且成功地将其应用到MRI图像的超分辨重构问题中,取得了良好的重构效果。其LRTV模型可表示为
式中:
式中:Ñ
3 本文模型与求解方法
3.1 TNN-LRTV模型
相比于张量核范数的方法,张量截断核范数最小化方法通过约束较小特征值之和来实现对张量秩函数的稳健逼近,有效压制超分辨率过程中所带来的噪声和人为结构。因此在LRTV模型框架的基础上,将张量核范数替换为张量截断核范数,将三维全变差变为空谱全变差,并运用于HSI的SR问题中,由此提出本文模型(TNN-LRTV模型),即
(9)式的空谱全变差项
3.2 TNN-LRTV模型求解
利用ADMM(Alternating Direction Method of Multipliers)方法[24]求解模型(9)式,首先引入3个中间变量
式中:
基于ADMM法,并且结合拉格朗日乘子法将(10)式变为无约束优化问题,其增广的拉格朗日函数表示为
式中:
根据ADMM方法,上述优化问题(12)式可以转换为下列几个子优化问题,在已知第
1)子问题1——更新
该子问题可由梯度下降法求解,其中TV项的梯度可由相应的欧拉-拉格朗日方程[25]获得。
2)子问题2——更新{
对于每个
利用凸函数之差算法(DCA)将上述优化目标函数(15)式更改为两个凸函数之差[13-14]的形式,即
式中:
式中:<,>为内积;
针对(17)式中
式中:
式中:
式中:
在迭代序列(17)式中,对
式中:SVT( )为奇异值收缩算子;
3)子问题3——更新{
综上所述,模型(9)式的迭代求解方法具体见
4 实验结果与分析
为了验证本算法的有效性,分别在两种HSI上进行实验,第一种是用机载红外成像光谱仪拍摄的Moffet Field数据集[26],它的空间尺寸为256×256,共有146个有用波段。第二种HSI是由高光谱数字采集试验仪拍摄的Washington DC National Mallde影像,它的空间大小为1280×307,共含191个可用波段[27]。由于篇幅有限,选取了这些数据的某一子集进行实验。针对实验用的高光谱图像,首先将各个波段数据规范化到[0,255]之间,然后对其进行模糊下采样,从而获得低分辨率的HSI。在本实验中,所有数据集选择的模糊核都是高斯模糊核,下采样因子都是2。
与本文重构方法作对比的方法有NLM方法[28]、SSGS[6]、LRTV方法[10],且用SSIM (structure similarity,
式中:
式中:
图 2. Moffet Field图第50通道重构结果。(a)原始图;(b)模糊下采样图;(c) NLM结果;(d) SSGS结果;(e) LRTV结果;(f) TNN-LRTV结果
Fig. 2. Reconstruction results on band 50 of Moffet Field data. (a) Original image; (b) fuzzy down sampling image;(c) result of NLM method; (d) result of SSGS method; (e) result of LRTV method; (f) result of TNN-LRTV method
Moffet Field数据集中,在去除严重污染的通道后,选取含43波段和含50波段的数据集,分别记为Moffet Field 1、Moffet Field 2。下面从结果和方法两方面进行分析,如
从结果方面来看,
从方法方面分析,本文方法和LRTV方法都使用了光谱低秩信息,同时也利用了空间相关信息。但本文方法使用了基于张量截断核范数的LRTV模型,并且产生了比LRTV模型更好的效果,其原因是,LRTV等核范数方法认为所有非零奇异值对矩阵的秩大小有相同的贡献,通过最小化所有奇异值之和来重构图像。LRTV等核范数方法公平地处理每一个奇异值,导致重构出的图像丢失了原始图像的大量信息,所以在实际应用中获得了次优的结果。文献[ 11]认为核范数不能较好地近似秩函数,且在实际中很难满足基于核范数启发式方法的理论要求,例如需要满足非相干性条件等。同时认为低秩数据在进行奇异值分解时,较大的奇异值中主要包含大量的原始图像数据信息,而较小的奇异值主要包含观测噪声或者人为的结构信息,且矩阵的秩也仅对应于较大的奇异值个数[11]。本文基于张量截断核范数最小化方法能更好地逼近数据的低秩先验。
基于上面的分析,本文模型[(9)式中的第二项‖
为了更好地测试本方法在不同大小的高光谱块中的可行性,在高光谱图像Washington DC National Mall中选取3个子集进行实验,分别记为DC Mall 1、DC Mall 2、DC Mall 3,大小分别为256×256×8、256×256×60、256×256×80。对其进行模糊下采样,利用本方法和对比方法对观测数据进行重构,并将重构结果所有通道的SSIM和PSNR分别取平均,记为MSSIM和MPSNR,并用这两个平均值作为最终重构效果的数值评判标准。
表 1. 不同方法的高光谱图像SR重构结果比较
Table 1. Comparison of SR reconstruction results of hyperspectral images by different methods
|
从直观的图像可以看出本文的超分辨结果比LRTV等方法的重构细节更多,而且在每个通道的PSNR和SSIM值也证实了这个结果,如
为了进一步比较这4种重构方法的性能,实验比较了图像重构前后像素点的光谱特征,实验结果表明图像的大量像素点的光谱特征结果类似,因此以随机选取的像素点(100,120)的光谱特征为代表来进行分析。
图 3. DC Mall图第101通道重构结果。(a)原始图;(b)模糊下采样图;(c) NLM结果;(d) SSGS结果;(e) LRTV结果;(f) TNN-LRTV结果
Fig. 3. Reconstruction results on band 101 of DC Mall image. (a) Original image; (b) fuzzy down sampling image; (c) result of NLM method; (d) result of SSGS method; (e) result of LRTV method; (f) result of TNN-LRTV method
图 6. (100, 120)处的光谱特征结果。(a)原始光谱特征;(b)模糊下采样后光谱特征;(c)各方法重构结果的光谱特征值
Fig. 6. Results of spectral features at (100, 120). (a) Spectral feature of original image; (b) spectral feature after fuzzy down sampling; (c) spectral features of the reconstructed results of different methods
在TNN-LRTV模型中,本实验中的数据集所含的波段数不同,因此需要对正则化参数随波段数的变化进行略微调整,以含80个波段的子图DC Mall 3数据为例,正则化参数
5 结论
针对HSI超分辨率重构问题,分析数据中存在的两种低秩先验:空谱低秩先验和空谱稀疏先验。在这两种先验的基础上,建立基于张量截断核范数的秩函数近似实现高光谱图像的超分辨重构。首先,基于张量截断核范数的秩函数近似方法可以更准确地逼近张量的秩函数,并且可以同时探索HSI的各个维度的先验信息,进而更好地反映出HSI的空谱低秩特性;其次,引入空谱全变差方法能更好地重构图像的边缘和细节信息。因此,结合两种先验优势,基于张量截断核范数和空谱全变差正则化模型在重构矩阵的秩和误差的稀疏性方面更具有稳健性,所以能够重构出高质量的HSI。相比经典的LRTV方法,TNN-LRTV的MPSNR和MSSIM值有所提高,并且能够更好地改善图像的细节纹理等视觉效果。但是,HSI维度高,导致重构模型的计算结果复杂度增大,因此建立高效的模型计算方法,是未来需要研究的重点问题。
致谢 武汉大学国际软件学院李杰博士提供了文献[ 6]中模型算法的程序,在此向其表示忠心的感谢。
[1] 刘立新, 李梦珠, 赵志刚, 等. 高光谱成像技术在生物医学中的应用进展[J]. 中国激光, 2018, 45(2): 0207017.
[2] 付立婷, 邓河, 刘春红. 新型高光谱图像快速实时目标检测与分类方法[J]. 光学学报, 2017, 37(2): 0230002.
[3] Yokoya N, Grohnfeldt C, Chanussot J. Hyperspectral and multispectral data fusion: a comparative review of the recent literature[J]. IEEE Geoscience and Remote Sensing Magazine, 2017, 5(2): 29-56.
[4] Dong W S, Fu F Z, Shi G M, et al. Hyperspectral image super-resolution via non-negative structured sparse representation[J]. IEEE Transactions on Image Processing: a Publication of the IEEE Signal Processing Society, 2016, 25(5): 2337-2352.
[5] 许蒙恩, 谢宝陵, 徐国明. 空间光谱联合稀疏表示的高光谱图像超分辨率方法[J]. 激光与光电子学进展, 2018, 55(7): 071014.
[6] Li J, Yuan Q Q, Shen H F, et al. Hyperspectral image super-resolution by spectral mixture analysis and spatial-spectral group sparsity[J]. IEEE Geoscience and Remote Sensing Letters, 2016, 13(9): 1250-1254.
[7] Guo Z H, Wittman T, Osher S. L1 unmixing and its application to hyperspectral image enhancement[J]. Proceedings of SPIE, 2009, 7334: 73341M.
[9] He W, Zhang H Y, Zhang L P, et al. Total-variation-regularized low-rank matrix factorization for hyperspectral image restoration[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(1): 178-188.
[10] Shi F, Cheng J, Wang L, et al. LRTV: MR image super-resolution with low-rank and total variation regularizations[J]. IEEE Transactions on Medical Imaging, 2015, 34(12): 2459-2466.
[11] Hu Y, Zhang D B, Ye J P, et al. Fast and accurate matrix completion via truncated nuclear norm regularization[J]. IEEE Transactionson Pattern Analysis and Machine Intelligence, 2013, 35(9): 2117-2130.
[12] Cao F L, Chen J Y, Ye H L, et al. Recovering low-rank and sparse matrix based on the truncated nuclear norm[J]. Neural Networks, 2017, 85: 10-20.
[13] Tao P D. An L T H. Convex analysis approach to d.c. programming: theory, algorithms and applications[J]. Acta Mathematica Vietnamica, 1997, 22(1): 289-355.
[14] An L T H, Tao P D. The DC (difference of convex functions) programming and DCA revisited with DC models of real world nonconvex optimization problems[J]. Annals of Operations Research, 2005, 133: 23-46.
[16] Kolda T G, Bader B W. Tensor decompositions and applications[J]. SIAM Review, 2009, 51(3): 455-500.
[17] Zhao Q B, Zhang L Q, Cichocki A. Bayesian CP factorization of incomplete tensors with automatic rank determination[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1751-1763.
[18] Tucker L R. Some mathematical notes on three-mode factor analysis[J]. Psychometrika, 1966, 31(3): 279-311.
[19] Li X T, Ng M K, Cong G, et al. MR-NTD: manifold regularization nonnegative tucker decomposition for tensor data dimension reduction and representation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(8): 1787-1800.
[21] Gandy S, Recht B, Yamada I. Tensor completion and low-n-rank tensor recovery via convex optimization[J]. Inverse Problems, 2011, 27(2): 025010.
[22] Zhang C Y, Hu W R, Jin T Y, et al. Nonlocal image denoising via adaptive tensor nuclear norm minimization[J]. Neural Computing and Applications, 2018, 29(1): 3-19.
[23] Rudin L I, Osher S, Fatemi E. Nonlinear total variation based noise removal algorithms[J]. Physica D: Nonlinear Phenomena, 1992, 60: 259-268.
[24] Boyd S. Distributed optimization and statistical learning via the alternating direction method of multipliers[J]. Foundations and Trends © in Machine Learning, 2010, 3(1): 1-122.
[26] AVIRIS data[DB/OL]. [2017-07-19].https:∥aviris. jpl. nasa. gov/data/image_cube. html.
[27] HYDICE data[DB/OL]. [2017-01-30].https:∥engineering purdue. edu/~biehl/MultiSpec/ hype- rspectral. html.
Article Outline
王艺卓, 曾海金, 赵佳佳, 谢晓振. 基于张量截断核范数的高光谱图像超分辨率重构[J]. 激光与光电子学进展, 2019, 56(21): 211007. Yizhuo Wang, Haijin Zeng, Jiajia Zhao, Xiaozhen Xie. Super-Resolution Reconstruction of Hyperspectral Images Based on Tensor Truncated Nuclear Norm[J]. Laser & Optoelectronics Progress, 2019, 56(21): 211007.