基于数据简化的改进非负矩阵分解端元提取方法 下载: 950次
1 引言
高光谱遥感是20世纪80年代发展起来的新兴遥感成像技术。高光谱图像能够对地物的空间信息和光谱信息同时成像,各波段的空间图像叠加在一起形成一个数据立方体。由于高光谱图像往往具有数十甚至数百个波段,每个像元在光谱维度上提取的辐射值可以形成一条近似平滑的光谱曲线,因此可以利用高光谱图像丰富的光谱信息对地物进行精细分类和识别。然而,受图像传感器空间分辨率的限制及地物空间分布复杂多样性的影响,高光谱遥感图像中存在大量的混合像元。这些像元包含多种地表覆盖类型,其光谱特性由多种地物的光谱混合而成。因此,将混合像元分类到任何典型地物都是不准确的。这使得传统的像元级分类方法不再适用。混合像元的存在已成为制约高光谱遥感技术定量化应用的主要障碍。
混合像元分解技术能够获知一个混合像元中所包含的地物种类(端元)及其所占比例(丰度),可以大大改善高光谱图像分类的精度[1-3]。目前,研究最多、应用最广泛的端元提取方法是基于凸面几何学的方法。自1993年Boardman首次将凸面单体理论用于端元自动提取并获得成功后,国内外学者对基于凸面单体的端元提取方法进行了广泛的研究。凸面单形体方法认为高光谱图像的每个像元在光谱特征空间中都对应一个样本点,这些样本点在特征空间中都分布在一个凸面单形体内部,其中纯像元位于单形体的顶点位置,混合像元位于单形体的内部。在这类算法中,端元提取的过程往往需要所有像元都参与运算,导致运算量较大,算法运行效率较低。为了简化参与运算的数据量,提高端元提取算法的运行效率,有学者做了一些初步的研究。杨可明等[4]于2014年提出了一种结合光谱信息熵的内部最大体积(N-FINDR)改进算法,实验结果表明,改进后的N-FINDR算法在确保较高端元提取精度的同时,参与运算的数据量大大减小。徐君等[5]2016年提出了一种利用图像的空间信息在特征空间中设计超球简化高光谱数据的方法,提高了端元提取算法的运行效率。本文在总结现有研究成果的基础上,提出了一种高光谱数据简化改进的非负矩阵分解端元提取方法。通过设置光谱信息熵的阈值,筛选出图像中可能存在纯净像元的图像同质区,只选择同质区中最具代表性的像元参与非负矩阵分解运算,从而减少了端元提取算法的数据量,提高了算法的运行效率。
2 光谱信息熵
1948年,Shannon借用热力学中热熵的概念建立了“信息熵”的概念,解决了信息大小的量化度量问题。信息熵是对信息源不确定性平均值的描述,可以用信息的数学期望来计算。
设信息源
当(1)式中
光谱信息熵[4,6]为信息熵扩展应用到高光谱图像中形成的概念。光谱信息熵的计算式为
式中:
在高光谱图像中,纯净像元和地物混合程度均匀的像元在每一波段上的灰度值基本相等,称为同质区;而其他混合程度差别较大的混合像元由于其组成成分及其所占比例各不相同,导致其在不同波段上的灰度值无法保持一直相等。
对于同质区的像元,(2)式中的
3 非负矩阵分解端元提取
非负矩阵分解(NMF)是Lee等[7]提出的一种矩阵分解算法,它将一个非负矩阵分解为两个非负矩阵的乘积。非负矩阵分解的数学模型与线性光谱混合数学模型十分相似,这为NMF算法应用于线性混合模型下的混合像元分解提供了可能。在线性光谱混合模型中,如果用
非负矩阵分解算法是一种盲源分离方法,不需要假定图像中存在纯像元,能够同时提取端元和丰度,比较适用于光谱混合程度较高的图像[8]。
NMF的分解过程是一个优化求解的过程,需要构建一个合理的目标函数,然后选择合适的优化法则来求得最优解。Lee等[7]构造了两种目标函数,当信息中的噪声服从泊松分布时,以K-L(Kullback-Leibler)散度作为目标函数
式中:
当信息中的噪声服从高斯分布时,以矩阵
欧氏距离比K-L散度更被人熟知,因此,多数NMF分解算法都将其作为目标函数。NMF分解算法包括梯度下降算法、乘法更新规则算法和交替最小二乘算法。NMF混合像元分解算法等价于约束最优问题:
与(4)式相比,(5)式多了“和为1”的约束,因此,在每一步迭代后还需要对丰度矩阵
由于NMF目标函数具有明显的非凸性,因此只能求得局部最优解。在应用NMF进行混合像元分解时,一般在算法中增加一定的约束条件来避免算法陷入局部极小值,如最小体积约束[9]、平滑性约束[10]、分段平滑和丰度稀疏约束[11]。
4 采用光谱信息熵简化数据改进NMF混合像元分解算法
计算高光谱影像的光谱信息熵,将具有相同光谱信息熵的像元划分为图像的同质区。在同一个同质区的像元具有相似的光谱特性,这些像元在光谱特征空间的散点图必然聚集成团。根据凸面几何学理论,其中最纯的像元是距离凸面单形体中心最远的像元。在每一个同质区内,只提取一个最纯的像元作为典型像元参与非负矩阵分解端元提取运算,剔除其余像元,简化参与运算的高光谱数据。
改进的NMF混合像元分解算法的具体步骤如下:1) 对图像进行去噪处理,统计每一波段上像元的灰度值,将灰度值彼此相等的像元找出来,并根据(2)式计算高光谱图像中每个像元的光谱信息熵;2) 将光谱信息熵值相等的像元划入一个同质区;3) 计算整幅图像所有像元的均值光谱作为凸面单形体的中心,在每个同质区中选取距离中心点最远的像元作为该同质区的代表性像元,参与NMF混合像元分解运算,剔除同质区中的剩余像元;4) 保留没有划入同质区的单个孤立像元,参与NMF混合像元分解运算。
算法的流程图如
图 1. 数据简化改进的NMF混合像元分解算法流程
Fig. 1. Flow chart of NMF mixed pixel decomposition algorithm improved by data simplification
同质区中距离凸面单形体中心相对最远的样本点,距离凸面单形体的顶点也相对最近,因此,可以认为是同质区内最纯的像元。对于NMF算法,选择合适的初始值可以避免陷入局部最小,提高收敛速度和算法精度。本文首先利用Hysime算法[12]确定初始端元的数目
5 实验分析
实验采用的数据是1997年由机载可见光/红外成像光谱仪(AVIRIS)获取的美国内华达州Cuprite地区的高光谱图像,截取大小为300 pixel×300 pixel的区域。这个区域中有多种矿物质,并以纯像元的形式存在,这些矿物质的典型光谱都存在美国地质勘探局(USGS)光谱库中,因此,该数据在混合像元分解研究中的应用比较广泛。AVIRIS高光谱图像包含224个波段,波长范围为400~2500 nm,去除受水蒸气吸收影响较大和信噪比较低的波段,剩余188个波段[13],做去噪处理。选择13、68、158波段作为红、绿、蓝通道,合成假彩色图像,如
分别在图像中的每一波段上统计所有像元的灰度值,将灰度值彼此相等的像元找出来并做分组处理,统计
利用Hysime算法确定初始端元的数目为9。通过计算模拟图像上所有像元的光谱信息熵,将像元划入不同的同质区。按照同质区的大小,由大到小选取其中的9个最纯像元作为初始端元组成初始端元矩阵,然后以FCLS分解获得的丰度矩阵作为算法的初始丰度矩阵。
采用最小体积约束(MVC)-NMF算法对数据简化前后的高光谱数据进行混合像元分解,得到9种地物覆盖类型——明矾石、铵长石、玉髓、沙漠地表、高岭石、白云母、蒙脱石、皂石、榍石的端元光谱如
图 3. MVC-NMF算法端元提取结果。(a)数据简化前;(b)数据简化后
Fig. 3. Endmember extraction results of MVC-NMF algorithm. (a) Before data simplification; (b) after data simplification
将数据简化前、后MVC-NMF算法提取的端元光谱与USGS光谱库中对应的光谱进行对比分析[14],并用光谱夹角距离(SAD)做定量化比较,如
表 1. 数据简化前后MVC-NMF算法所提取的端元与USGS光谱库中标准光谱的光谱角
Table 1. Spectral angles between endmembers extracted by MVC-NMF algorithm and standard spectra in USGS spectral library before and after data simplificationrad
|
6 结论
高光谱数据是一个庞大的数据立方体,一般的混合像元分解算法需要所有数据都参与运算,运算量很大,运行速度很慢,导致算法运行效率较低,在很多场合下无法满足实时性的要求。利用光谱信息熵理论对高光谱图像进行划分同质区,在每个同质区中只选取最纯的像元参与混合像元分解运算,简化了参与运算的数据量。用MVC-NMF混合像元分解算法进行验证和分析。实验证明,数据简化后MVC-NMF算法的端元提取精度依然能够得到保证,而算法的执行效率却得到大大提高。这说明,在混合像元分解前对高光谱数据进行简化数据预处理,可以减小混合像元分解算法的运算量。这对于其他传统的混合像元分解算法也有借鉴和启发意义。
[1] 冯维一, 陈钱, 何伟基, 等. 基于高光谱图像混合像元分解技术的去雾方法[J]. 光学学报, 2015, 35(1): 0110002.
[2] 严阳, 华文深, 崔子浩, 等. 高光谱分类体积的端元提取[J]. 激光与光电子学进展, 2018, 55(9): 093004.
[3] 蓝金辉, 邹金霖, 郝彦爽, 等. 高光谱遥感影像混合像元分解研究进展[J]. 遥感学报, 2018, 22(1): 13-27.
[4] 杨可明, 刘士文, 王林伟, 等. 光谱最小信息熵的高光谱影像端元提取算法[J]. 光谱学与光谱分析, 2014, 34(8): 2229-2233.
[5] 徐君, 宋凯, 李波, 等. 数据约简化的高光谱影像端元提取[J]. 红外技术, 2016, 38(6): 481-485.
[6] 杨可明, 魏华锋, 刘飞, 等. 以光谱信息熵改进的N-FINDR高光谱端元提取算法[J]. 地球信息科学学报, 2015, 17(8): 979-985.
[8] 杨华东. 高光谱遥感影像光谱解混算法研究[D]. 大连: 大连海事大学, 2015: 70- 79.
Yang HD. Research on spectral unmixing algorithms for hyperspectral remote sensing image[D]. Dalian: Dalian Maritime University, 2015: 70- 79.
[12] Bioucas-Dias J M, Nascimento J M P. Hyperspectral subspace identification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(8): 2435-2445.
[13] 彭倩. 基于非负矩阵分解的高光谱图像解混研究[D]. 北京: 中国科学院大学, 2017.
PengQ. Hyperspectral unmixing based on constrained nonnegative matrix factorization[D]. Beijing: University of Chinese Academy of Sciences, 2017.
[14] 刘雪松, 王斌, 张立明. 基于非负矩阵分解的高光谱遥感图像混合像元分解[J]. 红外与毫米波学报, 2011, 30(1): 27-32, 54.
Article Outline
徐君, 王旭红, 王彩玲. 基于数据简化的改进非负矩阵分解端元提取方法[J]. 激光与光电子学进展, 2019, 56(9): 091001. Jun Xu, Xuhong Wang, Cailing Wang. Improved Algorithm for Nonnegative Matrix Factorization and Endmember Extraction Based on Data Simplification[J]. Laser & Optoelectronics Progress, 2019, 56(9): 091001.