基于光谱空间重构的非监督最邻近规则子空间的高光谱异常检测
0 引言
高光谱遥感影像具有丰富的光谱信息,可以根据不同的光谱特性区分不同的地物,如车辆、舰船等,这些物体通常与自然背景材料具有不同的光谱特征,使高光谱影像目标检测成为区分地物的强有力手段[1, 2].异常目标检测是一种不需要任何先验信息即可检测感兴趣目标的方法,其本质是一个二分类问题,目的是将异常目标从背景中区分出来[3, 4].
高光谱遥异常检测算法的模型根据理论可分为三类:基于统计模型的检测算法、基于矩阵分解的检测算法和基于几何模型的检测算法[5].由REED I S等提出的异常探测算法(Reed-Xiao li Detection, RXD)[6]是应用最广泛的一种异常检测方法,它假设背景服从多元正态分布,异常值由待测像元与背景之间的马氏距离来测量.由于高光谱影像背景复杂,很多情况不满足正态分布.DU B等提出基于随机选择的异常探测(Random Selection based Anomaly Detection, RSAD)算法[7], 通过随机选择背景构建初始背景子集,采用迭代方式更新背景子集, 避免了异常像元对背景统计量的污染.基于矩阵分解的检测算法利用高光谱影像的低秩性,用稀疏分量来进行异常检测,进而精确获得目标[8, 9].SONG S等提出基于卷积神经网络和低秩表示算法[10],通过CNN模型提取丰度图并利用基于密度的聚类算法(Density Based Spatial Clustering of Applications with Noise, DBSCAN)构造字典,能够有效去噪和表示背景,最后利用低秩表示算法检测异常.
基于几何模型的方法认为背景可以由局部背景光谱向量线性表示,而异常目标不能被表示.LI W等提出非监督最邻近规则子空间(Unsupervised Nearest Regularized Subspace, UNRS)算法[11]和基于协同表示的异常探测(Collaborative Representation based Detection, CRD)算法[12]应用于异常探测领域.MA Shi-xin等[13]提出利用基于密度的聚类算子对高光谱影像进行空谱预处理,通过平均差的自适应核协同算法有效地提高了协同表示算法的检测精度.TAN K等[14-15]提出基于协同表示和反距离权重的局部求和异常检测算法(Local Summation Anomaly Detection based on Collaborative Representation and Inversed Distance Weight, LSADCRIDW),通过采用双窗口滑动求和策略,将反距离权重引入到CRD算法中,提高了线性表示的精度,但是由于采用求和策略,运算时间算较长.
高光谱影像具有高维性、冗余性,使得计算代价较高.同时由于地表地物分布的复杂性,异常物体的尺寸小,导致异常像元是混合像元,其光谱与背景光谱特征相似,难以区分背景与异常目标.基于上述研究的不足,本文提出了一种基于光谱空间重构的非监督最邻近规则子空间异常检测算法(Unsupervised Nearest Regularized Subspace based on Spectral Space Reconstruction, UNRS-SSR).首先在基于结构张量的波段选择算法中通过去除噪声像元,选择更加有效的波段.其次,利用基于绝对距离的非负参数对光谱空间进行重构,使异常与背景之间的可分性增强.最后,将空间距离权重引入到非监督最邻近规则子空间算法中,充分利用背景字典之间的空间相似性信息,从而得到更好的检测结果.
1 基于光谱空间重构的非监督最邻近规则子空间算法
1.1 波段选择
由于高光谱影像波段的高维性、冗余性,同时每个波段描述地物的结构特征不同,需要选择结构特征精细的波段.因此,引入一种基于结构张量的波段选择算法[16].结构张量表示为
式中,
式中,λ1, il和λ2, il表示像素i在第l波段的非负特征值,η1, il和η2, il表示对应的特征向量.用两个特征值的和可以检测目标的边缘区域.由于迹等于非负特征值之和,所以波段的迹可以表示为
式中,S表示高光谱影像中像元个数.Tl是结构张量在第l波段的迹,称为波段迹.
图 1(a)为波段迹值曲线,图 1(b)为迹值最大的波段对应的单波段影像.图 1(a)、(b)表明迹值剧烈变化的波段含有大量噪声,因此将两个红点之间的第1~5波段去除.图 1(c)为去除迹值剧烈变化的波段后选取的的迹值最大的单波段影像,所选波段包含的结构特征变化最多,背景最少.去除迹值剧烈变化的波段后,选择的波段为
式中,L代表高光谱影像中波段个数.从所有波段中选择波段迹值最大的前K个波段,波段集由B1,B2,…,BK组成.
在求波段迹的过程中高光谱影像中含有噪声像元造成所选的波段并不准确.通过在求波段迹的过程中引入噪声像元去除方法[17],有效去除噪声像元的迹对波段迹的影响.基于统计学理论中,高光谱影像的波段迹值矩阵
式中,μ和σ分别表示所有像元迹值的均值和标准差,τmax和τmin分别代表最大阈值和最小阈值.阈值之外的像元将会被视为噪声而去除,从而选择最优波段.如图 2(a)、(b)所示,通过5次随机选取1 000个像元计算去除噪声前后的波段迹曲线.可以看到,经过去除噪声之后,波段迹值曲线更有规律.图 2(c)为噪声像元的位置,其中噪声像元约占原始像元的0.5%.
图 2. 去噪前后波段迹曲线对比与噪声图
Fig. 2. Comparison of band trace curve before and after denoising and noise map
1.2 光谱空间重构
由于地表地物分布的复杂性,异常物体的尺寸小,导致异常像元是混合像元,而且异常像元的光谱与背景光谱特征相似,难以区分背景与异常目标.因此,对波段选择后的高光谱影像进行光谱空间重构,增加异常与背景之间的绝对光谱距离[18],绝对光谱距离指的是两个像元光谱差值的绝对值.对于中心像元
1) 如果中心像元
2) 如果中心像元
3) 如果中心像元
4) 如果中心像元
为了进一步增强绝对光谱距离,引入基于绝对距离的非负参数,定义为
式中,非负参数θi的范围从0到1.如果|
式中,s表示内外双窗口之间背景像元的个数,即
式中,wout表示外窗口的大小,win表示内窗口的大小.通常情况下异常像元是由几个相邻像元构成,如果仅采用单窗口,异常像元对背景字典造成污染,影响重构光谱的效果.因此采用内外双窗口模型,如图 3所示.内窗口的大小应该大于或等于异常目标,有效防止异常进入背景字典.利用外窗口控制中心像元的邻近像元个数,有效地增加异常与背景的绝对光谱距离.
1.3 非监督最邻近规则子空间算法
基于几何模型的异常检测算法认为所有背景像元光谱能够被其周围空间背景字典线性表示,而异常目标则不能被表示.算法建立在滑动双窗口模型的基础上,对于每个待测试像元
式中,
以中心像元
式中,
式中,λ为拉格朗日乘子,用于控制目标函数与正则约束项之间的权重.为了求解系数向量
式中,
式中,i, j分别表示矩阵的行和列的索引值.
在高光谱影像中,由于某些背景像元与中心像元的具有光谱相似以及空间相似性,为了自适应调整背景像元所占比重,引入Tikhonov正则化矩阵
Tikhonov正则化矩阵
式中,
空间距离权重
式中,σd表示控制空间距离权重的因子,dd(
根据求得的
最后通过设定阈值判定是否为异常像元,若求得的残差r大于设定的阈值,则判定该像元为异常,反之,则判定为背景像元.通过光谱空间重构,如果中心像元为背景像元,那么线性表示的近似值与中心像元的差值很小;反之差值会很大,更容易区分背景与异常目标.
1.4 本文算法步骤
本文提出的UNRS-SSR算法是一种基于几何模型的高光谱异常检测算法,图 4给出了其流程.算法包括四个步骤:1)通过改进的基于结构张量的波段选择算法选取有效波段;2)利用光谱空间重构,增加背景与异常的绝对光谱距离;3)通过加入空间距离权重的非监督最邻近规则子空间算法获得预测背景影像;4)通过两个影像的差值获得检测结果,根据设定的阈值判定像元是否为异常目标.
2 实验结果与分析
用4幅真实高光谱影像对该算法进行验证.为了评估提出的UNRS-SSR算法的可靠性和有效性,分别与Global RX (GRX)、RSAD、CRD、UNRS、LSADCRIDW算法进行实验对比分析.采用接收者操作特性曲线(Receiver Operating Characterstic, ROC)、ROC曲线下面积(Area Under Curve, AUC)进行定量的评价.
2.1 实验数据
第一个高光谱影像实验数据是由AVIRIS传感器获取的美国San Diego飞机场.波长范围为370~2 510 nm,空间分辨率为3.5 m,共有224个波段.影像大小为100×100个像素.去除相应的水汽波段、低信噪比波段,用剩余189个可用波段进行实验.影像中异常地物主要为三架飞机,如图 5(a)和(b)分别为实验区的真彩色合成影像和真实异常地物图.
第二个高光谱影像是由ROSIS光谱仪采集的Pavia Centre数据.波长范围为430~860 nm,空间分辨率为1.3 m,包含115个波段.去除低信噪比波段和水汽吸收波段,最后可用于实验的波段数为102个.实验中截取整幅影像120×200的子区域进行分析.影像中的异常地物为桥上的车辆,影像与真实异常地物如图 6所示.
第三个高光谱影像是由ProSpecTIR-VS传感器获取的美国罗契斯特市的Avon地区.经过影像预处理,选取的区域大小为400×480个像素,如图 7(a)所示.波长范围为400~2 450 nm,包括360个波段,空间分辨率为1 m.影像中的主要异常地物为人造防水布,真实异常地物如图 7(b)所示.
为了验证算法对低空间分辨率高光谱影像的检测效果,使用的第四个数据集是高分5号卫星搭载的超光谱成像仪于2019年5月获取的中国徐州市的影像.影像获取的波长范围390~2 500 nm,空间分辨率为30 m,包含330个波段.去除重复波段、低信噪比波段和水汽波段,最后可用于实验的波段数为275个.实验区域大小为100×100个像素.影像中的主要异常地物为房屋屋顶,实验区域与真实异常地物如图 8所示.
2.2 参数实验分析
UNRS-SSR算法有三种类型的参数,包括双窗口的大小、参数λ和空间距离权重因子σd.首先分析不同空间距离权重因子σd对UNRS-SSR算法检测性能的影响.设wout=5, win=3, λ=1,寻找四组实验数据的最优空间距离权重因子σd.表 1为四组实验数据在不同因子σd条件下的AUC值.对于高分5号数据,在σd为100时,AUC值达到最高,但σd为50时,AUC值仍然较高.对于其余数据,当σd=50时,这三组数据的AUC值达到最高.总体而言,当σd=50时,四组数据都可以达到最佳的检测结果.因此,在本文算法中将空间距离权重因子σd固定为50.
表 1. 四组数据集在不同参数σd下的检测结果
Table 1. Detection results of four datasets at different σd parameters
|
然后利用四组实验数据研究参数λ对UNRS-SSR算法性能的影响,将双窗口的大小设为wout=5,win=3,寻找四组实验数据的最优参数λ值.表 2为四组实验数据在不同参数λ条件下的AUC值.从表 2可以看出参数λ对AUC值影响很小.对于AVIRIS数据,参数λ对AUC值都控制在0.01以内,当λ=1时AUC值达到最高.对于ROSIS数据,λ对AUC值的结果影响很小.对于Avon数据和高分5号数据,当参数λ分别为0.1和0.01时AUC值达到最高.
表 2. 四组数据集在不同参数λ下的检测结果
Table 2. Detection results of four datasets at different λ parameters
|
窗口尺寸的选择对各种基于几何模型算法均有很大的影响,因此还需讨论不同窗口尺寸对检测精度的影响.首先,将四组实验数据的参数λ分别设定为各自的最优值.图 9为四组实验数据在不同窗口尺寸下的检测结果.对于AVIRIS数据,当双窗口大小为15/13时AUC值最大,但当内窗口尺寸小于7时AUC值剧烈下降,这是因为有异常像元落入双窗口内造成背景字典的污染.对于Avon数据,当双窗口大小为9/5时AUC值最大,当外窗口尺寸大于9时AUC值下降,由于异常像元块距离较近,导致异常像元落入双窗口内造成背景字典的污染.这种现象也存在于ROSIS数据和高分5号数据的检测结果中,它们的最佳双窗口大小是分别是15/7和15/9.实验结果也表明在基于几何模型算法中需要使用双窗口,并且内部窗口的大小一般大于异常目标.
图 9. 四组数据集在不同窗口尺寸下的检测结果
Fig. 9. Detection results of four data sets under different window sizes
2.3 异常探测结果
为了突出所提算法在计算量上的优势,将UNRS、CRD、LSADCRIDW不同算法的窗口大小设置为与UNRS-SSR算法的最优窗口尺寸相同,以保证算法处于相同的窗口条件下,UNRS、CRD、LSADCRIDW算法的参数λ设为各自的最优条件.
AVIRIS数据实验中各种探测算法的二维探测结果如图 10所示.图中检测值越亮,显示越偏重于红色,检测值越低,显示越偏重于蓝色.从中可以看出,GRX、RSAD并不能够突出飞机异常目标.CRD、UNRS、LSADCRIDW虽然都可以突出异常目标,但是并不能够很好地抑制背景.而UNRS-SSR算法可以很好去除背景的影响,同时在飞机区域显示明显偏亮.
图 10. AVIRIS数据中不同算法的探测结果
Fig. 10. Detection results of various detection algorithms in AVIRIS data
ROSIS数据实验中各种探测算法的二维探测结果如图 11所示.从中可以看出,GRX、RSAD、CRD和LSADCRIDW算法都可以很好地抑制背景地物,但是异常目标不能够明显检测出来.UNRS虽然可以很好地突出异常目标,但是去除背景能力较差.UNRS-SSR算法能够表现出对背景很好的抑制能力,而且能够突出异常目标.
图 11. ROSIS数据中不同算法的探测结果
Fig. 11. Detection results of various detection algorithms in ROSIS data
Avon数据实验中各种探测算法的二维探测结果如图 12所示.从中可以看出,GRX、RSAD可以很好地抑制背景地物,但是异常目标不能检测出来.CRD、UNRS虽然可以很好地突出异常目标,但是去除背景能力较差.UNRS-SSR算法能够表现出对背景很好的抑制能力,而且能够突出异常目标.
图 12. Avon数据中不同算法的探测结果
Fig. 12. Detection results of various detection algorithms in Avon data
高分5号数据实验中各种探测算法的二维探测结果如图 13所示.从中可以看出,UNRS-SSR算法去除背景的能力明显优于其他五种算法.RSAD与UNRS-SSR算法对异常目标的检测性能明显优于其他算法,但是RSAD算法对背景的抑制能力较差.因此UNRS-SSR算法表现出良好的检测性能与抑制背景能力,同时说明了UNRS-SSR算法也能较好地应用于低分辨率的高光谱遥感影像中.
图 13. 高分5号数据中不同算法的探测结果
Fig. 13. Detection results of various detection algorithms in GF-5 data
图 14为四组数据实验中各种探测算法的ROC曲线.通过设定不同的阈值,将不同阈值条件虚警率和检测率的坐标点相互连接起来绘制ROC曲线,曲线越靠近左上角,探测算法的性能就越好.可以看出,UNRS-SSR算法明显优于其他算法,具有很强的鲁棒性,且其在虚警率很低的前提下仍然具有较高的检测率,说明该算法在抑制背景信息干扰和提高检测率上具有明显的优势.
从表 3可以看出,UNRS-SSR算法的检测精度明显优于其他5种异常检测算法.UNRS-SSR与LSADCRIDW算法都是在基于几何模型的异常检测算法上进行改进的,LSADCRIDW算法采用双窗口滑动求和策略使得运算时间增加,所以UNRS-SSR算法在时效性方面要明显优于LSADCRIDW法.同时说明了本文算法也能较好地应用于大尺寸遥感影像和低空间分辨率的高分5号卫星数据,具有良好的通用性.综上所述,UNRS-SSR算法能够有效抑制异常目标对背景的干扰,在异常检测中能够取得很好的效果.
表 3. 四个真实数据集的AUC值和不同方法的运算时间对比
Table 3. Comparison of AUC and execution times of the different methods for four datasets
|
3 结论
针对高光谱影像的数据冗余以及地表地物分布的复杂性所导致的异常目标光谱特征与背景光谱相似,而难以区分背景与异常的问题,提出了一种基于光谱数据重构的非监督最邻近规则子空间的异常检测(UNRS-SSR)算法.算法改进了基于结构张量的波段选择算法,通过对光谱空间重构,同时在非监督最邻近规则子空间的基础上引入了空间距离权重,提高了异常检测的精度.光谱空间重构充分利用了空间与光谱信息,增加了线性表示的近似值与异常像元的差值,从而更容易区分背景与异常目标.四组真实数据的实验结果均表明,UNRS-SSR算法比其他算法具有更好的鲁棒性和更高的检测精度,且对低空间分辨率的高光谱影像也能够得到更好的检测效果.
同时,本文提出的算法仍然有一些不足,需要不断地探索和改进:1)基于结构张量的波段选择算法仅利用不同单波段的空间结构特征,如何将空间结构特征精细的波段与信噪比较高的波段结合起来选择最优波段;2)无法根据不同影像数据快速获取最优的窗口尺寸和参数λ,如何自适应地确定最优窗口尺寸和参数λ;3)在线性表示过程中的背景字典可能存在异常像元,造成对背景字典的污染,如何更加有效地获得纯净的背景字典.
[5] ZHANG Yan, 张 炎, 华 文深, HUA Wen-shen, YAN Yang, 严 阳. 高光谱异常目标检测算法研究进展[J]. 激光杂志, 2019, 40(7): 6-9.
[11] LI W, DU Q. Unsupervised nearest regularized subspace f anomaly detection in hyperspectral imagery[C]. 2013 IEEE International Geoscience Remote Sensing SymposiumIGARSS, Melbourne, Australia, 2013: 10551058.https:ieeexple.ieee.gdocument6721345tp=&arnumber=6721345
[14] HOU Zengfu. Hyperspectral imagery anomaly detection based on collabative representation unsupervised nearest regularized subspace[D].Xuzhou: China University of Mining Technology, 2019.http:cdmd.cnki.com.cnArticleCDMD102901019604110.htm侯增福.基于协同表示与非监督最邻近规则子空间的高光谱影像异常探测[D].徐州: 中国矿业大学, 2019.
Article Outline
王志威, 谭琨, 王雪, 丁建伟, 陈宇. 基于光谱空间重构的非监督最邻近规则子空间的高光谱异常检测[J]. 光子学报, 2020, 49(6): 0630004. Zhi-wei WANG, Kun TAN, Xue WANG, Jian-wei DING, Yu CHEN. Unsupervised Nearest Regularized Subspace Based on Spectral Space Reconstruction for Hyperspectral Anomaly Detection[J]. ACTA PHOTONICA SINICA, 2020, 49(6): 0630004.