基于空谱加权近邻的高光谱图像分类算法 下载: 1044次
1 引言
高光谱遥感技术是一种多融合的综合性技术[1-3],包含探测器技术、精密光学机械、微弱信号检测、计算机和信息处理等多种技术,广泛应用于多个领域中[4-5]。因高光谱图像相比传统光谱图像搭载的光波信息更多,所以利用高光谱图像进行地物的精细辨识与归类更具研究前景。高光谱图像不仅包含丰富的地物光谱信息,还具备大量的空间信息,高光谱图像分类算法[6-7]根据其利用的信息特征大致可分为两类。
第一类为仅利用高光谱图像光谱信息的图像分类方法。文献[ 8]以待测样本与k个光谱距离最近的测试样本点中数量最多的那类测试样本作为待测样本点的类别,提出了最近邻(KNN)分类法。文献[ 9]为实现对高光谱小样本目标的精细分类,提出了一种基于多特征和改进稀疏表示(SRC)模型的分类方法。但该算法只发挥了光谱信息的作用,并未充分挖掘像元空间之间的关系,因而分类精度有待提高。支持向量机(SVM)算法[10-11]是一种主要通过核进行分类,以统计学习理论为基础的模式识别方法。通过增加特殊样本的学习环节,极大缩小了计算量。但该算法依托于对大量样本的标记,样本量越大,地物差异特征越明显,而标记样本的需求在实际工程中往往难以实现。当输入为光谱和纹理特征时,SVM算法也为空谱联合特征分类,因本算法的输入仅为光谱信息,故将SVM算法加入对比讨论。
第二类为融合高光谱图像光谱信息与空间信息的空谱联合图像分类方法。不仅利用了像元的光谱信息,还利用了地物分布的空间连续性特征[12],将空间上距离近的像元点划分为同类。文献[ 13]提出了一种基于投票式的多分类器联合方法。为充分考虑像元局部空间结构,文献[ 14]提出一种基于加权空谱距离(WSSD)的相似性度量算法,利用像元的空间近邻对其进行重构,进一步描述中心像元与近邻空间的信息,提高了分类精度,但对中心像元进行重构的同时存在引入异类地物的风险。
针对上述问题,本文提出了一种基于空谱加权近邻(SSWNN)的高光谱图像分类方法。其核心思想是利用地物在空间分布上具有连续性的特点,构造待测样本点的近邻空间,过滤近邻空间中与测试样本点标签不一致的空间近邻点。可有效滤除近邻空间中的异类点以及图像中随机出现的黑色、白色像素点,即椒盐噪声[15-16],进而达到抑制椒盐效应[17]的效果。根据空间近邻点和测试像元的光谱相似性给空间近邻点赋予不同的权值(未引入加权地物空谱最近邻(SSNN)),增大了同类像元间的相似性和异类像元间的差异性。最后通过引入正则化系数[18-19],计算训练样本点和测试样本点邻域块的距离,选择距离最小的训练样本点标签作为测试样本点的标签。
2 算法介绍
近年来,图像去噪和纹理合成领域,多使用图像空间信息与光谱信息相结合的方式。假定高光谱图像中高光谱数据集为X∈RD(D为高光谱图像的维度),图像中的训练样本点为xij∈RD,图像中的测试样本点为yij∈RD(i为图像的横坐标,j为图像的纵坐标)。对于某一个测试样本点,在空间上与其近邻像元的光谱和空间都是相关的,距离越近,越有可能是同类点。根据光谱相似性给近邻点赋予不同的权重突出特征,提出了一种基于空间信息与光谱信息相结合的加权近邻高光谱图像分类方法。
2.1 椒盐效应的抑制
以yij为中心像元点,构造方块尺寸为ω×ω的近邻空间,ω为空间窗口,且为正奇数。将yij的近邻空间表示为
式中,ypq为近邻空间Ω(yij)中除中心像元点外的空间近邻点,a=(ω-1)/2为邻域块的半径。
在高光谱图像中,由于同类地物空间分布具有连续性,所以同一近邻空间中的一部分近邻点和中心像元点的性质接近。但是处于图像边缘上的像元,其近邻点以及图像中随机出现的椒盐噪声在很大概率上和中心像元点不属于同一类别。为解决该问题,提高地物的分类精度,需要去掉和中心像元性质差异较大的点(背景点)。在近邻空间Ω(yij)中,过滤掉背景点之后的近邻空间可表示为
式中,Xlabel(ypq)=Xlabel(yij)表示和中心像元点标签相同的空间近邻点,如果ypq的标签与yij的标签相同,说明它们性质相近,属于同一类地物,则保留该近邻像素点;反之去除该近邻像素点。
图 1. 过滤背景点过程。(a)原始图像;(b)随机样本点;(c)非近邻样本点;(d)处理非近邻样本;(e)过滤后的样本点
Fig. 1. Process of removing background point. (a) Original image; (b) random sample points; (c) non-nearest neighbor sample points; (d) processing non-nearest neighbor sample points; (e) filtered sample points
2.2 SSWNN算法
将近邻(NN)算法应用到高光谱图像分类中,利用图像数据点之间的光谱信息计算测试样本点和训练样本点之间的光谱距离,可表示为
式中,
传统的NN算法分类精度不高,原因是只利用了图像的光谱信息,没有利用图像的空间信息。因此提出了一种基于空谱加权近邻的图像分类算法,通过引入过滤背景点后的近邻空间进行分类,可表示为
式中,xi为中心像素点,N(yij)为去除背景点之后的近邻空间,通过引入正则化系数α=
为进一步提高地物分类精度,引入加权矩阵优化上述函数,可表示为
式中,W={wpq}为近邻空间N(yij)中的所有像元ypq到中心像素点yij的权重集合,wpq=exp(-
w越大,说明空间近邻点与中心像素点性质越接近;w越小,说明空间近邻点与中心像素点的性质差异越大。因此,根据与中心像素点性质相似性的大小给邻域块中的近邻点赋予不同的权重。最终得到测试样本点的标签,可表示为
式中,m为总的地物类数,选择与测试样本近邻空间距离最近的训练样本标签作为测试样本的标签。
2.3 SSWNN算法步骤
基于空谱加权近邻算法的步骤:
1) 输入数据集X∈RD,训练样本集xij∈RD,测试样本集yij∈RD,空间窗口为ω。从数据集中选取不同比例的训练样本和测试样本,且训练样本类别已知;
2) 根据(1)式构建所有样本的近邻空间;
3) 根据(2)式过滤近邻空间中的背景点,改善椒盐效应;
4) 根据权重公式计算近邻点到中心像元点的权重;
5) 根据(5)式求得近邻空间到训练样本的距离;
6) 计算测试样本点的标签,选择与测试样本近邻空间距离最近的训练样本的标签作为测试样本的标签,输出测试样本的类别。
3 实验结果及分析
3.1 实验数据集
使用经典的Indian Pines和PaviaU高光谱图像数据集进行实验。
1) Indian Pines数据集是1992年通过AVRIS拍摄的高光谱图像,其内容为美国西北部Indiana地区部分区域。数据集中的图像尺寸为145 pixel×145 pixel,共覆盖0.4~0.25 μm的波段范围,包含220个波段,空间分辨率为20 m/pixel,剔除掉因水汽吸收和噪声等影响的20个波段,用剩下的200个波段进行实验,包括森林、道路、植被和房屋等16类不同的地物。
图 2. Indian Pines数据集。(a)假彩色图;(b)地物类型调查图;(c)光谱曲线图[14]
Fig. 2. Indian Pines dataset. (a) False-color image; (b) ground-type survey map;(c) spectral curves[14]
2) PaviaU数据集是1992年利用ROSIS获取的高光谱图像,其内容为意大利北部的Pavia大学区域,图像尺寸为610 pixel×340 pixel,总计有115个不同的波段,覆盖了0.43~0.86 μm的光谱范围,空间分辨率达1.3 m,包括房屋、道路和树木等9类不同的地物。剔除掉受光照和噪声影响的12个波段,用剩下的103个波段的数据集进行实验。
图 3. PaviaU数据集。(a)假彩色图;(b)地物类型调查图;(c)光谱曲线[14]
Fig. 3. PaviaU dataset. (a) False-color image; (b) ground-type survey map; (c) spectral curves[14]
3.2 实验设置
为测试本算法的性能,将其与四种现有算法进行对比。其中NN、SRC和SVM是仅利用图像光谱信息的算法,WSSD-KNN是融合了空间信息的算法。为使算法的性能达到最佳,SVM采用高斯内核;设置SRC的残差为0.9;根据文献[ 14],WSSD-KNN的窗口大小设置为13×13,光谱因子设置为1。
使用总体精度(OA),平均精度(AA)以及Kappa系数作为高光谱图像分类精度的评价指标。其中OA表示正确分类的像元数与总像元数之比;AA为所有地物的平均分类精度;Kappa系数表示随机分类产生错误的减少比例。OA、AA和Kappa系数值越大,代表分类精度越高。为减少实验误差,随机选取一定比例的训练样本,重复进行10次实验,计算所有实验结果的平均值作为最终结果。
3.3 Indians Pines数据集实验结果分析
ω是SSNN和SSWNN算法中至关重要的一个参数,选择一个合适的空间窗口ω能使算法效果达到最好。为选择最佳的空间窗口,测试了在不同窗口下的OA值,结果如
图 4. 不同窗口下Indian Pines数据集的OA
Fig. 4. OA of Indian Pines dataset with different spatial windows
由
不同的样本比例也会对实验精度产生较大的影响,为寻找合适的样本比例使实验效果达到最佳,
图 5. 不同训练样本比例下各算法的OA
Fig. 5. OA of different algorithms with different percentages of training samples
由
由
为比较各算法对Indians Pines数据集中每类地物的分类精度,每类地物选取10%的训练样本。
表 1. Indian Pines数据集中各种算法在不同类别中的分类精度
Table 1. Classification accuracy of different classes in Indian Pines dataset for different algorithms
|
图 6. 各算法在Indian Pines数据集的分类结果。(a) NN;(b) SRC;(c) SVM;(d) WSSD-KNN;(e) SSNN;(f) SSWNN
Fig. 6. Classification results of different algorithms in Indian Pines dataset. (a) NN; (b) SRC; (c) SVM; (d) WSSD-KNN; (e)SSNN; (f) SSWNN
3.4 PaviaU 数据集实验结果分析
为选择最佳的空间窗口,测试了在不同窗口下的OA值,结果如
由
各算法在不同样本比例下的OA值如
图 8. 不同算法在不同训练样本比例下的OA
Fig. 8. OA of different algorithms with different percentages of training samples
表 2. PaviaU数据集中各类地物在不同算法下的分类精度
Table 2. Classification accuracy of different classes in PaviaU dataset for different algorithms
|
图 9. 各算法在PaviaU数据及上的分类结果图。(a) NN;(b) SRC;(c) SVM;(d) WSSD-KNN;(e) SSNN;(f) SSWNN
Fig. 9. Classification results of different algorithms in PaviaU dataset. (a) NN; (b) SRC; (c) SVM; (d) WSSD-KNN; (e) SSNN; (f) SSWNN
从
4 结论
提出了一种简单可行的基于空谱加权近邻的高光谱图像分类方法。结合高光谱图像的物理特性,通过选取合适的空间窗口和样本比例,滤除图像中的冗余信息,有效避免了近邻空间内异类点对中心像元点分类的干扰。通过给空间近邻点赋予不同的权值,使有效的鉴别特征更加明显。同时引入正则化系数,对训练样本和测试样本近邻空间距离进行求解,极大提高了算法的精度。在Indian Pines和PaviaU高光谱数据集上的实验结果表明,相较于已有算法,本算法的分类精度更高,对地物的分类效果更好。其中SSWNN算法比仅利用光谱信息的算法,总体精度提高了16.09%~28.05%;比引入空间信息的WSSD-KNN算法,精度提高了约5.01%。因为图像中的噪声会影响对像元的分类,所以对含有噪声较多的图像进行分类还需要进一步研究。
[1] Khodadadzadeh M, Li J, Prasad S, et al. Fusion of hyperspectral and LiDAR remote sensing data using multiple feature learning[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(6): 2971-2983.
[2] Wang L Z, Zhang J B, Liu P, et al. Spectral-spatial multi-feature-based deep learning for hyperspectral remote sensing image classification[J]. Soft Computing, 2017, 21(1): 213-221.
[3] 唐中奇, 付光远, 陈进, 等. 基于多尺度分割的高光谱图像稀疏表示与分类[J]. 光学精密工程, 2015, 23(9): 2708-2714.
[4] Paoletti M E, Haut J M, Fernandez-Beltran R, et al. Deep pyramidal residual networks for spectral-spatial hyperspectral image classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(2): 740-754.
[5] van Cleemput E, Vanierschot L, Fern ndez-Castilla B, et al. The functional characterization of grass- and shrubland ecosystems using hyperspectral remote sensing: trends, accuracy and moderating variables[J]. Remote Sensing of Environment, 2018, 209: 747-763.
[6] Cao X Y, Zhou F, Xu L, et al. Hyperspectral image classification with Markov random fields and a convolutional neural network[J]. IEEE Transactions on Image Processing, 2018, 27(5): 2354-2367.
[7] Zhao C H, Liu W, Xu Y, et al. A spectral-spatial SVM-based multi-layer learning algorithm for hyperspectral image classification[J]. Remote Sensing Letters, 2018, 9(3): 218-227.
[8] Ma L, Crawford M M, Tian J W. Local manifold learning-based k-nearest-neighbor for hyperspectral image classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(11): 4099-4109.
[9] 李非燕, 霍宏涛, 李静, 等. 基于多特征和改进稀疏表示的高光谱图像分类[J]. 光学学报, 2019, 39(5): 0528004.
[10] 杜恩宇, 张宁, 李艳荻. 基于自适应分块编码SVM的车道导向箭头多分类方法[J]. 光学学报, 2018, 38(10): 1015003.
[11] 刘芳, 路丽霞, 黄光伟, 等. 基于离散余弦变换和深度网络的地貌图像分类[J]. 光学学报, 2018, 38(6): 0620001.
[12] 职露, 余旭初, 付琼莹. 联合局部二值模式的高光谱影像空-谱分类方法[J]. 测绘科学技术学报, 2018, 35(1): 65-69, 76.
Zhi L, Yu X C, Fu Q Y. Hyperspectral imagery spatial-spectral classification combining local binary patterns[J]. Journal of Geomatics Science and Technology, 2018, 35(1): 65-69, 76.
[13] Tan K, Hu J, Li J, et al. A novel semi-supervised hyperspectral image classification approach based on spatial neighborhood information and classifier combination[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 105: 19-29.
[14] 黄鸿, 郑新磊. 加权空-谱与最近邻分类器相结合的高光谱图像分类[J]. 光学精密工程, 2016, 24(4): 873-881.
[15] 王志军, 于之靖, 马凯, 等. 一种自适应中值梯度倒数加权的图像滤波算法[J]. 激光与光电子学进展, 2017, 54(12): 121001.
[16] Chen J Y, Zhan Y W, Cao H Y, et al. Adaptive probability filter for removing salt and pepper noises[J]. IET Image Processing, 2018, 12(6): 863-871.
[17] Singh V, Dev R, Dhar N K, et al. Adaptive type-2 fuzzy approach for filtering salt and pepper noise in grayscale images[J]. IEEE Transactions on Fuzzy Systems, 2018, 26(5): 3170-3176.
[18] 朱洪玲, 刘畅, 张博, 等. 激光超声可视化图像处理研究[J]. 中国激光, 2018, 45(1): 0104004.
[19] 余景景, 刘佳乐. 基于非凸L1-2正则化的生物发光断层成像仿真研究[J]. 中国激光, 2018, 45(4): 0407006.
Article Outline
纪磊, 张欣, 张丽梅, 文章. 基于空谱加权近邻的高光谱图像分类算法[J]. 激光与光电子学进展, 2020, 57(6): 061013. Lei Ji, Xin Zhang, Limei Zhang, Zhang Wen. Hyperspectral Image Classification Algorithm Based on Space-Spectral Weighted Nearest Neighbor[J]. Laser & Optoelectronics Progress, 2020, 57(6): 061013.