基于改进LCCD算法的高分六号WFV数据云检测研究 下载: 921次
1 引言
云会严重阻碍电磁波的传播,从而在很大程度上影响了遥感信息获取的质量,降低了数据利用率。对于定性遥感来说,云会阻挡地表信息的表达,使地表信息模糊甚至缺失,导致判别失败或判别困难,降低判别精度;对于定量遥感来说,云检测是反演大气和地表参数必需的预处理工作,云检测结果的好坏直接影响到其他参数的反演结果[1-2]。云的种类十分丰富,厚云在可见光波段具有高反射率,易于检测;而薄云由于结合了下垫面地表的信息,与下垫面结合形成了混合像元,往往难以实现高精度检测[3-4]。因此,进行快速高效的云检测是十分必要的。
目前,国内外已经进行了大量的云检测工作,采用的方法主要包括统计学方法和阈值法。阈值法是应用较为广泛的云检测方法[5-6]。针对不同的传感器,国外已经发展了多种阈值云检测算法,如ISCCP (The International Satellite Cloud Climatology Project)算法[7-8]、APOLLO(AVHRR Processing Over Cloud Land and Ocean)算法[9-10]和CLAVR(The NOAA Cloud Advanced Very High Resolution Radiometer)算法[11-12]。
前期的云检测主要是基于云与典型地表在不同波段的表观反射率或亮度温度的差异设定固定的阈值来识别有云像元。由于地表类型的复杂性以及传感器波段的局限性,通常难以用有限波段的固定阈值将云与大部分典型地表区分开,特别是高亮度背景上空的云检测,以及薄云和碎云的检测。为了提高云检测的精度,Sun等[13-15]提出了一种先验地表反射率数据库支持的动态阈值云检测算法(UDTCDA),该算法以现有的MOD09地表反射率数据库为支撑,设定与反射率大小相关的动态阈值,改变了过去对所有像元设定同样阈值的状况。该算法在波段较少的高分辨率影像云检测中表现出了较高的精度,但该算法对数据库的要求较高,需要以短周期范围内的大量清洁图像作为支撑,前期工作量比较大,而且容易受反射率数据库中没有完全剔除的云像元的影响[16]。为了解决以上问题,Sun等[17]使用地表类型支持的云检测算法(LCCD)来替代地表反射率支持的卫星数据云检测,他们选择GlobeLand30地表类型数据集作为支撑,用于支持Landsat 8 OLI数据的云检测;LCCD算法充分考虑了不同地表类型反射率的变化,将地表类型分为反射率慢变型和快变型两种类型,分别采用不同的方法设定阈值;结果表明,该算法达到了较好的云识别效果。
云检测作为定量遥感关键的一步,快速高效是最基本要求,因此本文将LCCD算法应用于高分六号WFV数据云检测。高分六号WFV数据的空间分辨率为16 m,空间分辨率为30 m的GlobeLand30数据与高分六号WFV数据的空间分辨率差异较大,加之GlobeLand30数据产品的时间为2010年,代
2 数据及预处理
2.1 FROM-GLC10数据及其处理
Gong等[18-19]基于2017年获取的10 m分辨率的Sentinel-2全球影像,开发出了世界首套10 m分辨率的全球土地覆盖产品——FROM-GLC10。该产品提供了耕地、森林、草地、灌木、湿地、水体、苔原、不透水面、裸地和雪/冰等10种类型。验证实验显示,FROM-GLC10的总体精度为72.76%。
FROM-GLC10数据的空间分辨率为10 m,高分六号WFV数据的空间分辨率为16 m,采用双线性内插法将FROM-GLC10数据重采样到16 m分辨率,并赋予其与高分六号WFV数据相同的投影坐标。
2.2 高分六号WFV数据及其处理
2018年6月2日12时13分,中国在酒泉卫星发射中心用长征二号丁运载火箭成功发射了高分专项高分六号卫星。高分六号是一颗低轨光学遥感卫星,也是我国首颗精准农业观测高分卫星,具有高分辨率、宽覆盖、高质量成像、高效能成像、国产化率高等特点,设计寿命8年。高分六号卫星配备有2 m全色/8 m多光谱高分辨率相机、16 m多光谱中分辨率宽幅相机,2 m全色/8 m多光谱相机的观测幅宽为90 km,16 m多光谱相机的观测幅宽为800 km。
表 1. 高分六号WFV数据介绍
Table 1. Introduction of GF-6 WFV data
|
首先将高分六号WFV数据进行正射校正处理,然后将影像的DN(digital number)值转化为具有实际物理意义的辐射亮度值和表观反射率,以进行遥感的定量提取。公式为
式中:Lλ为传感器入瞳处的光谱辐亮度;G为增益值;B为偏移值;DN为传感器接收记录的电压信号或数字值;ρ*为大气顶层表观反射率;D为日地平均距离;Nλ为大气顶层太阳光谱辐照度;θs为太阳天顶角。
3 改进的LCCD算法
3.1 云检测原理
云粒子的直径(5~100 μm)远大于太阳的入射波长,可发生无选择性散射。云对各个波长的可见光及近红外散射强度是相同的,因而云在可见光以及近红外波段呈现白色,且具有较高的反射率[20]。阈值法云检测是在可见光以及近红外波段根据云与植被、水体、不透水面等典型地物的反射率差异进行检测的。对于厚云,尤其是暗地表上方的云,传统阈值法可以达到良好的识别效果。然而薄云的云层比较薄,反射率信息通常结合了云与下垫面组成的混合像元的信息,传统的阈值法在进行薄云检测时往往得不到较好的结果[21-22]。因此,以高精度的先验地表类型数据为支撑,在每种已知地表类型上分别设置阈值进行云检测是十分必要的。需要指出的是,本文在使用FROM-GLC10先验数据进行云检测时,并没有进行苔原以及雪、冰区域的云检测,这是由于受高分六号WFV数据波段设置的限制,波段范围主要集中在可见光、近红外波段,没有对云与雪、冰进行识别的有效波段。另外,本文研究区域为中国大陆,因此并没有进行苔原地区的云检测。
3.2 关键技术
根据FROM-GLC10地表覆盖数据,本文将地表类型分为时空序列地表和非时空序列地表。时空序列地表包括耕地、森林、草地和灌木,非时空序列地表则为湿地、水体、不透水面和裸地。
设置时空序列地表阈值时,根据不同的植被类型、不同的时间以及空间,依据混合像元的原理,将植被类地表看作是植被与裸土的混合像元[23-24],按照季节与纬度分别赋予不同的植被裸土比例;非时空序列地表则无需考虑时空变化的影响,根据云与各地物单波段光谱的差异以及波段比值等特征将云识别出来。
云通常具有较低的NDVI(normalized difference vegetation index)值,但在薄云与浓密植被区域形成的混合像元区域,NDVI值可能偏高[25-26]。NDVI的计算公式为
式中:αNDVI代表归一化植被指数;ρNIR、ρR分别为近红外与红光波段的反射率值,它们在高分六号WFV数据上分别对应波段4和波段3的反射率值。
云与亮地表的区分一直是云检测的难点,云和亮地表在可见光波段都具有较高的反射率,且差异不大。亮地表在近红外波段仍具有较高的反射率,但云由于水汽的吸收作用,在近红外波段的反射率有下降的趋势。根据此特性,可将绿光、近红外比值指数(αGNI)作为云与亮地表区分的有效因子[27-30]。αGNI的计算公式为
式中:ρG、ρNIR分别代表绿光与近红外波段的反射率值,它们在高分六号WFV数据上分别对应波段2和波段4的反射率值。
3.3 非时空序列地表
非时空序列地表包括水体、湿地、裸地和不透水面,其属性相对比较稳定,随时空变化较小或基本不变,因此在设置阈值时不必考虑时空变化对其反射率的影响。本文将此类地表阈值设置为固定阈值,每种地表类型分别设置不同的阈值进行云检测。
式中:
图 1. 非时空序列地表的反射率特征。(a)水体;(b)湿地;(c)裸地;(d)不透水面
Fig. 1. Surface reflectance characteristics of non-spatiotemporal series. (a) Water; (b) wetland; (c) bareland; (d) impervious surface
3.4 时空序列地表
时空序列地表包括耕地、森林、草地和灌木,其属性随着时间和空间而改变,因此在阈值设置时要考虑时空的变化。除耕地外,将其他时空序列地表看作是植被和裸土的混合像元,根据不同的季节和经纬度分别赋予不同的混合像元比值,再根据各典型地物的反射光谱得到云检测阈值。
耕地的情况比较复杂,整体上耕地一般处于两种状态:耕作期和休耕期。在耕作期,耕地多被植被覆盖,反射率较低,因此红、绿、蓝波段可以区分云与耕作期的耕地;在休耕期,耕地几乎没被植被覆盖,大多表现为裸地的形式,因此采用绿光、近红外波段比值指数αGNI和归一化植被指数αNDVI进行裸地的去除。经过以上两步之后得到最终的云像元。当下垫面为耕地时的表观反射率满足(9)式时,被识别为云像元,否则为非云像元。
森林的分布受时空的影响比较明显:热带地区的森林主要为常绿林,植被覆盖浓密且四季变化不分明,因此假设热带地区森林与裸地的比值为0.9/0.1;寒带地区的森林主要为针叶林,叶片面积较小,也无明显的四季特征,因此假设寒带地区森林与裸地的比值为0.7/0.3;温带地区的森林主要为落叶林,有明显的四季变化特征,因此要综合考虑四季的影响,以春季为例,假设温带地区森林与裸地的比值为0.4/0.6。
草地类植被在不同的温度带类型下差异不明显,因此不考虑草地的种类。热带地区的草地全年生长茂盛,覆盖浓密,因此假设草地与裸地的比值为0.9/0.1;在寒带地区,假设草地与裸地的比值为0.3/0.7;温带以春季为例,假设草地与裸地的比值为0.4/0.6。
灌木没有明显的主干,呈丛生状态,是比较矮小的树木,一般可分为观花、观果、观枝干等类型。如
图 2. 时空序列地表的反射率特征。(a)森林;(b)草地;(c)灌木
Fig. 2. Surface reflectance characteristics of spatiotemporal series. (a) Forest; (b) grassland; (c) shrubland
表 2. 森林、草地、灌木的阈值
Table 2. Thresholds of forests, grasslands and shrublands
|
3.5 云检测结果的修正
某些特殊材质的亮地表在太阳照射下会发生镜面反射,反射的太阳辐射能量几乎全部到达传感器,导致这类地物在遥感影像上具有较高的反射率,与云在可见光、近红外波段光谱的差异较小,容易造成误提现象。由于影像分辨率的关系,这些地物在遥感影像上所占的像元数量很少,在云检测结果中呈细小的零星分布,需要对其进行去除。
开运算是一个基于几何运算的滤波器,能够对图像上的零星像元进行去除,同时能够保证原始图像的总体位置和形状不变。开运算是一个先腐蚀后膨胀的过程。本文利用开运算去除云检测结果中的零碎像元,将卷积核设置为3×3的矩阵,从而实现影像中零碎像元的去除。
本文所提先验地表类型库的云检测方法大大提高了云的识别精度,但当厚云边缘存在大量薄云时,薄云与下垫面尤其是亮地表区域的反射率特征极为相似,二者之间的反射率差异较小,导致这部分薄云被漏判。当薄云出现在厚云中间或高云阴影落于低云上时,容易导致云检测结果产生空洞,增大了云覆盖范围判定的不确定性,使后续遥感影像的应用产生误差。因此,本文在上述云检测完成之后进行薄云检测结果的优化。具体方法为:遍历初步云检测结果中的所有无云像元,搜索该像元3×3邻域内的其他8个像元,并进行判断,若邻域内云像元的个数大于5,则重新定义该像元为云像元。
4 实验结果与分析
4.1 目视解译结果
实验结果如
图 4. 水体上方的云检测结果。(a)厚云;(b)碎云;(c)薄云
Fig. 4. Cloud detection results above water. (a) Thick cloud; (b) broken cloud; (c) thin cloud
图 5. 植被上方的云检测结果。(a)厚云;(b)薄云;(c)碎云
Fig. 5. Cloud detection results above vegetation. (a) Thick cloud; (b) thin cloud; (c) broken cloud
图 6. 高亮地表上方的云检测结果。(a)薄云;(b)厚云;(c)碎云
Fig. 6. Cloud detection results above bright surfaces. (a) Thin cloud; (b) thick cloud; (c) broken cloud
LCCD算法在Landsat8 OLI影像亮地表区域的云检测公式为
式中:TB代表了由Landsat8 OLI影像热红外波段计算得到的亮温;
图 7. Landsat8高亮地表上方的云检测结果。(a)碎云;(b)厚云;(c)薄云
Fig. 7. Landsat8 cloud detection results above bright surfaces. (a) Broken cloud; (b) thick cloud; (c) thin cloud
4.2 定量验证
为了更好地评价本文算法的适用性,对高分六号WFV数据云检测结果进行了精度评价。由于高分六号WFV数据图幅过大,因此本文选取有代表性的800×800的子区域进行精度验证,要求子区域覆盖不同的地表类型且地表上空覆盖不同类型的云,通过目视解译的方法对云进行矢量勾画,并将其作为参考真值,对云检测结果的精度进行评价。选取总正确率(βCRT)、云正确率(βCRC)、晴空正确率(βCRS)、错判率(βCER)、漏判率(βOER)作为精度验证的指标,这些指标的计算公式分别为
式中:NS代表正确检测为晴空的像元个数;NC代表正确检测为云的像元个数;NSV代表参考晴空像元的个数;NCV代表参考云像元的个数;NCE代表参考晴空像元检测为云像元的个数;NOE代表参考云像元检测为晴空像元的个数。
图 8. 各样本的正确率指标。(a) βCRT;(b) βCRC;(c) βCRS
Fig. 8. Accuracy index for each sample. (a) βCRT; (b) βCRC; (c) βCRS
图 9. 各样本的错误率指标。(a) βCER;(b) βOER
Fig. 9. Error rate index of each sample. (a) βCER; (b) βOER
云检测整体精度评价如
表 3. 云检测整体精度评价
Table 3. Overall accuracy evaluation of cloud detection
|
5 结论
高分六号是我国首颗精准农业观测的高分卫星,高分六号WFV数据具有高空间分辨率和宽覆盖相结合的特点。精确识别高分六号WFV数据的云像元对于支撑农业资源监测、林业资源调查以及防灾减灾等具有重要意义。本文将高精度的地表覆盖数据——FROM-GLC10作为先验数据,采用改进LCCD算法快速高效地开展高分六号WFV数据云检测工作。考虑到不同地表类型反射率的变化,本文将地表类型分为时空序列地表和非时空序列地表,在每种地表类型上分别采用不同的方法设置阈值。
本文结果表明,此算法在水体类和植被类地表上可以得到较为理想的云检测结果,厚云可以准确识别,薄云、碎云边界的识别也较为完整,云正确率分别达到95.60%和93.09%。对于高亮类地表,由于高分六号WFV数据波段设置的限制,薄云存在一定的漏提现象,且少量亮地表被误提为云,平均云正确率达到88.70%。总体来讲,本文算法在高分六号WFV数据上得到了较为理想的云检测结果,此算法具有原理简单、操作方便快捷等特点,适合批量生产云产品,为后续的定量遥感研究提供了稳定可靠的基础。但仍存在以下不足:1)此算法依赖地表类型数据的精度,尽管FROM-GLC10数据整体上已达到很高的精度,但仍会在一定程度上影响云检测的精度。而且,地表类型数据定性地将地表定义为某种类型,无过渡的概念,这与实际情况存在一定偏差,会导致不同地表类型交界处云检测效果不佳的情况发生。2)由于高分六号WFV数据波段设置的限制,高亮地表区域存在一定的漏提和误提现象。
[1] Harshvardhan U, Randall D A, Corsetti T G, et al. Earth radiation budget and cloudiness simulations with a general circulation model[J]. Journal of the Atmospheric Sciences, 1989, 46(13): 1922-1942.
[5] Yu CH, YuanY, Miao MJ, et al., RemoteSensing and Spatial InformationSciences, 2013, XL-2/W1: 173- 177.
[6] Jedlovec G J, Haines S L. LaFontaine F J. Spatial and temporal varying thresholds for cloud detection in GOES imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(6): 1705-1717.
[7] Rossow W B, Schiffer R A. ISCCP cloud data products[J]. Bulletin of the American Meteorological Society, 1991, 72(1): 2-20.
[8] Rossow W B, Schiffer R A. Advances in understanding clouds from ISCCP[J]. Bulletin of the American Meteorological Society, 1999, 80(11): 2261-2287.
[9] Saunders R W, Kriebel K T. An improved method for detecting clear sky and cloudy radiances from AVHRR data[J]. International Journal of Remote Sensing, 1988, 9(1): 123-150.
[10] Kriebel K T, Gesell G, Kästner M, et al. The cloud analysis tool APOLLO: improvements and validations[J]. International Journal of Remote Sensing, 2003, 24(12): 2389-2408.
[11] Lovell J L, Graetz R D. Filtering pathfinder AVHRR land NDVI data for Australia[J]. International Journal of Remote Sensing, 2001, 22(13): 2649-2654.
[12] Stowe L L, Davis P A. McClain E P. Scientific basis and initial evaluation of the CLAVR-1 global clear/cloud classification algorithm for the advanced very high resolution radiometer[J]. Journal of Atmospheric and Oceanic Technology, 1999, 16(6): 656-681.
[13] Sun L, Wei J, Wang J, et al. A Universal Dynamic Threshold Cloud Detection Algorithm (UDTCDA) supported by a prior surface reflectance database[J]. Journal of Geophysical Research: Atmospheres, 2016, 121(12): 7172-7196.
[14] SunL, Zhou XY, Wang RL, et al.A comparison of the cloud detection results between the UDTCDA mask and MOD35 cloud products[C]//2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS). July 23-28, 2017, Fort Worth, TX, USA.New York: IEEE Press, 2017: 25- 28.
[15] 迟雨蕾, 孙林, 韦晶. Suomi-NPP卫星可见光红外成像辐射仪的改进动态阈值云检测算法[J]. 光学学报, 2019, 39(5): 0528005.
[16] 王权, 孙林, 韦晶, 等. 动态阈值云检测算法改进及在高分辨率卫星上的应用[J]. 光学学报, 2018, 38(10): 1028002.
[17] Sun L, Zhou X Y, Wei J, et al. A new cloud detection method supported by GlobeLand30 data set[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(10): 3628-3645.
[18] Gong P, Liu H, Zhang M N, et al. Stable classification with limited sample: transferring a 30-m resolution sample set collected in 2015 to mapping 10-m resolution global land cover in 2017[J]. Science Bulletin, 2019, 64(6): 370-373.
[19] Gong P, Wang J, Yu L, et al. Finer resolution observation and monitoring of global land cover: first mapping results with Landsat TM and ETM+ data[J]. International Journal of Remote Sensing, 2013, 34(7): 2607-2654.
[20] Sun L, Mi X T, Wei J, et al. A cloud detection algorithm-generating method for remote sensing data at visible to short-wave infrared wavelengths[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 124: 70-88.
[21] Clark RN, Swayze GA, Wise RA, et al. USGS digital spectral library splib06a[R]. [S.l.]:US Geological Survey, 2007.
[22] Boardman JW, Kruse FA, Green RO. Mapping target signatures via partial unmixing of AVIRIS data[C]//Summaries of JPL Airborne Earth Science Workshop. [S.l.:s.n.], 1995: 23- 26.
[23] Plaza A, Martinez P, Perez R, et al. A new approach to mixed pixel classification of hyperspectral imagery based on extended morphological profiles[J]. Pattern Recognition, 2004, 37(6): 1097-1116.
[24] Miao L D, Qi H R, Szu H. A maximum entropy approach to unsupervised mixed-pixel decomposition[J]. IEEE Transactions on Image Processing, 2007, 16(4): 1008-1021.
[25] Ishida H, Nakajima T Y. Development of an unbiased cloud detection algorithm for a spaceborne multispectral imager[J]. Journal of Geophysical Research: Atmospheres, 2009, 114(D7): D07206.
[26] Chen P Y, Srinivasan R, Fedosejevs G, et al. An automated cloud detection method for daily NOAA-14 AVHRR data for Texas, USA[J]. International Journal of Remote Sensing, 2002, 23(15): 2939-2950.
[27] Zhu Z, Woodcock C E. Object-based cloud and cloud shadow detection in Landsat imagery[J]. Remote Sensing of Environment, 2012, 118: 83-94.
[28] Zhu Z, Wang S X, Woodcock C E. Improvement and expansion of the Fmask algorithm: cloud, cloud shadow, and snow detection for Landsats 4-7, 8, and Sentinel 2 images[J]. Remote Sensing of Environment, 2015, 159: 269-277.
[29] Qiu S, Zhu Z, Qiu S, He B, et al. Fmask 4.0: cloud and cloud shadow detection in Landsats 4-8 and Sentinel-2[J]. Remote Sensing of Environment, 2019, 231(15): 111205.
[30] 刘心燕, 孙林, 杨以坤, 等. 高分四号卫星数据云和云阴影检测算法[J]. 光学学报, 2019, 39(1): 0128001.
Article Outline
王永吉, 明艳芳, 梁天辰, 周雪莹, 贾臣, 王权. 基于改进LCCD算法的高分六号WFV数据云检测研究[J]. 光学学报, 2020, 40(21): 2128001. Yongji Wang, Yanfang Ming, Tianchen Liang, Xueying Zhou, Chen Jia, Quan Wang. GF-6 WFV Data Cloud Detection Based on Improved LCCD Algorithm[J]. Acta Optica Sinica, 2020, 40(21): 2128001.