高分四号卫星数据云和云阴影检测算法 下载: 1468次
1 引言
高分四号(GF-4)卫星是我国研制的一颗地球静止轨道高分辨率光学成像卫星,其搭载有一台大口径面阵凝视光学遥感相机。该相机在可见光、近红外和中红外波段共设置6个通道,卫星星下点的像元分辨率在可见光波段可达50 m,在中波红外波段为400 m[1],是目前世界上空间分辨率最高的地球凝视卫星[2]。GF-4卫星中波红外重复观测间隔只需1 s,可见光近红外通道单谱段连续成像间隔只需5 s,具有较高的时间分辨率,它所具有的多种成像模式可以实现对目标的凝视、巡航和追踪。GF-4卫星的发射代表了我国静止轨道高分辨率对地观测技术的最高水平[3-6]。其高空间分辨率、高频次观测以及多光谱信息获取的特征,使其可以在气象、环保、灾害监测等领域发挥重要作用。但云和云阴影的存在会显著降低该数据的使用效率和精度。
云和云阴影会阻碍传感器与地物之间的辐射传输[7],使得应用GF-4数据高精度提取地面信息或大气信息变得非常困难[7-8]。因此,精确地检测影像中的云和云阴影具有重要意义。但GF-4卫星数据的波段相对较少,且没有热红外波段,这使得云及云阴影的高精度检测面临较大挑战。因此,利用GF-4卫星数据的多光谱波段开发一个有效的云和云阴影的检测算法,对于后续探索地球同步卫星云及云阴影检测算法的发展具有积极意义。
云有厚云和薄云之分。厚云在可见光波段具有较高的反射率,易于检测;而且,厚云的透过率较小,其阴影具有更小的反射率,也易于识别。薄云的光谱信息中既有云的光谱特点,又包含地表信息,识别起来较为困难[9]。由于太阳辐射的穿透作用,薄云阴影的光学特征极易与晴空像素混淆,使得薄云阴影的检测更加困难[10]。
目前的云检测方法包括阈值法、辐射传输法和深度学习法等。阈值法因具有使用简单、效率较高等优点而得到了广泛应用。阈值法主要采用云和晴空像元之间的光谱差异来识别有云像元。在阈值法中,阈值的选取是影响云识别结果的关键。目前,已经发展了多种阈值选取方法,如:基于无监督分类方法的自动云覆盖评估系统(ACCA),它利用已知的云及典型地表的光谱特点,通过选择合适的光谱滤波器来判定卫星影像中云的概率[11-12]。由于具有较为丰富的波段设计,MODIS云掩模算法是目前发展得较为完善的一种基于阈值法的云检测方法。该方法综合使用MODIS在可见光到热红外19个波段的数据,通过设定阈值来判定云像元,而且把云像元的概率分为晴空、可能晴空、可能有云和有云4种置信度[13]。为了提高波段较少的卫星数据的云检测精度,Sun等[7]提出了先验地表反射率数据库支持的动态阈值云检测算法(UDTCDA),使用长时间序列的地表反射产品MOD09A1构建的地表反射率数据库为待检测图像提供下垫面地表反射率信息,利用6S模型模拟随地表反射率变化的动态阈值云检测模型。因地表状况已知,该算法的云检测结果具有较高的精度,但由于地表覆盖的变化对数据库的更新提出了较高要求,从而在一定程度上限制了该方法的广泛应用。深度学习法也是目前广泛使用的一种云检测方法,该方法利用不同的神经网络训练遥感影像特征,以实现精确的遥感影像分类[14]。比如,陈洋等[15]采用主成分分析非监督预训练网络结构,并提出了自适应池化模型,实现了资源三号卫星遥感影像的云检测,但是判断卷积神经网络的层次结构和参数设置的最优值是一个非常复杂的过程。
云阴影在遥感影像上表现出反射率较低的特点,在几何外形上与云有相似的外形轮廓,并与云保持着特定的位置关系[16]。目前,针对太阳同步卫星的云阴影检测方法主要有阈值法、几何法和时间序列法。阈值法是基于组分光谱差异的一种分析技术,使用一个或多个波段或衍生度量进行云阴影检测[17]。李炳燮等[18]用不同年份同一季节的无云数据,根据每个波段光谱特征的相对变化,采用厚云阴影地域增强模型进行云阴影检测,该方法适用于厚云阴影区域的云阴影检测,但容易漏判薄云阴影。几何法的基本思想是基于太阳方位角、太阳天顶角及云高等几何关系来识别云阴影[9,19]。Knudby等[20]提出用预测的云顶亮温与晴空预期亮温之间的差值除以垂直温度递减率来估算云高,并在此基础上,根据投影和几何关系来估算云阴影;Zhu等[21]将潜在云层分割为3D云对象,根据亮温和温度下降率来估算云底高度,通过设定合适的步长对云高进行迭代,将每个高度的云的阴影与Flood-fill识别的潜在阴影层进行匹配,直到找到与潜在云阴影具有最大匹配相似性的像元。由于云成分的复杂性,用亮温估算云高具有很大的不确定性。时间序列法是基于晴空条件下像元地表反射率与时间的函数关系来确定相应云阴影像元的一种方法[22-24]。Zhu等[10]提出了一种采用时间序列的Tmask算法,并采用该算法自动检测云和云阴影。他们首先采用Fmask算法区分大部分的云和云阴影,然后将绿光波段、近红外波段和中红外波段的大气顶层反射率叠加后再加权,为每个像元估算时间序列模型,检测未识别的云和云阴影。Tmask能较好地检测云阴影,但是不易获取连续时间序列的无云影像,而且具有很强的地域性,对未来土地覆被变化的预测较为困难。
与大多数太阳同步卫星相比,GF-4卫星的波段较少,其可见光近红外成像通道仅包含蓝、绿、红和近红外4个波段。较少的波段对云及云阴影的高精度检测具有较大限制。本文针对GF-4卫星可见光和近红外通道的特点,提出了一种云和云阴影的检测算法。该算法基于云与典型地表的光谱特征,综合利用单一波谱特征通道选择、多波段光谱特征组合以及相关的变化概率来识别影像中的云像元,并基于观测几何及云层可能的高度范围预测云阴影的投影区域,结合云阴影的光谱特征设定基于影像的动态阈值,最终识别出影像中的云阴影。大量的实验及验证结果表明该算法具有较高的检测精度。
2 原理和方法
2.1 云、云阴影及典型地物的光谱特性分析
图 1. 不同地物在反射波段的光谱特征
Fig. 1. Spectral characteristics of different features in reflectance bands
2.2 云识别
GF-4的光谱波段较少,如何充分利用有限的波段实现高精度的云检测至关重要。本研究选取30幅不同区域、不同时间的影像来分析典型地物和不同类型云的光谱特征,并在此基础上设定检测阈值。主要的云检测过程包括潜在云像元估计和云像元概率计算两步。
2.2.1 潜在云像元估计
云检测的第一步是通过云的光谱特性排除绝对晴空像元得到潜在云像元,该过程由以下几个测试完成。
1) 确定所有可能有云的像元
确定所有可能有云像元的表达式为
式中:
2) “白度”指数检测
在可见光波段,一些地物具有较高的反射率,在蓝、绿、红三个波段的反射率的总和达到与云接近的数值,但云在可见光波段的反射率特点是变化较为平缓,所以可以用蓝、绿、红三个波段的光谱变化趋势将这部分反射率较高的晴空像元排除。该方法由Gomez-Chova 等[32]首先提出,在多个传感器的云检测上已经发挥了重要作用。通过对GF-4数据进行分析,确定采用以下的检测方法:
式中:
3) 绿光、近红外比值检测
遥感影像中的裸土、沙漠和岩石等亮地表常与云像元混淆。通过裸土和岩石的光谱曲线可知,它们的反射率随着波长增加而增大。由于水汽的吸收作用,厚云和薄云的反射率在可见光波段到近红外波段有轻微的下降趋势。如果用绿光与近红外波段发射率的比值来描述这种变化,则亮地表的比值小于1,而云的这一比值则大于1。对GF-4影像的实验结果进行分析后可知,薄云的这一比值有时会小于1。为了不漏掉这部分薄云,将这两个波段的比值降低为0.85,即
此时就能较好地排除亮地表的影响。
4) 雾、霾像元的检测
在可见光范围内,大部分的晴空像元各波段之间具有较强的相关性,但薄云或薄雾在蓝光和红光波段的光谱却不同。Zhang等[33]发现,晴空条件下蓝光波段和红光波段的反射率值可以在二维平面中定义一条晴空线,当受到雾或霾的影响时,二维平面中的坐标值便会发生偏移,偏移量与雾霾的相对厚度成正比。Zhu等[21,34]将表观反射率的值作为这种回归关系的输入值,在区分薄云和薄雾时取得了很好的效果。针对GF-4卫星的光谱特征,本研究对阈值进行了适当调整,即
以上4种检测方法为潜在云像元的识别方法,如果影像中的像元同时满足以上各条件,就会被识别为有云像元,否则就被识别为绝对的晴空像元。
2.2.2 云像元概率计算
云像元识别直接把图像中的像元确定为有云或无云像元,而由于图像中云本身的复杂性,非此即彼的表达方法往往无法准确表达图像中云像元的分布,通常使用像元为云的概率大小来表达,因此,还需要对这些潜在的云像元进行概率判定。陆地上的地物类型比较复杂,遥感影像中陆地地物在各个波段的变化率有很大不同,但水体表面的变化率却比较单一。为了更好地识别云,本研究将陆地和水体进行了区分。水体的反射主要是由水体自身的特性和物质组成决定的,自然状态下的纯净水体在近红外波段的反射率接近于0,而陆地在此波段的反射率却相对较高。由于近红外波段的强吸收作用,水的NDVI值一般会小于0,但陆地的NDVI值一般会大于0.01。考虑到水中叶绿素的存在会使NDVI值增大,选择0.1作为区分水体的阈值。当水体上方覆盖厚云时,无法检测到水的光谱特性,便将此区域划分为陆地;当水体上方覆盖薄云时,由于薄云具有透过性,仍然可以将其识别为水体。水的检测可以通过(6)式实现:
水体上方薄云的存在使得水体在近红外波段的反射率明显增大,如果用0.15的反射率,则需将(6)式识别出的水像元在近红外波段的表观反射率进行归一化处理,得到的值越小说明该像元在近红外波段的反射率越低,越有可能是水;相反,若这个值越接近于1,则该像元在近红外波段的反射率越高,就越有可能是薄云像元。这个归一化的值可由公式
与水像元相比,陆地像元包含更丰富的地物信息,不同的地物在同一波段的反射率差别较大,很难找到一个类似水像元区域的归一化值。但是与其他的地物相比,云在可见光近红外波段的反射率变化得更加平缓,可以用不同波段之间的光谱变化率从地物中识别云。(2)式中的NDVI值描述了光谱在近红外波段与可见光波段之间的变化趋势,(3)式中的平均距离则描述了光谱在可见光各波段之间的变化趋势。用1减去这两个值中的较大值来表示整个光谱波段的变化概率,即
式中:
云检测算法的流程如
2.3 云阴影的识别
完成潜在云层的识别之后,将潜在云层按八连通区域分割为彼此独立的云块,以便于计算云阴影。自然界中的云有不同的垂直结构和不同的层次[35],为了方便起见,文中将每个云块在垂直方向上分割为无数的平面云像元模型,并根据云和云阴影在影像上成像的几何关系计算每个平面模型的云阴影(
1) 排除水像元
在遥感影像中,云阴影与水都具有较低的表观反射率值,容易将水误判为云阴影。水的反射率通常在可见光波段有一个小的反射峰,在近红外的反射率较低,红光波段与近红外波段反射率的比值通常远大于1。而云阴影在可见光和近红外波段的反射率基本相当,或小于1。对两类数据的光谱特征进行分析后可知,波段4和波段5的反射率比值小于1.2时,即
2) 云阴影基本检测
排除水像元这种暗地表的干扰之后,根据云阴影的光谱特征对云阴影进行初步检测,即
式中:
式中:shadow_projection为云阴影的投影区域。在遥感影像中,云阴影的反射率较低,如果将所有像元在近红外波段的反射率按照从小到大的顺序排列起来,云阴影的反射率就处于低值范围内。本研究通过分析30幅影像后发现,几乎所有的云阴影反射率都低于该幅影像反射率的12.5%下分位处的值,所以以此为依据,为每幅影像设定动态阈值。在红光波段处发现了同样的规律。可见,波段组合可使检测精度更可靠。
3) 云阴影概率
如果将排除水体之后的云阴影投影区域中的像元在近红外波段的反射率按照该波段的阈值进行归一化,将大于该阈值的像元反射率设定为1,则归一化值越小就越有可能是云阴影像元。根据云检测中识别云概率的方法,将12.5%下分位的归一化值作为检测云阴影的阈值,用于检测云阴影概率。归一化的目的是为了消除外界条件的影响,更好地突出近红外波段的反射率特性。云阴影的亮度概率表示为
云阴影的动态阈值表示为
式中
将基本检测和概率检测结合起来识别出云阴影,
具体的云阴影检测流程如
完成云和云阴影的识别后,输出云掩模和云阴影掩模。为了取得更好的视觉效果,对云和云阴影进行腐蚀膨胀操作。
3 结果分析及讨论
3.1 云检测结果
本研究选取2016—2017年不同时相、不同地域的多景GF-4影像进行验证。为了使验证结果更加全面、精确、可靠,选取厚云、薄云、碎云等多种云型以及植被、裸土、沙漠、水域等多种下垫面类型,并且采用目视解译的方式验证其精度。由于GF-4影像的图幅过大,这里选取具有代表性的子图像进行展示。
图 5. 不同区域、不同云型的云检测结果
Fig. 5. Cloud detection results of different clouds in different regions
3.2 云阴影检测结果
3.2.1 所提算法的云阴影检测结果
图 6. 不同区域、不同云型的云阴影检测结果
Fig. 6. Cloud shadow detection results of different clouds in different regions
3.2.2 云阴影检测结果的对比
为了突出动态光谱阈值法(DST)的优势,这里将动态光谱阈值法得到的云阴影检测结果与Fmask算法中的云和云阴影匹配法(CCM)得到的结果进行对比。
图 7. 动态光谱阈值法与云和云阴影匹配法的云阴影结果对比
Fig. 7. Comparison of cloud shadow detection results of DST with CCM
3.3 定量分析
为了更好地评价所提算法的适用性,对云检测结果和云阴影的检测结果进行定量分析。由于GF-4卫星的图幅太大,选取具有代表性的500 pixel×500 pixel的不同区域的子影像进行精度验证分析。从不同下垫面的假彩色影像中分别选取三景影像(包含厚云、薄云、碎云等多种云型),对其中的云和云阴影进行矢量化处理,并将矢量化后的结果与动态光谱阈值法得到的检测结果进行对比,计算了云像元的正确率
式中:
表 1. 云像元检测结果的定量分析
Table 1. Quantitative analysis of cloud image pixel detection results
|
表 2. 云阴影像元检测结果的定量分析
Table 2. Quantitative analysis of cloud shadow image pixel detection results
|
4 结论
GF-4遥感卫星是我国首个民用高分辨率光学卫星,也是世界上分辨率最高的地球静止轨道卫星。GF-4卫星的波段较少,云和云阴影检测面临着较大困难。本课题组根据GF-4卫星传感器的参数特征,充分考虑云、云阴影及不同地物之间的光谱差异特征,提出采用光谱分析的方法来识别GF-4卫星影像中的云,并采用光谱分析与几何算法相结合的方法识别影像中的云阴影。在有云像元的识别上,运用可见光和近红外波谱特征识别出潜在的云像元,将亮度概率与光谱变化率组合分别产生水上和陆地上的云概率。在云阴影的识别上,根据云和云阴影的几何关系,结合传感器视角和太阳方位角估算云阴影的位置,根据基于场景的动态光谱阈值识别出云阴影像元。
通过检测结果和目视解译结果进行对比后发现,所提算法对不同云型的云像元均具有较高的检测精度;定量分析结果显示,不同下垫面云像元和晴空像元的正确率较高,且误判率和漏判率较低。与云阴影匹配法相比,所提动态光谱阈值法检测出的云阴影形状更加完整,位置更加准确。
虽然本研究所提云和云阴影检测算法在GF-4卫星影像中取得了较高的精度,但该算法也有其局限性,主要表现在以下两个方面:1)由于GF-4卫星的波段较少,没有有效识别冰雪的波段,因此未对冰雪区域的云及云阴影进行检测;2)遥感影像中的云和云阴影是非常复杂的,而GF-4卫星的波段较少,可利用的信息受限,对于部分薄云及其阴影,仍无法检测出来。未来可以利用GF-4卫星高频次观测的特点,考虑采用多时相信息进一步完善云及云阴影的检测。
[2] 王密, 程宇峰, 常学立, 等. 高分四号静止轨道卫星高精度在轨几何定标[J]. 测绘学报, 2017, 46(1): 53-61.
[3] 王中挺, 张玉环, 袁淑云, 等. 利用高分四号数据监测“京津冀”地区陆地气溶胶[J]. 环境与可持续发展, 2016, 41(5): 113-116.
[4] 王殿中, 何红艳. “高分四号”卫星观测能力与应用前景分析[J]. 航天返回与遥感, 2017, 38(1): 98-106.
[5] 徐文, 龙小祥, 李庆鹏, 等. “高分四号”卫星影像辐射与几何精度评价[J]. 航天返回与遥感, 2016, 37(4): 16-25.
[6] 李果, 孔祥皓, 刘凤晶, 等. “高分四号”卫星遥感技术创新[J]. 航天返回与遥感, 2016, 37(4): 7-15.
[8] 沈金祥, 季漩. 遥感影像云及云影多特征协同检测方法[J]. 地球信息科学学报, 2016, 18(5): 599-605.
[11] Irish RR. Landsat 7 automatic cloud cover assessment[C]. Proceedings of SPIE, 2000: 348- 356.
[14] 刘大伟, 韩玲, 韩晓勇. 基于深度学习的高分辨率遥感影像分类研究[J]. 光学学报, 2016, 36(4): 0428001.
[15] 陈洋, 范荣双, 王竞雪, 等. 基于深度学习的资源三号卫星遥感影像云检测方法[J]. 光学学报, 2018, 38(1): 0128005.
[16] 周伟, 关键, 姜涛, 等. 多光谱遥感影像中云影区域的检测与修复[J]. 遥感学报, 2012, 16(1): 132-142.
[18] 李炳燮, 马张宝, 齐清文, 等. Landsat TM遥感影像中厚云和阴影去除[J]. 遥感学报, 2010, 14(3): 534-545.
[19] 秦雁, 邓孺孺, 何颖清, 等. 基于光谱及几何信息的TM图像厚云去除算法[J]. 国土资源遥感, 2012, 24(4): 55-61.
[23] Hagolle O, Huc M, Pascual D V, et al. A multi-temporal method for cloud detection, applied to Formosat-2, VENμS, Landsat and Sentinel-2 images[J]. Remote Sensing of Environment, 2010, 114(8): 1747-1755.
[24] 胡昌苗, 白洋, 唐娉. GF-4序列图像的云自动检测[J]. 遥感学报, 2018, 22(1): 132-142.
[25] WeiJ, SunL, JiaC, et al. Dynamic threshold cloud detection algorithms for MODIS and Landsat 8 data[C]. Beijing: 2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), 2016: 566- 569.
[28] 范伟, 王毅, 饶瑞中. 可见到近红外波段整层大气光谱透过率的测量研究[J]. 光子学报, 2006, 35(3): 402-407.
[29] 姜雪芹, 叶勤, 林怡, 等. 基于谐波分析和高光谱遥感的土壤含水量反演研究[J]. 光学学报, 2017, 37(10): 1028001.
[30] 刘焕军, 张柏, 张渊智, 等. 基于反射光谱特性的土壤分类研究[J]. 光谱学与光谱分析, 2008, 28(3): 624-628.
[31] Wong MS, NicholJ, Lee KH, et al. Retrieval of aerosol optical thickness using MODIS 500×500 m 2, a study in Hong Kong and Pearl River delta region [C]. 2008 International Workshop on Earth Observation and Remote Sensing Applications, Beijing, 2008: 1- 6.
[32] Gomez-Chova L, Camps-Valls G, Calpe-Maravilla J, et al. Cloud-screening algorithm for ENVISAT/MERIS multispectral images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(12): 4105-4118.
[33] Zhang Y, Guindon B, Cihlar J. An image transform to characterize and compensate for spatial variations in thin cloud contamination of Landsat images[J]. Remote Sensing of Environment, 2002, 82(2/3): 173-187.
[34] Zhu Z, Wang S X, Woodcock C E. Improvement and expansion of the Fmask algorithm: cloud, cloud shadow, and snow detection for Landsats 4-7, 8, and Sentinel 2 images[J]. Remote Sensing of Environment, 2015, 159: 269-277.
[35] 王箫鹏, 宋小全, 陈玉宝, 等. 激光雷达观测北京春季云垂直结构及探空对比研究[J]. 光学学报, 2015, 35(s2): s201001.
[36] 刘志国, 周云轩, 沈芳. 河口水体泥沙浓度的水面光谱统计模式分析[J]. 水利学报, 2007, 38(7): 799-805.
Liu Z G, Zhou Y X, Shen F. Statistic analysis of suspended sediment concentration in offshore waters based on field measurement of reflectance hyper-spectral[J]. Journal of Hydraulic Engineering, 2007, 38(7): 799-805.
Article Outline
刘心燕, 孙林, 杨以坤, 周雪莹, 王权, 陈婷婷. 高分四号卫星数据云和云阴影检测算法[J]. 光学学报, 2019, 39(1): 0128001. Xinyan Liu, Lin Sun, Yikun Yang, Xueying Zhou, Quan Wang, Tingting Chen. Cloud and Cloud Shadow Detection Algorithm for Gaofen-4 Satellite Data[J]. Acta Optica Sinica, 2019, 39(1): 0128001.