基于时序数据回归分析的深度学习云检测

云的存在影响卫星数据的使用，因此准确高效的云检测在遥感图像目标识别和参数定量反演中具有重要作用。针对亮地表、薄碎云及云边界等难以识别、不同尺度特征的云检测精度不稳定等问题，对短期时序数据进行线性回归计算，将前后时序数据的表观反射率斜率变化趋势作为输入特征。为充分挖掘不同尺度的信息，采用具有密集跳跃结构和深监督结构的UNet++模型进行云检测研究。与单时相数据集的U-Net、SegNet和UNet++相比，所提方法可以更有效地突出多尺度特征，增加对亮地表、云边缘和薄云信息的敏感度。结果表明，所提方法在云检测方面得到较高的精度，总体精度达98.21%，误检率降低至1.07%，漏检率降低至3.12%。所提方法能有效降低裸地、道路、建筑物、冰雪等亮地表对云识别的干扰，提升了对薄云的识别精度，且适用于不同下垫面的遥感影像。

Abstract

The transmission of satellite data is adversely affected by cloud cover; therefore, precise cloud detection plays an important role in recognizing remote sensing image targets and quantitatively inverting parameters. This study addresses the challenges of accurately identifying bright surfaces, thin clouds, broken clouds, and cloud boundaries and the stability of cloud detection accuracy across different scale features. We calculate linear regression on short-term time series datasets, using the slope-change trend of apparent reflectance of front and back time series datasets as the input. To fully leverage information from different scales, we employ the UNet++ model for cloud detection, which boasts a unique dense skip structure and deep supervision structure. Compared with U-Net, SegNet, and UNet++ of the single-temporal dataset, our proposed method can effectively highlight multiscale features and increase the sensitivity for bright surfaces, cloud-boundary contour, and thin-cloud information. Our results demonstrate that the proposed method achieves a high accuracy of 98.21% in cloud detection, and the false detection and missing detection rates are reduced to 1.07% and 3.12%, respectively. Furthermore, our method effectively reduces the interference of bright surfaces on cloud identification, such as barren lands, roads, buildings, ice, and snow, while improving thin-cloud identification accuracy. Therefore, our proposed method is suitable for remote sensing images of different underlying surfaces.

1　引言

云的存在影响着太阳和地表间的辐射能量传输^［1-3］，影响着卫星图像中地表、大气等参数的定量反演^［4］，准确高效的云检测在卫星影像定量反演中有着较为重要的作用。

阈值法是最早发展起来的云检测方法，已经广泛地应用于多种类型卫星图像的云检测。目前常用的传统阈值方法有Rossow等^［5］提出的The International Satellite Cloud Climatology Project（ISCCP）方法、AVHRR Processing Over Land Cloud and Ocean（APOLLO）方法^［6］和MODIS Cloud Mask算法^［7］。但这些方法主要用于中等空间分辨率传感器，为了解决高空间分辨率传感器可用波段少导致云识别精度低的问题，Zhu等^［8］提出Fmask方法用于Landsat数据的云检测。随着应用需求的不断提升，动态阈值法被提出并应用到云检测。Sun等^［9］提出了一种通用动态阈值云检测算法（UDTCDA），该算法利用MOD09A1产品构建月度地表反射率数据库，通过辐射传输模型估算动态阈值并进行云像素的识别。王权等^［10］改进了UDTCDA中地表反射率库与待检测卫星数据的空间匹配方法，进一步提升了云检测的精度。阈值法具有计算简单、速度快的优点，但它太过依赖阈值设定，对混合像元有较高的误判率，在云检测研究中具有一定的局限性。

深度学习技术由于具有较强的信息挖掘能力，目前已广泛用于卫星数据的云检测中。Zeng等^［11］将全卷积网络（FCN）用于Landsat8数据的云检测，该网络能较好地区分出厚云与薄云，整体准确率高于88%。Chen等^［12］为了解决FCN降低特征分辨率及定位精度等问题，在深度卷积神经网络（DCNN）中引入并行空洞卷积和条件随机场，提出了Deeplab模型。该模型在提升计算速度的前提下有效地扩大滤波器的视野，恢复全分辨率特征图并提升捕获边缘细节的能力。Zhao等^［13］通过在FCN中引入金字塔池化模块，提升FCN聚合全局上下文信息的能力。Wieland等^［14］将U-Net用于TM、ETM+、OLI及Sentinel-2多个卫星传感器，证明了该模型的泛化能力，并展示了不同训练策略和光谱波段组合对模型性能影响的内容。王海涛等^［15］将多尺度特征与U-Net相结合，提升了模型对薄、碎云信息的挖掘能力，取得了较好的精度结果。Zhou等^［16］对U-Net模型进行加强，以短连接代替长连接，增加了多个跳跃结构，提出了UNet++模型。Chai等^［17］利用SegNet模型对Landsat7和Landsat8影像进行云与云阴影检测。但是目前基于深度学习的云检测方法大多是基于单时相离散通道组合进行实验的，无法深度提取云与地表的差异特征。

针对上述存在的问题，本文选取含云影像与对应地区前后时序的无云影像作为原始数据，利用线性回归方程计算时序数据的反射率变化趋势，并利用深度学习模型进行云检测研究。实验结果表明，对于不同类型以及下垫面的云，所提方法均能够得到较好的云检测结果，有效降低了对裸地、沙漠及冰雪等亮地表的误检率，减少了半透明薄云与地表信息形成的混合像元的漏检情况，提高了模型的泛化能力。

2　数据集选取与构建

2.1　Landsat8 Biome产品

本研究选用Landsat8 Biome数据集进行云检测实验。Landsat8 Biome数据集囊括了全球范围内不同下垫面群落的云量产品。以云阴影为区分标准对该数据集划分影像，可以避免影像中云阴影的影响。它包含了裸地、城市、草地、冰雪、森林、灌木、湿地及水体8种下垫面，每种下垫面包括12景影像。根据影像含云量的多少，又将12景影像细分为4景少云影像（含云量小于35%）、4景中云影像（含云量介于35%和65%之间）及4景多云影像（含云量大于65%），保证了云类型的多样性。每景影像都含有人工标注的云量掩模文件。

2.2　表观反射率变化趋势计算

以2013年南美洲阿尔及利亚的荒漠地区为例进行分析，获取该地区2013年的Landsat8时序数据，将无云数据排列在前，含云影像排列在后，并将不同类型数据按时间升序排列，得到像元的反射率变化趋势统计图，如图1所示。其中，图1（a）~（i）分别代表着海蓝（B1）、蓝色（B2）、绿色（B3）、红色（B4）、近红外（B5）、短波红外1（B6）、短波红外2（B7）、全色（B8）及卷云波段（B9）等OLI波段的表观反射率分布情况。横坐标1~12代表同一地区1~12月份的无云影像，13和14代表该地区的中云和厚云影像；纵坐标代表像元的表观反射率值。从图1可以看出：在海蓝、蓝色、绿色、红色、近红外、全色、短波红外及卷云波段中，无云地表像元之间的表观反射率变化小于0.04，斜率变化很小，斜率趋势平缓；无云像元与云像元之间的表观反射率变化明显，云像元的表观反射率明显高于无云地表像元，斜率呈陡增的趋势。因此，可利用斜率陡峭变化趋势对时序数据进行线性回归分析，逐像元计算变化趋势，并将计算得到的斜率值影像作为输入特征进行训练和预测。时序数据间的像元斜率为

S_{c l o u d} = \frac{n \sum_{i = 1}^{n} (i \times ρ_{i}) - \sum_{i = 1}^{n} i \times \sum_{i = 1}^{n} ρ_{i}}{n \sum_{i = 1}^{n} i^{2} - {(\sum_{i = 1}^{n} i)}^{2}}

，（1）

式中 $: ρ_{i}$ 代表第 $i$ 时间段像元的表观反射率； $n$ 代表时序数。当某个像元在时序上是前有云后无云时，此时 $S_{c l o u d}$ <0，将小于0的值视为异常值并进行剔除；当像元在时序上是前无云后有云时，此时 $S_{c l o u d}$ >0；当某个像元在时序上是前后都无云时，此时 $S_{c l o u d}$ ≈0。

图 1. 时序数据的表观反射率分析，虚线为12月无云影像与厚云影像的反射率连线

Fig. 1. Apparent reflectance analysis of time series data, the dash shows the reflectivity line between cloudless image and thick cloud image in December

下载图片查看所有图片

2.3　波段测试实验

选择不同的波段组合作为输入特征会带来不同的检测效果。将OLI所有波段输入模型进行训练并不能得到最优的训练和预测精度。相反，选择过多波段进行训练会出现过拟合问题，降低网络模型的泛化性能^［18-19］。对上述计算的Slope趋势图逐波段进行分析，如图2所示，云检测短期时序数据在可见光、近红外及卷云波段具有较高的斜率值，尤其在可见光和近红外波段，斜率值最高达0.85；而无云像元间的斜率在0值附近有微弱的浮动；云阴影的斜率值始终为负值。因此，利用短期时序数据进行云检测在理论上是可行的。但是，云像元与无云地表的斜率值在短波红外2出现交叉重叠现象，如果将其作为特征输入模型，会给模型学习云层的光谱特征和纹理特征时带来干扰，降低模型的鲁棒性。为减少不同波段组合导致的特征信息混淆情况，选取海蓝、可见光、近红外与卷云波段等6个波段的斜率波段作为输入特征。

图 2. Slope波段分析

Fig. 2. Slope band analysis

下载图片查看所有图片

2.4　短期时序数据集构建

深度学习训练样本的数量及代表性对网络模型的泛化能力有正向的推动作用，因此，构建数据集时不仅要选择合适的波段，还要包含不同典型地表类型且数量要足够多。考虑到无云影像获取有一定难度，而裸地、沙漠、建筑物等地表的表观反射率短期内不会随时间发生变化，故对于这类不随季节发生变化的地表的无云数据，筛选时可适当放宽时间限制；森林、草地、农田、灌木及湿地等地表的表观反射率随季节周期发生变化，故选择限制在前后一个月或相邻年份同一时间的无云影像。从Biome数据集中选择48景含云影像，24景用来构建训练集，24景用来构建测试集。对所需影像进行辐射校正，将数字量化值（DN）转换为表观反射率，然后对同一地区的短期时序数据按照反射率大小进行排序，得到无云像元在前、云像元在后的排列顺序。利用式（1）计算得到各波段的斜率趋势值并进行波段组合，由此得到模型的训练集和测试集。

3　原理与方法

3.1　UNet++模型

UNet++拥有复杂的跳跃连接结构。UNet++重新设计的密集跳跃结构连接了两个子网络，增加了模型的梯度流动性，弥补了编码器和解码器之间的语义鸿沟。当来自编码器网络的高分辨率特征映射在来自解码器网络的相应语义特征时，该模型可以更有效地捕获前景对象的细粒度细节。模型的卷积层均使用3×3的卷积核计算得到，池化层采用最大池化方式，保留更多的纹理信息。密集跳跃结构中的每个子集都是由独立的卷积层和池化层构成的。从结构中可以看出，模型内部除了水平方向上存在着跳跃结构，浅层卷积和深层卷积之间通过上采样联结在一起。所以上采样之后的卷积层融合了该阶段的特征信息和下一阶段卷积层的特征信息，解决了多层卷积计算后信息丢失的弊端^［16］。图3中的X^i，j表示输出特征图。Xⁱ^，^j的计算公式为

X^{i, j} = \{\begin{matrix} H (X^{i - 1, j}), j = 0 \\ H \{[{[X^{i, k}]}_{k = 0}^{j - 1}, U (X^{i + 1, j - 1})]\}, j > 0 \end{matrix}

，（2）

式中： $H (\cdot)$ 代表卷积计算，后面跟一个ReLU激活函数； $U (\cdot)$ 代表上采样层； $[\cdot]$ 代表连接层； $i$ 表示沿编码器的下采样层索引， $j$ 表示沿跳跃路径的密集块卷积层索引。索引 $j = 0$ 的节点仅从编码器的前一层接收一个输入； $j = 1$ 的节点接收两个输入，且这两个输入均来自编码器子网络； $j > 1$ 的节点接收 $j + 1$ 个输入，其中 $j$ 个输入是同一跳跃路径中前 $j$ 个节点的输出，最后一个输入是来自较低跳跃路径的上采样输出。由于每个跳跃路径上都加入密集卷积块，故当前节点包含该节点前的所有输出特征图。以图3的 $X^{0,4}$ 节点为例， $X^{0,4}$ 节点与同一层级的卷积块 $X^{0,0}$ 、 $X^{0,1}$ 、 $X^{0,2}$ 及 $X^{0,3}$ 之间跳跃连接，这些输出特征图的增加有助于优化器的优化^［20］。

图 3. UNet++模型结构

Fig. 3. UNet++ model structure

下载图片查看所有图片

3.2　泛化性能测试

为了探究不同数据集对UNet++泛化性能的影响，利用Landsat8数据，构建单时相以及短期时序数据集进行训练和验证。单时相数据集指从Biome数据集的8个下垫面中各选3张含云影像（1张多云影像、1张中云影像、1张少云影像）作为训练数据集的集合。短期时序数据集指对单时相数据集的24张8000×8000左右的Landsat8数据与对应区域的无云影像计算斜率变化趋势后得到的影像数据集。由于两种数据集选用相同的模型和参数进行训练和预测，为了在后续定性和定量分析时不造成混淆，将利用短期时序数据进行训练的方法称为Slope-UNet++。

3.3　模型参数

利用TensorFlow 2.4中的Keras框架搭载UNet++模型，在配置为NVIDIA GeForce RTX 3050Ti Laptop GPU的电脑上展开研究。考虑到电脑性能和模型架构限制，Landsat8原始影像无法直接作为训练集输入到模型中。因此，对训练数据集采用滑动窗口方式（每相邻两张影像重叠度为10%）进行批量分割，分成256×256大小的影像块，共计22432张。其中，训练数据块的70%用来训练，30%用来模型验证。UNet++模型的训练情况如图4所示，模型的训练精度和验证精度在迭代次数5以后趋于稳定，训练数据和验证数据的损失率在迭代次数15以后趋于稳定。因此所提UNet++模型采用自适应动量优化算法（Adam）迭代更新网络模型的权重，Epoch设置为50，Batch_size设置为8，学习率设置为0.001。

图 4. 模型训练参数

Fig. 4. Model training parameters

下载图片查看所有图片

3.4　精度指标

选用6种广泛使用的量化指标来评估网络模型预测云识别的准确性，即总体准确度（ $α_{O A}$ ）、召回率（ $α_{R e c}$ ）、精确度（ $α_{P r e}$ ）、F1分数（ $α_{F 1_s c o r e}$ ）、误检率（ $α_{F A}$ ）及平均交并比（ $α_{M I o U}$ ）。它们的公式分别为

\{\begin{matrix} α_{M I o U} = \frac{1}{2} \times (\frac{N_{T P}}{N_{F N} + N_{F P} + N_{T P}} + \frac{N_{T N}}{N_{T N} + N_{F N} + N_{F P}}) \\ α_{O A} = \frac{N_{T P} + N_{T N}}{N_{T P} + N_{T N} + N_{F P} + N_{F N}} \\ α_{R e c} = \frac{N_{T P}}{N_{T P} + N_{F N}} \\ α_{P r e} = \frac{N_{T P}}{N_{T P} + N_{F P}} \\ α_{F 1_s c o r e} = 2 \times \frac{α_{P r e} \times α_{R e c}}{α_{P r e} + α_{R e c}} \\ α_{F A} = \frac{N_{F P}}{N_{F P} + N_{T N}} \end{matrix}

，（3）

式中： $N_{T P}$ 代表真实值和预测值中被识别为云像素的数量； $N_{T N}$ 代表真实值和预测值中被识别为晴空像素的数量； $N_{F P}$ 代表真实值中被识别为晴空像素但预测值中为云像素的数量； $N_{F N}$ 代表真实值中被识别为云像素但预测值中为晴空像素的数量。由于云边界像元易出现分类错误，因此利用F1分数评价预测结果的边缘质量，利用总体准确度和精确度评价准确识别的概率，利用平均交并比评价分割效果。此外，引入漏检率计算公式，即 $α_{M A R}$ =1- $α_{R e c}$ 。

4　结果与分析

4.1　定性分析

为了准确对比算法性能，首先将Landsat8 Biome官方云检测产品重新分为云和非云两类，其中云包含云（cloud）、薄云（thin cloud），非云包含填充区域（fill）、云阴影（shadow）及晴空像元（clear）；然后将Slope-UNet++方法的云识别结果与基于单时相离散通道组合数据集的云识别结果和官方云检测产品进行对比。图5（a）为裸地上空的云识别结果对比；图5（b）为城市上空的云识别结果对比；图5（c）为森林上空的云识别结果对比；图5（d）为草地上空的云识别结果对比；图5（e）为灌木上空的云识别结果对比；图5（f）为冰雪上空的云识别结果对比；图5（g）为水体上空的云识别结果对比；图5（h）为湿地上空的云识别结果对比。从图5（a）、（b）、（e）、（f）可以看出：Slope-UNet++方法能准确排除裸地、建筑物、道路和冰雪等亮地表对云的误检；单纯单时相OLI离散波段组合作为输入特征后，SegNet、U-Net和Unet++模型容易出现大面积误检。这是因为裸地、建筑物、道路和冰雪等亮地表在可见光、近红外及卷云波段有与云高度相似的反射特性，白度上也与云相似，模型无法有效识别异物同谱现象。亮地表具有时空不变性，其反射率不随季节周期变化而剧烈变化，故基于时序分析的方法能有效去除对裸地、建筑物、道路和冰雪等特征的错误识别。如图5（c）、（d）、（e）、（g）、（h）所示，森林、草地、灌木、水体及湿地的反射率要低于云的表观反射率，单纯离散通道组合输入到深度学习模型后，这些方法能得到较好的厚云识别效果，但是对薄云的识别效果较差，容易出现漏检现象。这是由于半透明薄云像元的反射率比厚云低，地面物体的反射率穿透薄云，不同对象的反射率混杂在一起，形成混合像元，容易被模型分割为无云一类。例如，水体的反射率很低，在0.1~0.2之间，海洋和薄云光谱信息叠加在一起导致反射率升高到与普通地表相近，被错误识别为无云像元。Slope-UNet++方法能有效地提升对薄云的正确识别率，利用同一像元两个或两个以上时相数据间的表观反射率浮动趋势来分割云与无云地表，明显减小了对薄云的漏检率。

图 5. 短期时序数据集与单时相数据集的云识别结果对比。（a）裸地上空；（b）城市上空；（c）森林上空；（d）草地上空；（e）灌木上空；（f）冰雪上空；（g）水体上空；（h）湿地上空

Fig. 5. Comparison of cloud identification results between short-time-series dataset and single-temporal dataset. (a) Over the barren; (b) over the city; (c) over the forest; (d) over the grassland; (e) over the shrub; (f) over the ice and snow; (g) over water; (h) over wetland

下载图片查看所有图片

4.2　定量分析

为了准确分析各个模型的云检测精度，在裸地、城镇、森林、草地、湿地、灌木、冰雪及水体8种下垫面分别选取影像进行精度评定。图6为不同训练模型的云检测精度统计图。在不同下垫面，Slope-UNet++方法的云检测结果优于单纯离散通道组合的云检测结果。如图6所示，在8种不同下垫面中，所提方法的单一场景总体准确度高于0.96（冰雪为0.93）、F1分数高于0.93（冰雪为0.89），明显高于单时相数据集的SegNet、U-Net及UNet++模型的精度。结果表明，所提方法提升对云像元与无云像元的准确识别概率的同时保证了云边缘的精度。从图6（a）、（b）、（e）、（f）可以看出，在裸地、城市、灌木及冰雪下垫面，Slope-UNet++方法的精确度和召回率明显优于单纯波段组合的模型结果，这与上述目视解译的结果是高度一致的。这表明，利用短期时序数据计算表观反射率的斜率值，并将其作为输入特征，增大了云与无云地表之间的光谱差异和纹理差异，提高了模型的泛化能力。

图 6. 模型的精度对比。（a）裸地上空；（b）城市上空；（c）森林上空；（d）草地上空；（e）灌木上空；（f）冰雪上空；（g）水体上空；（h）湿地上空

Fig. 6. Accuracy comparison of models. (a) Over the barren; (b) over the city; (c) over the forest; (d) over the grassland; (e) over the shrub; (f) over the ice and snow; (g) over water; (h) over wetland

下载图片查看所有图片

对24景影像中不区分地面场景的影像进行总体评价。从表1可以看出：所提方法不区分下垫面的总体准确度达98.21%，高于单时相离散通道组合的U-Net、UNet++和SegNet的95.72%、95.55%和94.12%；误检率降低到1.07%，优于不同样本数据集的U-Net、SegNet和UNet++的4.34%、5.78%和4.55%；漏检率降低到3.12%；F1分数提高到96.28%。这些精度数据表明，短期时序数据的斜率变化趋势数据集与深度学习模型的结合能有效去除对亮地表的误检，提升对薄碎云和云边界的识别精度。

表 1. 精度评定

Table 1. Assessment of accuracy

Dataset	Model	$α_{O A}$ /%	$α_{F 1_s c o r e}$ /%	$α_{F A}$ /%	$α_{M A R}$ /%
Single-temporal+Bands	U-Net	95.72	93.17	4.34	4.11
	SegNet	94.12	90.68	5.78	6.08
	UNet++	95.55	92.91	4.55	4.23
Multi-temporal Slope+Bands	Slope-UNet++	98.21	96.28	1.07	3.12

查看所有表

此外值得注意的是，深度学习模型逐像元评定待预测遥感影像的云概率，因此，阈值的设置会影响模型二分类输出结果，从而影响着准确度、召回率、误检率和漏检率等多种指标。如图7所示：精确度在阈值为0.05时出现陡增，在0.05之后随着阈值的增加稳步增加，并在阈值为1处达到最大精确度100%；召回率呈现相反的变化趋势，随着阈值的增加，召回率从100%稳步降低到80%，并在阈值为1处陡降至9%；精确度与召回率在0.45处出现交叉，此时精确度与召回率达到了动态平衡。用户可以根据自身对不同指标的精度需求，选择合适的阈值进行云检测实验。

图 7. 阈值对精确度和召回率的影响

Fig. 7. Impact of threshold on precision and recall

下载图片查看所有图片

5　结论

云检测是去云工作高效开展的重要前提。亮地表和薄碎云易错误识别是目前云检测研究存在的重难点问题。针对亮地表光谱和纹理特征与云相似、半透明薄云光谱和纹理特征与普通地表相似的问题，利用建筑物、道路、裸地、荒漠等亮地表在短期时序数据的像元斜率变化趋于0值，而云的斜率变化剧烈且陡峭的特性，基于Landsat8 Biome数据集构建包含不同下垫面的短期时序数据斜率变化趋势数据集，并将该数据集与深度学习技术相结合。结果表明，Slope-UNet++在多种精度指标上均优于单时相单纯离散通道组合的云检测网络（SegNet、U-Net和UNet++）。Slope-UNet++有效解决不随时间发生变化的亮地表的误检问题，F1分数达96.28%，误检率降低到1.07%。对于半透明薄云和云边界的识别，该方法也得到了较高的精度。但是，对于肉眼尚且无法准确识别的透明薄云和季节性冰雪，Slope-UNet++的识别效果比单时相UNet++的结果要稍差一些，未来考虑对深度模型结构进行改进，在短期时序数据斜率特征的基础上，挖掘更深层的信息，改善对透明薄云和冰雪的识别精度。

参考文献

[1] Andreae M O, Rosenfeld D. Aerosol-cloud-precipitation interactions. Part 1. The nature and sources of cloud-active aerosols[J]. Earth-Science Reviews, 2008, 89(1/2): 13-41.

[2] Li Z Q, Lau W K M, Ramanathan V, et al. Aerosol and monsoon climate interactions over Asia[J]. Reviews of Geophysics, 2016, 54(4): 866-929.

[3] Stephens G. Cloud feedbacks in the climate system: a critical review[J]. Journal of Climate, 2005, 18: 237-273.

[4] Wei J, Huang W, Li Z Q, et al. Cloud detection for Landsat imagery by combining the random forest and superpixels extracted via energy-driven sampling segmentation approaches[J]. Remote Sensing of Environment, 2020, 248: 112005.

[5] Rossow W B, Mosher F, Kinsella E, et al. ISCCP cloud analysis algorithm intercomparison[J]. Advances in Space Research, 1985, 5(6): 185.

[6] Saunders R W, Kriebel K T. An improved method for detecting clear sky and cloudy radiances from AVHRR data[J]. International Journal of Remote Sensing, 1988, 9(1): 123-150.

[7] Ackerman S A, Strabala K I, Menzel W P, et al. Discriminating clear sky from clouds with MODIS[J]. Journal of Geophysical Research: Atmospheres, 1998, 103(D24): 32141-32157.

[8] Zhu Z, Woodcock C E. Object-based cloud and cloud shadow detection in Landsat imagery[J]. Remote Sensing of Environment, 2012, 118: 83-94.

[9] Sun L, Wei J, Wang J, et al. A Universal Dynamic Threshold Cloud Detection Algorithm (UDTCDA) supported by a prior surface reflectance database[J]. Journal of Geophysical Research: Atmospheres, 2016, 121(12): 7172-7196.

[10] 王权, 孙林, 韦晶, 等. 动态阈值云检测算法改进及在高分辨率卫星上的应用[J]. 光学学报, 2018, 38(10): 1028002.

Wang Q, Sun L, Wei J, et al. Improvement of universal dynamic threshold cloud detection algorithm and its application in high resolution satellite[J]. Acta Optica Sinica, 2018, 38(10): 1028002.

[11] ZengX S, YangJ G, DengX P. Cloud segmentation of remote sensing images on Landsat-8 by deep learning[C]∥Proceedings of the 2nd International Conference on Big Data Research, October 27-29, 2018, Weihai, China. New York: ACM Press, 2018: 174-177.

[12] Chen L C, Papandreou G, Kokkinos I, et al. DeepLab: semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected CRFs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(4): 834-848.

[13] ZhaoH S, ShiJ P, QiX J, et al. Pyramid scene parsing network[C]∥2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), July 21-26, 2017, Honolulu, HI, USA. New York: IEEE Press, 2017: 6230-6239.

[14] Wieland M, Li Y, Martinis S. Multi-sensor cloud and cloud shadow segmentation with a convolutional neural network[J]. Remote Sensing of Environment, 2019, 230: 111203.

[15] 王海涛, 王一琛, 王永强, 等. 基于MS-UNet的Landsat影像云检测[J]. 激光与光电子学进展, 2021, 58(14): 1401002.

Wang H T, Wang Y C, Wang Y Q, et al. Cloud detection of landsat image based on MS-UNet[J]. Laser & Optoelectronics Progress, 2021, 58(14): 1401002.

[16] ZhouZ W, SiddiqueeM M R, TajbakhshN, et al. UNet++: a nested U-net architecture for medical image segmentation[M]∥Stoyanov D, Taylor Z, Carneiro G, et al. Deep learning in medical image analysis and multimodal learning for clinical decision support. Lecture notes in computer science. Cham: Springer, 2018, 11045: 3-11.

[17] Chai D F, Newsam S, Zhang H K, et al. Cloud and cloud shadow detection in Landsat imagery based on deep convolutional neural networks[J]. Remote Sensing of Environment, 2019, 225: 307-316.

[18] 彭龙康, 刘励聪, 陈学泓, 等. 遥感影像云检测网络泛化性能研究:以DeepLabv3+为例[J]. 遥感学报, 2021, 25(5): 1169-1186.

Peng L K, Liu L C, Chen X H, et al. Generalization ability of cloud detection network for satellite imagery based on DeepLabv3+[J]. National Remote Sensing Bulletin, 2021, 25(5): 1169-1186.

[19] Jeppesen J H, Jacobsen R H, Inceoglu F, et al. A cloud detection algorithm for satellite imagery based on deep learning[J]. Remote Sensing of Environment, 2019, 229: 247-259.

[20] 袁洲, 郭海涛, 卢俊, 等. 融合UNet++网络和注意力机制的高分辨率遥感影像变化检测算法[J]. 测绘科学技术学报, 2021, 38(2): 155-159.

Yuan Z, Guo H T, Lu J, et al. High-resolution remote sensing image change detection technology based on UNet++ and attention mechanism[J]. Journal of Geomatics Science and Technology, 2021, 38(2): 155-159.

田亚楠, 李云岭, 孙林, 逄淑林, 张平. 基于时序数据回归分析的深度学习云检测[J]. 激光与光电子学进展, 2024, 61(4): 0428013. Yanan Tian, Yunling Li, Lin Sun, Shulin Pang, Ping Zhang. Deep Learning Cloud Detection Based on Regression Analysis of Temporal Data[J]. Laser & Optoelectronics Progress, 2024, 61(4): 0428013.