基于连续小波系数的叶绿素a浓度估测模型 下载: 956次
1 引言
叶绿素a是浮游植物光合作用过程中的关键色素之一,是评价水体质量和富营养化水平的重要参数,其浓度高低决定了浮游植物的生物量[1-2]。二类水体的反射率由吸收系数和后向散射系数决定,悬浮物、黄色物质和浮游植物是其三大主要影响要素[3]。不同的湖泊河流往往差异较大,且具有十分复杂的水体光学特性。相较于耗时长、成本高的传统水质监测方法,高光谱遥感技术能快速、大范围、低成本且无需接触地估测水体中的叶绿素含量,从而成为众多学者建立水质反演模型的重要工具[4-6]。目前,基于实测数据构建原始遥感反射率与叶绿素浓度之间数学统计关系的方法被广泛应用,常用的方法可分为三种:1)根据相关性分析选取实测光谱中相关性较高的波段进行模型的建立,通常选取的是对叶绿素a敏感的反射峰,一般位于690~700 nm。此方法较为常用,在实际应用中,为了降低背景信息带来的干扰,研究人员通常会通过光谱数据转换处理来进一步提高模型精度[7]。但由于实际测量反射率的方式不统一、测量气象条件无法控制、缺乏理论基础支持等原因,该方法在二类水体的实际应用中受到了限制[8]。2)波段比值法,该方法通过相关性高的两波段比值因子扩大叶绿素吸收峰、反射峰之间的差异来模拟叶绿素a浓度[9]。3)三波段生物光学法,这是一种以生物光学理论为基础,通过选择三波段因子来减小水体中其他物质影响的半分析方法[10]。
小波分析凭借局部分析特征、多分辨率分析等优势,被誉为“数学放大镜”,在高光谱信号动态调整中得到了广泛应用[11]。连续小波分析是小波分析中的重要组成部分,自被提出以来就得到了迅速发展,在土壤有机质、农作物叶绿素含量、植物冠层成分反演[12-14]等领域揭示出了较多的光谱吸收特征。Rivard等[15]使用连续小波分析对波谱库进行了混合分析,结果发现,与使用反射率数据相比,使用连续小波分析可以更容易地识别出由样品成分不同而引起的光谱差异。Ampe等[16]基于连续小波分析对光学特性复杂的内陆水体建立了叶绿素含量估测模型,该模型的预测精度超过了传统的蓝绿波段比值法;此外,他们找到了5个小波敏感区间,但他们采用的母小波基函数单一,无法体现连续小波变换的潜力与优势。鉴于此,本文以粤西流域、珠江口近海地区为研究区,将偏最小二乘建模方法与小波系数综合应用于高光谱数据的建模研究,探讨不同小波基函数对反演精度的影响,寻找最佳的小波基函数,为今后利用星载高光谱影像数据反演叶绿素浓度提供建模参考。
2 研究方法
2.1 研究区简介
本文研究区位于广东省,主要包括湛江市、茂名市等粤西地区内陆水域以及珠江口地区伶仃洋海域。粤西地处珠江三角洲与环北部湾地区之间,属热带和亚热带季风气候。研究区总面积32646 km2,占全省面积的18.2%。粵西沿海地区是广东省农业最发达的地区,目前水质受农业污染的影响较大[17]。高州水库和鹤地水库是粤西地区最大的两座大型水库,其中:鹤地水库是广东省5个大型饮用水源地之一,是一个中度富营养化的水体,其最大库容量为1.187×109 m3,有效库容为7.670×108 m3,水库集雨面积为1496 km2;高州水库位于茂名市高州市境内,是鉴江流域主要的水源地。漠阳江、鉴江、九洲江是粤西地区主要的三条河流,集雨面积均大于1000 km2。本研究小组于2019年10月11日至20日进行野外实验,实测水体反射率。采样点分布在鉴江、九洲江、漠阳江、鹤地水库、高州水库;共获取47个站点的实测数据,其中包括32条光谱曲线。此外,本研究还加入了2006年12月21日、2007年12月27日、2011年10月21日珠江口沿海地区地面实测高光谱数据(37个采样点)。本研究的采样点共计69个。
选择无风、少云的天气,采用ASD FieldSpec3 (350~2500 nm)地物光谱辐射仪对水体光谱数据进行采集。使用的采集方式为唐军武等[18]提出的内陆水体水面以上测量法。基于水体的反射特性,测定的光谱范围限定在可信度高的400~900 nm之间,每个样本采集10条光谱,然后使用ASD View Spec Pro软件剔除异常光谱,之后取其均值。对于混浊的水体,为了减小太阳随机反射的影响,进
行多次测量并剔除异常曲线。采集水体光谱的同时,同步采集水体表层水样。
水体叶绿素a浓度的测定方法为热乙醇萃取分光光度法[19]。
2.2 连续小波分析
小波分析作为一种线性变换方法,能通过对原始信号进行母小波基(mother wavelet)的平移和缩放获得信号的时间信息和频率特征。小波分析可以描述为
式中:ψa,b为经过尺度因子a、伸缩因子b变换的小波基函数;λ为光谱波段;f(λ)为原始反射率光谱;Wf(a,b)为小波系数。
将原始反射率光谱信号和小波基函数ψa,b(λ)在整个区间相乘累加,最终得到二维矩阵小波系数Wf(a,b),它包含有尺度与波段信息。将不同的小波基函数变换得到的小波系数和实测叶绿素浓度数据进行相关性分析,提取相关性最高的小波系数进行偏最小二乘建模。本研究在连续小波变换过程中选取了10种不同的母小波基(如
表 1. 连续小波变换的10个选定母小波基及其应用领域
Table 1. Ten selected mother wavelet bases of continuous wavelet transform and their application fields
|
2.3 偏最小二乘回归模型
偏最小二乘回归模型(PLSR)具有有效降低自变量冗余(共线性)和允许样本点数量小于自变量数量等优点,在高光谱遥感定量反演中得到了广泛应用[25-26]。作为一种多变量回归分析方法,PLSR不直接建立自变量和因变量之间的关系,而是从自变量数据集合(x1,…,xp)以及因变量数据集合(y1,…,yp)中分别提出多个主成分,并将它们组成主成分集合(t1,…,tm;u1,…,um;…),这些主成分能携带各自数据集合中的绝大部分信息,且与各自的数据集合有着极大的相关度;经过不断的迭代,最终完成(y1,…,yp)与(t1,…,tm)的回归建模。由于主成分集合是由(x1,…,xp)线性组合得来的,所以建模结果可以表达成任意y与(x1,…,xp)之间的回归方程。
2.4 验证指标
本研究使用决定系数R2(包含训练决定系数和建模决定系数,分别记为
式中:yi为叶绿素a浓度的实测值;
连续小波变换处理和PLSR建模都在MATLAB R2018b中编程实现,三维图由Origin 2020绘制而成。
3 实验及结果分析
3.1 叶绿素a浓度的统计分析
使用MATLAB中的randperm函数将实测的69个水样和光谱数据随机分成训练数据集(48个样本)和验证数据集(21个样本),其中训练数据集用于模型训练,验证数据集用于模型验证。采样点叶绿素a浓度的统计详情如
表 2. 采样点叶绿素a浓度的统计特征
Table 2. Statistical characteristic of chlorophyll-a concentration at sampling points
|
图 2. 不同数据集中叶绿素a浓度的统计特征
Fig. 2. Statistical characteristics of chlorophyll-a in different datasets
3.2 水体叶绿素a的反射率特征
水体中的光学活性物质对光的反射、吸收、散射特性决定了不同叶绿素a浓度的水体有着不同的反射率特征;因此,通过分析水体的光谱反射特征可以找出叶绿素a浓度与水体遥感反射率Rrs(λ)之间的定量关系,用于叶绿素a浓度与遥感反射率的回归分析。二类水体因为复杂的组成,光谱特征通常具有极大的复杂性,不同季节、不同水体的光学特征往往不同。采样点的光谱与叶绿素a浓度的相关系数(r)通过MATLAB程序计算得到,如
图 3. 水体反射率曲线及其单波段相关性分析
Fig. 3. Analysis of water reflectance curve and its single-band correlation
3.3 叶绿素a浓度与常见反射率处理结果的相关性分析
单波段光谱的相关系数普遍偏小。波段比值指数(RSI)法也是常用的经验公式法,该方法可以部分消除水表面环境因素带来的干扰,且能降低其他非目标物质的影响,在一定程度上可以有效提高水质要素的反演精度。
图 4. RSI和NDCI相关系数矩阵图。(a) RSI;(b) NDCI
Fig. 4. Diagram of RSI and NDCI correlation coefficient matrix. (a) RSI; (b) NDCI
此外,本文还测试了基于半分析方法的三波段法,该方法能减小水体中悬浮物和黄色物质带来的影响[10]。具体的波段组合方式通过穷举法查找相关性系数的最大值来实现。本文采用上述三种方法以及3.2节的单波段法进行建模,具体的建模变量选择以及建模精度如
表 3. 叶绿素a浓度的常见反演模型及其建模精度
Table 3. Common chlorophyll-a concentration inversion models and their modeling accuracy
|
3.4 基于CWT-PLSR的叶绿素建模
选取10个不同的小波基函数对样本点的反射率曲线进行连续小波变换(CWT),然后将得到的小波系数与叶绿素a浓度进行相关性分析。
图 5. db4小波系数与叶绿素a浓度的相关系数图
Fig. 5. Correlation coefficient diagram of db4 wavelet coefficient and chlorophyll-a concentration
依据上述分析,在经过连续小波变换后的小波系数中选取相关性最高的10个小波系数为自变量,叶绿素a浓度为因变量,使用偏最小二乘法(PLSR)构建反演模型。在实际的回归建模中,须确定最佳主成分数。本研究采用留一交叉验证法,通过回归残差平方和(PRESS)来确定最佳主成分数(PC),PRESS越小,说明模型的预测能力越强。确定最佳主成分数之后,对小波系数建立偏最小二乘回归模型,结果见
表 4. CWT-PLSR模型的精度评价
Table 4. Accuracy evaluation of CWT-PLSR model
|
在基于10个小波基的不同模型中,基于sym6的PLSR模型的估测精度最高(R2为0.732,RMSE为6.457 μg/L,RPD为2.600),相较于传统的三波段半分析方法,R2提高了0.052,RMSE降低了2.797 μg/L。不同小波变换系数的PLSR模型表现各不相同,除了sym6、morl小波基函数的RPD大于2外,其他都小于2,而且db1的表现最差,其RPD为1.142,模型估测性能较差,且预测集精度远低于训练集精度,呈明显的过拟合特征。这主要可能是因为该小波基不适合用于二类水体中叶绿素的反演。在农业领域应用广泛的mexh小波基函数因为其本身的形状与植被吸收特征相近而引起了研究人员的关注,但其在本次研究中表现一般。
为了更加直观地展示基于sym6小波基函数的预测模型,本文对估测值与实测值进行1∶1线分析,结果如
图 6. 基于sym6小波变换估测的叶绿素a浓度与实测值
Fig. 6. Predicted chlorophyll-a concentration based on sym6 wavelet transform and measured value
4 结论
本文基于多个典型二类水体中共69个采样点的水质监测数据和ASD光谱数据,使用10个常用小波基函数对反射率进行小波变换,进而将其与叶绿素a浓度进行模拟,并将结果与传统方法的结果进行比较。研究结果表明:连续小波变换是一种能有效提高相关性的光谱处理方法;基于sym6小波基函数变换的定量反演模型表现最优(R2=0.732,RMSE为6.457 μg/L,RPD为2.600),相较于常规三波段反演方法显著提高了反演精度(R2提高了0.052,RMSE降低了2.797 μg/L)。该方法可以有效提取高光谱信号中叶绿素的隐藏信息,适合用于地面高光谱数据中叶绿素a的浓度估测。
[1] 王明翠, 刘雪芹, 张建辉, 等. 湖泊富营养化评价方法及分级标准[J]. 中国环境监测, 2002, 18(5): 47-49.
Wang M C, Liu X Q, Zhang J H, et al. Evaluate method and classification standard on lake eutrophication[J]. Environmental Monitoring in China, 2002, 18(5): 47-49.
[2] 秦伯强. 长江中下游浅水湖泊富营养化发生机制与控制途径初探[J]. 湖泊科学, 2002, 14(3): 193-202.
Qin B Q. Approaches to mechanisms and control of eutrophication of shallow lakes in the middle and lower reaches of the Yangze River[J]. Journal of Lake Science, 2002, 14(3): 193-202.
[3] 杨锦坤, 陈楚群. 珠江口二类水体水色三要素的优化反演[J]. 热带海洋学报, 2007, 26(5): 15-20.
Yang J K, Chen C Q. An optimal algorithm for retrieval of chlorophyll, suspended sediments and gelbstoff of caseⅡ waters in Zhujiang River estuary[J]. Journal of Tropical Oceanography, 2007, 26(5): 15-20.
[4] Göritz A, Berger S, Gege P, et al. Retrieval of water constituents from hyperspectral in situ measurements under variable cloud cover: a case study at lake stechlin (Germany)[J]. Remote Sensing, 2018, 10(2): 181.
[5] Beck R, Zhan S G, Liu H X, et al. Comparison of satellite reflectance algorithms for estimating chlorophyll-a in a temperate reservoir using coincident hyperspectral aircraft imagery and dense coincident surface observations[J]. Remote Sensing of Environment, 2016, 178: 15-30.
[6] Keller S, Maier P, Riese F, et al. Hyperspectral data and machine learning for estimating CDOM, chlorophyll a, diatoms, green algae and turbidity[J]. International Journal of Environmental Research and Public Health, 2018, 15(9): 1881.
[7] 张棋斐, 吴志峰, 解学通, 等. 河口及近岸海域水体叶绿素浓度反演方法综述[J]. 生态科学, 2017, 36(5): 215-222.
Zhang Q F, Wu Z F, Xie X T, et al. Research progress of the inversion algorithm of chlorophyll-a concentration in estuaries and coastal waters[J]. Ecological Science, 2017, 36(5): 215-222.
[8] 高玉蓉, 刘明亮, 吴志旭, 等. 应用实测光谱估算千岛湖夏季叶绿素a浓度[J]. 湖泊科学, 2012, 24(4): 553-561.
Gao Y R, Liu M L, Wu Z X, et al. Chlorophyll-a concentration estimation with field spectra of summer water-body in Lake Qiandao[J]. Journal of Lake Sciences, 2012, 24(4): 553-561.
[9] O'Reilly J E, Maritorena S, Mitchell B G, et al. Ocean color chlorophyll algorithms for SeaWiFS[J]. Journal of Geophysical Research: Oceans, 1998, 103(C11): 24937-24953.
[10] 谢婷婷, 陈芸芝, 卢文芳, 等. 基于三波段生物光学模型反演闽江下游叶绿素a[J]. 激光与光电子学进展, 2020, 57(7): 071701.
[11] Labat D. Recent advances in wavelet analyses:part 1. A review of concepts[J]. Journal of Hydrology, 2005, 314(1/2/3/4): 275-288.
[12] 叶红云, 熊黑钢, 张芳, 等. 基于CWT的人类不同程度干扰下干旱区土壤有机质含量估算研究[J]. 激光与光电子学进展, 2019, 56(5): 051101.
[13] Gu X H, Wang Y C, Sun Q, et al. Hyperspectral inversion of soil organic matter content in cultivated land based on wavelet transform[J]. Computers and Electronics in Agriculture, 2019, 167: 105053.
[14] Yao X, Si H Y, Cheng T, et al. Hyperspectral estimation of canopy leaf biomass phenotype per ground area using a continuous wavelet analysis in wheat[J]. Frontiers in Plant Science, 2018, 9: 1360.
[15] Rivard B, Feng J, Gallie A, et al. Continuous wavelets for the improved use of spectral libraries and hyperspectral data[J]. Remote Sensing of Environment, 2008, 112(6): 2850-2862.
[16] Ampe E M, Hestir E L, Bresciani M, et al. A wavelet approach for estimating chlorophyll-a from inland waters with reflectance spectroscopy[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 11(1): 89-93.
[17] 朱忆秋. 广东省典型水库枯水期营养状态与浮游植物群落结构特征的研究[D]. 广州: 暨南大学, 2018: 3- 4.
Zhu YQ. Trophic status and phytoplankton assemblages of typical reservoirs in Guangdong Province in a dry season[D]. Guangzhou: Jinan University, 2018: 3- 4.
[18] 唐军武, 田国良, 汪小勇, 等. 水体光谱测量与分析Ⅰ: 水面以上测量法[J]. 遥感学报, 2004, 8(1): 37-44.
Tang J W, Tian G L, Wang X Y, et al. The methods of water spectra measurement and analysis Ⅰ: above-water method[J]. Journal of Remote Sensing, 2004, 8(1): 37-44.
[19] 陈宇炜, 高锡云. 浮游植物叶绿素a含量测定方法的比较测定[J]. 湖泊科学, 2000, 12(2): 185-188.
Chen Y W, Gao X Y. Comparison of two methods for phytoplankton chlorophyll-a concentration measurement[J]. Journal of Lake Science, 2000, 12(2): 185-188.
[20] Wang Z L, Chen J X, Fan Y F, et al. Evaluating photosynthetic pigment contents of maize using UVE-PLS based on continuous wavelet transform[J]. Computers and Electronics in Agriculture, 2020, 169: 105160.
[21] He R Y, Li H, Qiao X J, et al. Using wavelet analysis of hyperspectral remote-sensing data to estimate canopy chlorophyll content of winter wheat under stripe rust stress[J]. International Journal of Remote Sensing, 2018, 39(12): 4059-4076.
[22] 余哲修, 张超, 黄田, 等. 剑湖湿地中菰的叶绿素含量高光谱估算模型研究[J]. 湿地科学, 2018, 16(6): 742-748.
Yu Z X, Zhang C, Huang T, et al. Hyperspectral estimation model for chlorophyll content of Zizania Caduciflora in Jianhu wetlands[J]. Wetland Science, 2018, 16(6): 742-748.
[23] 方圣辉, 乐源, 梁琦, 等. 基于连续小波分析的混合植被叶绿素反演[J]. 武汉大学学报·信息科学版, 2015, 40(3): 296-302.
Fang S H, Le Y, Liang Q, et al. Retrieval of chlorophyll content using continuous wavelet analysis across a range of vegetation species[J]. Geomatics and Information Science of Wuhan University, 2015, 40(3): 296-302.
[24] Liu H J, Li M Z, Zhang J Y, et al. Estimation of chlorophyll content in maize canopy using wavelet denoising and SVR method[J]. International Journal of Agricultural and Biological Engineering, 2018, 11(6): 132-137.
[25] 金秀, 朱先志, 李绍稳, 等. 基于梯度提升树的土壤速效磷高光谱回归预测方法[J]. 激光与光电子学进展, 2019, 56(13): 131102.
[26] Wang Z M, Kawamura K, Sakuno Y, et al. Retrieval of chlorophyll-a and total suspended solids using iterative stepwise elimination partial least squares (ISE-PLS) regression based on field hyperspectral measurements in irrigation ponds in Higashihiroshima, Japan[J]. Remote Sensing, 2017, 9(3): 264.
[27] Song K S, Li L, Tedesco L P, et al. Remote estimation of chlorophyll-a in turbid inland waters: three-band model versus GA-PLS model[J]. Remote Sensing of Environment, 2013, 136: 342-357.
[28] 安如, 刘影影, 曲春梅, 等. NDCI法Ⅱ类水体叶绿素a浓度高光谱遥感数据估算[J]. 湖泊科学, 2013, 25(3): 437-444.
An R, Liu Y Y, Qu C M, et al. Estimation of chlorophyll-a concentration of caseⅡ waters from hyperspectral remote sensing data in NDCI method[J]. Journal of Lake Sciences, 2013, 25(3): 437-444.
Article Outline
彭咏石, 陈水森, 陈金月, 赵晶, 王重洋, 官云兰. 基于连续小波系数的叶绿素a浓度估测模型[J]. 激光与光电子学进展, 2021, 58(8): 0828002. Yongshi Peng, Shuisen Chen, Jinyue Chen, Jing Zhao, Chongyang Wang, Yunlan Guan. Estimation Model of Chlorophyll-a Concentration Based on Continuous Wavelet Coefficient[J]. Laser & Optoelectronics Progress, 2021, 58(8): 0828002.