PROSPECT模型的特征波长优化与作物叶绿素含量检测
1 引言
叶绿素进行光合作用对作物的生长至关重要。 快速检测玉米冠层叶片叶绿素含量对评价其长势与田间水肥管理决策具有现实意义[1]。 相比于传统的破坏式采样与实验室叶绿素测定的方法, 光谱分析技术因其无损和高效的优点, 已经在作物叶绿素、 水分、 氮素等含量的检测中得到了广泛的应用[2,3,4]。
围绕玉米叶绿素含量检测相关研究发现, 叶绿素a的吸收峰位于435, 670~680和740 nm, 叶绿素b的吸收峰位于480和650 nm[5]。 根据叶绿素的光谱吸收特性, 古东东等[6]利用640, 660和910 nm三个波长漫反射技术设计了实验装置, 并选取了3种玉米品种构建回归模型。 Qi等[7]通过在可见光与近红外波段构建NDSI(R-520, R-528), RSI(R-748, R-561), DSI(R-758, R-602)和SASI (R-753, R-624)植被指数, 构建了高精度花生叶片叶绿素含量反演模型。 董哲等[8]使用550, 705, 710, 750和760 nm的波长构建植被指数, 建立玉米叶片叶绿素含量指标(SPAD值)估算模型得到了较好的结果。 上述研究表明特征波长是建立高精度叶绿素含量光谱学诊断模型的基础。 然而Li等[9]研究指出在不同空间尺度、 种植密度、 生育阶段和含水量等因素的影响下, 玉米冠层结构变化会影响反射光谱响应特性, 限制基于冠层光谱特征变量构建的检测模型在田间应用的鲁棒性和普适性。
基于叶片内部辐射传输机制的PROSPECT模型可以模拟不同生化含量和叶肉结构叶片光谱, 一方面它可以提供大量的数据集, 提高建模的鲁棒性; 另一方面, 模型输入参数可控, 降低了反射光谱的干扰因素, 被用于叶片结构参数和叶绿素等色素体的光谱学反演[10]。 雷祥祥等[11]利用PROSPECT模型拟合了三种叶片的反射率光谱, 进而反演了叶片的叶绿素含量和SPAD值。 针对田间采集的作物光谱样本集小导致的叶绿素诊断模型精度不高的问题, 吕杰等[12]通过PROSPECT模型模拟玉米光谱和所对应的叶绿素含量建立训练数据集, 建立基于支持向量机的估测模型, 经实测数据集验证, 叶绿素含量实测值与叶绿素含量估测值高度相关(R2=0.871)。 Verrelst等[13]以PROSPECT+SAIL模型为基础, 基于主动学习算法构建了叶绿素和LAI反演模型, 模型决定系数均在0.9以上。 尽管这些研究表明了基于PROSPECT模型反演田间作物叶绿素含量的可行性, 但是PROSPECT基于“平板假设”而提出, 它简化了实际田间土壤背景与植株结构对冠层叶片光谱的影响因素和剔除过程。 利用PROSPECT模拟反射光谱并用于大田玉米冠层叶片叶绿素含量检测时, 是否可以通过特征波长寻优进一步提高其检测精度和应用普适性值得深入讨论和验证。 因此, 本研究利用PROSPECT模型在多变量因素下构建叶片反射率光谱, 基于敏感性分析, 筛选并对比叶绿素含量的敏感响应特征波长, 通过两年期数据构建叶绿素含量PLS检测模型, 以验证光谱筛选的特征在叶绿素含量检测中的普适性。 通过叶绿素含量检测模型绘制田间叶绿素动态分布图, 以期为田间精细化施肥提供指导依据。
1 实验部分
1.1 田间光谱数据采集与生化参数测定
实验分别于2019年8月及2020年8月在河北省衡水市旱作所实验基地进行, 试验田大小为30 m×40 m, 分72个样区, 分为六种施肥等级, 施肥量分别为: A1: N-0 kg·ha-1, P-0 kg·ha-1; A2: N-90 kg·ha-1, P-60 kg·ha-1; A3: N-180 kg·ha-1, P-120 kg·ha-1; A4: N-360 kg·ha-1, P-240 kg·ha-1; A5: N-540 kg·ha-1, P-360 kg·ha-1; A6: N-720 kg·ha-1, P-480 kg·ha-1。 每个小区中心点采样, 2019年和2020年各获取72个样本数据。 田间玉米叶片反射率测量采用ASD公司的FieldSpec HandHeld 便携式地物光谱仪, 光谱范围为325~1 075 nm, 分辨率<3.0 nm。 同时采集对应的叶片, 密封带回实验室, 利用紫外分光光度法测定叶片叶绿素和胡萝卜素含量。 叶绿素含量真值用于建立检测模型, 胡萝卜素含量真值作为PROSPECT模型的输入参数以输出理论光谱曲线。
化学测定中, 去除玉米叶片主茎, 剪碎、 混匀并称取0.4 g, 用浓度为95%的乙醇溶液40 mL浸泡至完全褪绿, 浸泡过程中摇晃2~3次, 加速色素的提取。 用分光光度计测量玉米叶片萃取液470, 649和665 nm三个波段的吸光度值。 利用式(1)—式(4)计算玉米叶片叶绿素含量及胡萝卜素含量
(1)
(2)
(3)
(4)
其中, A470, A649和A665分别是玉米叶片萃取液在470, 645和663nm处的吸光度值, ca为叶绿素a的含量, cb为叶绿素b的含量, cab为叶绿素总量, car为胡萝卜素含量。
1.2 光谱数据模拟
1.2.1 基于PROSPECT模型的反射光谱模拟
PROSPECT模型根据输入叶片生化参数(叶绿素cab、 胡萝卜素car、 花青素canth、 棕色素cbrown、 等效水含量cw和干物质含量cm)和结构参数(N)模拟叶片定向半球反射率和透射率。 本工作应用改进的PROSPECT-D模型[14]模拟玉米叶片在不同生化参数和结构参数下400~2 500 nm的理想反射率曲线。 PROSPECT-D模型对每种颜料的特定吸收系数进行校准外, 添加了花青素含量参数(canth)。 进行光谱反射率模拟时的参数取值范围如表1所示, 根据不同参数对光谱反射率影响的大小不同, 设置相应步长取值, 模拟不同输入参数下的反射率曲线。
表 1. PROSPECT模型输入参数
Table 1. Input parameters of PROSPECT model
|
1.2.2 PROSPECT模型叶绿素敏感度分析
研究通过敏感性分析确定反射光谱中对叶绿素含量变化响应强烈的波段区间。 基于PROSPECT模型的敏感度计算公式为
(5)
式(5)中, i为PROSPECT模型输入参数叶绿素含量, Ri为叶绿素含量为i时的光谱反射率。 使用PROSPECT模型进行叶绿素含量敏感度分析时, 叶绿素含量参数取值区间为10~100 μg·cm-2, 其他参数根据经验取模型的输入初始值[10]。
1.3 光谱预处理
分别对大田采集的冠层叶片光谱和PROSPECT模型输出的反射光谱进行预处理。 针对大田环境, 由于玉米冠层叶片表面不均匀导致的反射光程不同、 光散射等原因产生的光谱噪声, 使用小波分解去噪的方式消除。 首先, 对光谱数据进行小波分解, 选择DB4小波基函数进行5层分解。 分解后, 仅保留第五层低频小波系数进行重构, 得到去噪后的光谱反射率曲线。 然后, 分别对小波去噪后的实测反射率曲线和PROSPECT模型输出的反射率曲线采用标准正态变量(standard normal variate, SNV)方法进行预处理, 消减散射效应引入的噪声。
1.4 叶绿素含量敏感特征波长筛选
叶绿素含量检测的特征波长是建立检测模型的基础。 以1.2.2节所确定的PROSPECT模型叶绿素敏感响应区域为基础, 筛选用于叶绿素含量检测的特征波长, 包括: 基于敏感度选择、 基于反向区间偏最小二乘法(backward interval PLS, Bi-PLS)和基于连续投影算法(successive projections algorithm, SPA)的三种方法。 其中, Bi-PLS将全波段均匀的分成N个区间, 循环判别均方根误差(root mean square error, RMSE)结果并减少区间数量, 当均方根误差RMSE最小时所剩余的区间, 为与叶绿素含量敏感且建模误差最小的特征区间。 SPA是一种使矢量空间共线性最小化的前向变量选择算法, 其优势在于提取全波段的几个特征波长, 能够消除原始光谱矩阵中冗余的信息, 用于确定具体的特征波长位置。
1.5 样本集划分与检测模型构建
使用排序法划分建模集和验证集, 建模集与验证集样本数量比例为2:1。 基于PROSPECT模型筛选的特征区间与特征波长, 使用偏最小二乘回归(partial least squares regression, PLSR)在真实数据集中构建叶绿素含量检测模型, 并用决定系数R2和均方根误差RMSE评价模型效果。 以上PROSPECT模型、 光谱预处理、 特征筛选与建模的算法均基于MATLAB2020软件编程实现。
2 结果与讨论
2.1 PROSPECT模型叶绿素敏感度分析及光谱反射率模拟
在10~100 μg·cm-2参数取值区间进行叶绿素含量敏感度分析。 在400~2 500 nm区域内, 当叶绿素含量发生变化而其他参数保持不变时, 结果如图1(a)所示, 400~780 nm区间的光谱反射率强度随着叶绿素含量的增加而降低; 在780~2 500 nm区间, 光谱反射率与叶绿素变化响应无关。 其中, 400~780 nm是PROSPECT模型叶绿素响应的敏感区域, 且存在两个高敏感区间, 如图1(b)所示分别为以570 nm为中心的绿-黄光区域和以700 nm为中心的红光区域。 敏感性分析结果说明在其他参数不变的情况下, 叶绿素含量变化敏感的波长位于400~780 nm范围。
图 1. PROSPECT模型叶绿素敏感性分析
(a): 不同叶绿素含量反射率曲线; (b): 叶绿素含量敏感性分析结果
Fig. 1. Sensitivity analysis of chlorophyll content using PROSPECT model
(a): Reflectivity curves for different chlorophyll contents; (b): Sensitivity analysis of chlorophyll content
田间样本实测胡萝卜素含量最大值为4.94 μg·cm-2, 最小值为3.6 μg·cm-2, 标准差为0.175 μg·cm-2, 研究中取胡萝卜素含量平均值4.37 μg·cm-2作为PROSPECT模型的输入参数。 结合叶绿素敏感性分析结果, 依照表1确定取值范围, 共模拟出10 650条不同输入参数下的光谱反射率曲线。
2.2 田间实测光谱反射率预处理
田间实测2019年和2020年玉米植株冠层叶片原始反射光谱如图2(a, b)所示, 观察可知光谱曲线存在严重的噪声信息。 经过小波分解重构处理后光谱曲线的噪声点明显消减, 如图2(c, d)所示; 但是样本间反射光谱存在严重的散射效应, 经过SNV校正后光谱曲线的离散性显著较小, 如图2(e, f)所示。
图 2. 实测光谱反射率曲线
(a): 2019年实测光谱曲线; (b): 2020年实测光谱曲线; (c): 小波去噪后的2019年光谱曲线;(d): 小波去噪后的2020年光谱曲线; (e): SNV处理后的2019年光谱曲线; (f): SNV处理后的2020年光谱曲线
Fig. 2. The measured reflectivity spectra
(a): Measured in 2019; (b): Measured in 2020; (c): Wavelet denoised spectra in 2019;(d): Wavelet denoised spectra in 2020; (e): SNV processed spectra in 2019; (f): SNV processed spectra in 2020
小波分解平滑结合SNV校正后的2019年和2020年玉米冠层叶片光谱曲线如图2(e, f)所示, 总体而言, 在可见光波段, 由于叶片色素对蓝、 红光的强吸收, 400~500与611~710 nm存在低反射率区, 并在400和680 nm附近出现吸收谷。 由于叶片色素对绿光的强反射, 520~610 nm为高反射区, 并在550 nm附近出现反射峰。 近红外区域, 由于叶肉的海绵组织结构内有很大的反射表面空腔, 所以711~760 nm反射率陡增, 呈现“快速攀升”趋势; 在761~1 000 nm为强反射区, 曲线呈现“高反射平台”, 并由于水分的吸收在970 nm附近出现微弱的吸收谷。
2.3 基于PROSPECT模型的叶绿素含量检测特征波长筛选
ROSPECT模型在400~780 nm区间, 分别应用叶绿素敏感性分析、 Bi-PLS和SPA方法筛选叶绿素特征波长。 首先, 以叶绿素含量敏感性1.5为阈值, 如图3(a)所示, 筛选出548~610和694~706 nm两个波段共计76个波长记为SEN-BAND。 其次, 基于Bi-PLS以RMSE作为评价指标筛选叶绿素含量敏感波段, RMSE最小时得到5个敏感波段, 如图3(b)所示分别是514~532, 533~551, 590~608, 647~665和723~741 nm, 记作BP-BAND。 再者, 基于SPA算法, 在400~780 nm区间筛选出10个作为叶绿素含量敏感波长(记为SPA-BAND), 如图3(a)中红色圈所示。 统计三种特长波长的筛选结果如表2所示。
图 3. 特征波段筛选结果
(a): SEN-BAND, SPA-BAND; (b): BP-BAND
Fig. 3. Sensitive band filtering results
(a): SEN-BAND, SPA-BAND; (b): BP-BAND
表 2. 特征波段分布统计
Table 2. Statistics of sensitive band distribution
|
2.4 实测数据建模及验证结果
基于筛选的SEN-BAND, BP-BAND, SPA-BAND, 分别使用2019年和2020年的田间实测数据, 建立PLSR回归模型, 建模及验证结果如表3所示。 2019年数据集中, 使用SPA-BAND构建的PLS模型效果最好, 建模集决定系数 为0.815 6, RMSEC为2.908 6; 验证集决定系数 为0.799 5, RMSEV为2.997 7。 2020年数据集中, 使用BP-BAND构建的PLS模型建模集效果最好, 但是验证集精度较SPA-BAND构建的模型有较大差距, 综合建模集与验证集的效果来看, 基于SPA-BAND构建的PLS模型总体效果最佳, 建模集和验证集均表现出较高的精度, 且建模集决定系数与验证集决定系数较为接近, 体现出模型较好的稳定性。 2020年数据集SPA-BAND构建的模型建模集决定系数 为0.949 2, RMSEC为0.976 8; 验证集决定系数 为0.910 2, RMSEV为1.562 9。
表 3. 叶绿素含量PLS检测模型结果统计
Table 3. Detection results of PLS model of the chlorophyll content
|
比较三种变量筛选方法可知, 基于敏感性分析筛选的SEN-BAND波段体现了基于理论机理的叶绿素含量变化对反射率的影响波段, 基于Bi-PLS算法筛选的BP-BAND波段体现了基于统计特征的叶绿素含量反演特征波段。 但是, 两种方式筛选出的相邻波长数量过多, 特征波段之间存在多重共线性, 易导致建模回归的显著性降低[15]。 同时, 过多的特征数量也容易导致模型的过拟合, 影响模型的精度。 从模型结果也可以看出, 使用SEN-BAND和BP-BAND构建的模型, 建模集决定系数和验证集决定系数之间的差值相比于使用SPA-BAND构建的模型较大。 与之相对, SPA算法筛选出的特征波长离散性较好, 不仅涵盖了敏感性分析和统计分析筛选的特征波段区间, 也涵盖了400和500 nm的蓝光区域和680 nm附近的“红谷”区域。 其中400~520 nm的蓝光区域叶绿素与类胡萝卜素吸收比例最大, 对光合作用影响最大, 而680 nm附近的“红谷”区域也是叶绿素的强吸收区域, 因此SPA算法筛选的特征波长包含了更多叶绿素含量的关键信息, 提高了模型的检测精度。 综上所述, 基于PROSPECT模型筛选出的SPA-BAND特征波长, 在不同年份的实测数据集中均得到较为理想的检测结果, 具有普适性。 基于SPA-BAND特征波长的2019年和2020年建模及验证结果如图4所示。
图 4. 基于SPA-BAND敏感波长的2019年及2020年建模和验证结果
(a): 2019年建模和验证结果; (b): 2020年建模和验证结果
Fig. 4. Modeling and verification results with SPA-BAND sensitive bands in 2019 and 2020
(a): In 2019; (b): In 2020
2.5 田间叶绿素动态分布
针对如图5(a)所示的3列24行共72个样区, 根据SPA-BAND建立2019年和2020年叶绿素含量检测模型, 并绘制田间叶绿素动态分布图分别如图5(b)和(c)所示。 两年的叶绿素分布显示中间列及右侧列的上部和下部小区, 玉米叶绿素均存在含量较低现象, 证明该区域玉米长势较差, 有待进行施肥管理。 由此说明通过该叶绿素检测模型, 可以有效掌握田间叶绿素分布情况, 对指导田间水肥精细化管理, 具有现实意义。
图 5. 基于PLSR模型的田间叶绿素动态分布结果
(a): 田间施肥等级分布; (b): 2019年田间叶绿素分布; (c)2020年田间叶绿素分布
Fig. 5. Dynamic chlorophyll distribution results based on PLSR model
(a): Field fertilization distribution; (b): Detected distribution in 2019; (c): Detected distribution in 2020
3 结论
使用PROSPECT模型进行了叶绿素含量对光谱反射率曲线的敏感性分析, 并模拟了不同输入参数下的反射率曲线, 基于敏感性分析、 SPA及Bi-PLS三种方法分别筛选特征波长, 应用2019年及2020年田间实测数据建立了玉米叶绿素含量检测模型并进行了验证。 主要结论如下:
通过PROSPECT模型敏感性分析可知, 叶绿素含量变化对光谱反射率曲线的影响, 主要集中在400~780 nm以内的可见光区域, 对于780 nm以后的红外光区域, 在没有其他因素影响的情况下, 叶绿素含量的变化不会对光谱反射率造成影响。
对比三种变量筛选方法, 基于SPA算法筛选叶绿素含量检测敏感波长在两年期的实测数据集中具有良好的表现, 其中2019年数据建模集决定系数( )为0.815 6, 建模集均方根误差RMSEC为2.908 6, 验证集决定系数( )为0.799 5, 验证集均方根误差RMSEV为2.997 7; 2020年数据建模集决定系数( )为0.949 2, 建模集均方根误差RMSEC为0.976 8,验证集决定系数( )为0.910 2, 验证集均方根误差RMSEV为1.562 9。
通过绘制田间叶绿素分布图, 可分析田间施肥与作物营养差异, 对田间精细化管理具有指导意义。
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
Article Outline
张俊逸, 高德华, 宋迪, 乔浪, 孙红, 李民赞, 李莉. PROSPECT模型的特征波长优化与作物叶绿素含量检测[J]. 光谱学与光谱分析, 2022, 42(5): 1514. Jun-yi ZHANG, De-hua GAO, Di SONG, Lang QIAO, Hong SUN, Min-zan LI, Li LI. Wavelengths Optimization and Chlorophyll Content Detection Based on PROSPECT Model[J]. Spectroscopy and Spectral Analysis, 2022, 42(5): 1514.