基于分窗Gram-Schmidt变换和PSO-SVR算法的水稻纹枯病病情指数检测
1 引言
纹枯病是水稻受立枯丝核菌的侵染而造成的一种病害, 主要为害叶鞘, 叶片次之, 感染纹枯病会使水稻的谷粒不饱满, 严重的会造成谷粒空壳和植株倒伏枯死, 继而导致水稻的质量与品质的下降。 及时并准确的对水稻纹枯病进行检测和程度分级, 对于水稻的田间管理、 水稻病害防治和保证产量质量具有重要意义。 目前检测植物病害依靠有经验人员人为目测和室内基因分子生物学检测这两种方法, 常会造成人为误判、 检测效率低和成本昂贵, 因此采用光谱分析的方法可以解决传统方法的不足之处, 其检测速度较快, 并适用于大范围样本, 是检测植物病害的有效方法[1]。 Azadbakht等[2]研究了不同LAI水平下, 实现在冠层尺度上基于高光谱的小麦叶锈病严重程度的检测, Pourreza等[3]利用587~589 nm波长作为识别波段, 训练支持向量机分类器, 研制了一种用于柑桔黑斑病诊断的单色视觉传感器, 检测准确率在93.3%~94.6%之间。 以上研究证明了光谱分析在植物病害方面有较好的检测结果。
近年来, 针对水稻纹枯病检测越来越多, Faranak等[4]使用卫星SPOT-5图像检测水稻纹枯病, 植被指数RVI14, SDI14和SDI24可以很好的从患病植物中检测出健康植物, 但卫星遥感的分辨率低, 只能实现有无病害感染的区分。 除上述研究之外, 无人机遥感技术更加适合水稻纹枯病的检测, Zhang等[5]验证了无人机多光谱图像提取的NDVI与地面测量的NDVI之间具有很强的相关性R2为0.907, 并且多光谱图像提取的NDVI可以量化纹枯病感染程度, 准确度为63%。 赵晓阳等[6]证明了基于可见光与多光谱传感器的低空无人机遥感平台进行水稻纹枯病病害等级评估是可行的, 并且得出结论窄波段传感器在病害监测方面较宽波段消费级传感器更有优势, 因此本研究采用比多光谱波段更窄的高光谱进行研究。
本研究利用光谱技术进行水稻纹枯病的病情指数估测, 探讨地面冠层和低空冠层所采集的高光谱, 采用不同的光谱变换和3种降维算法建立最优的检测模型, 为精准农业的水稻管理与防治提供一定的理论基础和技术支撑。
1 实验部分
1.1 研究区概况
试验于2019年在沈阳农业大学北方粳型超级稻成果转化基地进行(123°33'E, 41°48'N), 水稻是当地的主要粮食作物之一。 试验时间是2019年8月1日、 8月19日和9月1日正午12时至16时晴天无风日。 由于氮素含量和品种对水稻光谱有很大的影响, 本试验设计4个施氮水平N0—N3: N0对照(0 kg·ha-1)、 N1(150 kg·ha-1)、 N2(240 kg·ha-1)、 N3(330 kg·ha-1); 5个辽宁地区主栽品种V1—V5: V1(399)、 V2(盐丰47)、 V3(桥润粳)、 V4(美丰稻)、 V5(盐粳糯66), 共20个小区, 各小区之间采取隔离措施, 粳稻生长过程中其他试验措施保持一致。
1.2 试验数据采集
低空遥感冠层尺度选用无人机Matrice 600作为遥感平台, 遥感平台搭载GaiaSky-mini高光谱成像仪, 光谱范围为400~1 000 nm, 光谱分辨率为(4±0.5) nm, 无人机飞行高度为100 m, 悬停采集数据, 将获取的高光谱影像在SpectralView软件中进行反射率校正、 区域校正、 辐射度校正等预处理。 预处理后得到的高光谱影像在ENVI5.3软件中进行进一步的高光谱数据提取, 20个小区中每个小区平分左中右三部分分别建立感兴趣区(region of interest, ROI), 把每个ROI的光谱值均化处理作为试验样本。
地面冠层尺度的试验采用ASD FieldSpec HandHeld 2手持式地物光谱仪, 采集数据时使光谱仪探头与水稻冠层相距1 m, 每次拍摄一穴水稻的数据, 其分辨率为1 nm, 波长范围为325~1 075 nm。 每个小区平均采集3穴水稻, 为避免太阳光照角度变化, 在采集完一个小区的数据, 进行一次白板校正。
地面调查水稻纹枯病病情指数。 每个小区进行3次病情指数的地面调查, 每次调查一穴。 根据GBT 15791—2011稻纹枯病测报技术规范, 病情指数是全面考虑发病率与严重度的综合指标, 如式(1)。
(1)
其中, 各分蘖病害级别依据常见的水稻纹枯病分级标准, 全株健康为零级, 第4叶以下(包括第4叶)发病为一级, 第3叶以下(包括第3叶)发病为三级, 第2叶以下(包括第2叶)发病为五级, 剑叶以下(包括剑叶)发病为七级, 全株发病为九级, 试验小区水稻纹枯病病害等级大多数为三, 五, 七3个等级。
1.3 主要数据分析方法
1.3.1 数据降维方法
分窗Gram-Schmidt变换法以Xn×p代表水稻冠层高光谱数据(其中n为样本量, p为光谱维度), 将其分为i个窗口。 每个窗口分别进行Gram-Schmidt正交变换, 随机选取第一个窗口中的一行数据H1= ( 为第1行中第i个窗口的数据), 其初始能量为H1, 初始能量归一化为Z1= , Z1为投影空间的第一个投影向量, 然后在此窗口剩下的数据里依次选择每行向量, 将其与Z1进行Gram-Schmidt正交变换 , 若H2 的能量大于设定的阈值ε, 则 作为投影空间的第二个投影向量,若小于阈值则舍弃。得到的第q个向量为 , 第q个投影空间为 。最后获得了基函数投影空间 , 一般 。将此窗口的原始数据投影到基函数空间 到投影系数 即为此窗口降维后的数据, 其他窗口重复上述步骤, 则分窗Gram-Schmidt正交化算法所得的降维后的数据为
1.3.2 数据建模方法
在检测植物病害方面支持向量机被广泛使用[7,8], 支持向量回归(support vector regression, SVR)是使所有的样本离超平而的距离总和最小。 本研究选择高斯径向基核函数。 其中, 为核函数,g为核函数参数。 在支持向量机回归模型中, 惩罚系数c和核函数参数g会影响它的建模效果, 因此利用粒子群算法进行两个参数的寻优。 粒子群优化算法(particle swarm optimization, PSO)是一种随机搜索算法, 它能以较大的概率收敛并得到全局范围的最优解。 在动态的、 多目标的优化问题中, 相比传统优化算法, PSO算法具有更快的搜索速度以及避免陷入局部最优的能力。
主要算法内容: 对于由n个粒子组成的粒子群, 每个粒子都需要完成搜寻惩罚因子和核函数系数最优位置的取值任务, 并将每一次迭代所求的最优解带入SVR中进行均方误差(mean square error, MSE)分析, 直至模型的MSE达到全局最优, 将对应的搜索解输出为全局最优解, 得出SVR模型参数寻优结果。
2 结果与讨论
2.1 水稻高光谱与纹枯病病情指数分析
将地面冠层和无人机低空冠层的高光谱数据, 通过样本光谱曲线与所有样本的平均曲线的距离大小剔除异常光谱样本, 去除光谱仪设备内部对光谱边界的噪声影响, 保留水稻敏感波段, 将两个尺度获取的高光谱波段统一定为400~1 000 nm, 在此波段下进行数据分析。 进行Savitzky-Golay平滑处理, 通过选用不同的多项式阶数和窗口宽度进行对比, 得到多项式阶数为3和窗口宽度为15是最佳的平滑处理, 能够较好的保留原始光谱信息, 将平滑后的光谱作为检测建模所使用的原始光谱(original reflection spectrum, ORS)。
为了更明显的看出, 在纹枯病的干扰下水稻光谱的变化规律, 将纹枯病病情指数分为三个程度, Light(病情指数<0.4), Moderate(0.4<病情指数<0.6), Serious(病情指数>0.6), 图2为3种病害程度在低空冠层和地面冠层尺度下的平均光谱反射率。 两个尺度的光谱反射率曲线满足一般规律, 400~750 nm是植物叶片可见光范围, 其光合作用强, 是强吸收波段, 反射和透射较低, 由于叶绿素的强吸收, 550 nm形成了一个反射峰, 680 nm处形成了吸收谷, 700~760 nm波段为红边区域, 光谱曲线急剧上升, 并在760 nm左右产生峰值, 760 nm以上为不可见光波段。 由图2可见, 光谱反射率随病情严重程度发生变化, 病情越严重在可见光波段反射率越高, “绿峰”附近表现最为明显, 而病情越严重在不可见光波段光谱反射率越低。 造成这个现象的主要原因是因为随着水稻的生长和纹枯病病情的加重导致水稻内部结构发生变化, 叶绿素含量减少、 水分吸收衰退等影响。
图 2. 3种病情程度下水稻原始光谱反射率曲线
(a): 低空遥感冠层; (b): 地面冠层
Fig. 2. The original spectral reflectance curves of rice under the condition of three degrees of rice sheath blight
(a): Low altitude remote sensing canopy; (b): Ground canopy
将原始光谱进行一阶微分变换(first-order differential reflection spectrum, FDRS), 得到的光谱对地物目标的特征光谱更加明显。 由图3可知, 两个尺度在蓝波段、 红波段、 近红外波段的差异在4%以内, 绿波段和红边波段处区别明显。 其中地面冠层尺度中, 病害程度严重的波峰发生了蓝移现象并低于轻度水稻。
图 3. 3种病情程度下水稻一阶微分光谱反射率曲线
(a): 低空遥感冠层; (b): 地面冠层
Fig. 3. First-order derivative spectral reflectance curves of rice under the condition of three degrees of rice sheath blight
(a): Low altitude remote sensing canopy; (b): Ground canopy
将原始光谱进行倒数之对数变换(inverse-log reflection spectrum, IRS), 得到的光谱区分度更大。 由图4可知, 低空冠层尺度中, 在可见光波段范围光谱区分度大, 染病程度越严重反射率越低, 在近红外波段内重叠率97%以上。 地面冠层尺度中, 染病程度高的水稻光谱在可见光波段中反射率低, 近红外波段中反射率高, 其中, 中度染病IRS光谱在675 nm处稍高于轻度染病IRS光谱。
图 4. 3种病情程度下水稻倒数之对数光谱反射率曲线
(a): 低空遥感冠层; (b): 地面冠层
Fig. 4. Inverse-log spectral reflectance curves of rice under the condition of three degrees of rice sheath blight
(a): Low altitude remote sensing canopy; (b): Ground canopy
2.2 基于分窗Gram-Schmidt变换的水稻纹枯病光谱降维
本研究采用分段方法进行Gram-Schmidt变换降维, 通过控制分段窗口值的大小来筛选产生最优降维模型, 经过大量试验测试设定的阈值ε取0.01时效果最佳。 将降维后的数据与水稻纹枯病病情指数建立多元回归模型, 通过决定系数R2值选取最优的分段窗口值。 其中, 低空遥感冠层尺度, ORS, FDRS和IRS最优窗口值分别为30, 45和45 nm, 对应的决定系数R2分别为0.576, 0575和0.590, 倒数之对数光谱处理效果较好; 地面冠层尺度, ORS, FDRS和IRS最优窗口值分别为220, 220和150 nm, 对应的决定系数R2分别为0.631, 0.654和0.622, 一阶微分光谱效果较好。 总体来说, 水稻纹枯病病情指数反演, 地面冠层尺度优于低空冠层尺度。
分窗Gram-Schmidt正交化变换降维能够寻找敏感波段。 由Gram-Schmidt正交化算法处理水稻叶片光谱反射率后, 可以得到基向量的统计学参数显著性概率值(p-value)。 p-value是判断假设检验结果的参数, 当p-value<0.05时, 说明结果显著。 低空冠层尺度倒数之对数变换的决定系数较高, 地面冠层尺度一阶光谱变换的决定系数较高, 分别绘制这两个数据的基向量光谱信息情况(图5), 水稻纹枯病敏感波段为同一分窗波段所有效果显著基向量的极值位置, 低空冠层高光谱敏感波段为427.3, 539.6, 749.5和825.4 nm, 地面冠层高光谱的敏感波段为552, 607, 702和730 nm, Gram-Schmidt正交化方法在降维的同时也能兼顾到敏感波段的提取。
图 5. 基于分窗Gram-Schmidt变换所得主基底与特征波长
(a): 低空遥感冠层倒数之对数光谱; (b): 地面冠层一阶变换光谱
Fig. 5. Main base and characteristic wavelength based on window dividing Gram-Schmidt transform
(a): IRS of the low altitude remote sensing canopy; (b): FDRS of the ground canopy
2.3 基于其他算法的水稻纹枯病光谱降维
基于主成分分析算法的水稻纹枯病光谱降维。 将6类光谱数据进行主成分分析降维, 结果显示, 前6个主成分分别包含6类光谱原数据的75.68%, 99.86%, 99.86%, 91.55%, 99.91%和99.94%, 其中, 地面和低空冠层尺度的原始光谱前6个主成分累积贡献较低, 分别使用前15个和前10个主成分进行后续的建模处理, 能够包含95%以上的原数据。
基于连续投影算法的水稻纹枯病光谱降维。 6类光谱数据分别进行连续投影法降维, 计算SPA选择不同变量数的均方根误差RMSE, 随着选取变量数的增加, RMSE逐渐减小, 当RMSE不再显著减小时的变量数作为特征变量数, 将所选择的波段作为建模输入值。
2.4 建立水稻纹枯病病情指数检测模型
首先应用PSO算法进行SVR中参数的优化, 其中, PSO中设置局部搜索能力为1.5, 全局搜索能力为1.7, 最大进化数量为200, 种群最大数量为20。 用SVR模型5折交叉验证所求得的平均MSE值作为目标适应度函数, 对惩罚系数c和核参数g进行参数寻优, 并对粒子设置了自适应的变异因子以防止陷入局部最优化的求解循环, 从而确保寻优结果的可靠性, 群体最优适应度经过迭代次数的增加得到了全局最优解。
以PSO寻优的结果为SVR中惩罚系数c和核参数g的已知量, 建立水稻高光谱与水稻纹枯病病情指数的反演模型, 表1为各光谱数据采用PSO算法前后SVR建模效果比较。 可以看出, 原始光谱数据经过一阶微分变换和倒数之对数变换后精确度都有所提升, 并且低空冠层尺度, 倒数之对数变换优于一阶微分变换, 而地面冠层尺度的光谱一阶微分变换优于倒数之对数变换。 3种降维方式中, Gram-Schmidt变换算法优于主成分分析和连续投影法, 具有良好的降低光谱数据维度的能力, 对于水稻纹枯病病情指数的反演有较好的精确度。 本研究应用粒子群算法优化支持向量机回归模型中的参数, 得到较好的建模效果。 并且无人机低空遥感尺度建立的模型要普遍低于地面冠层尺度模型, 这是由于无人机低空遥感所采集的数据与地面冠层采集的数据相比, 会受到空间分辨率低和地物分布复杂的影响, 使水稻光谱数据更不纯净。
表 1. 经过支持向量机回归建模所得结果
Table 1. The result of regression modeling with support vector machine
|
3 结论
对水稻进行无人机低空遥感、 地面冠层两个尺度的光谱数据采集, 建立水稻纹枯病病情指数检测模型。 将所采集的光谱数据进行平滑处理和光谱变换, 分别进行分窗Gram-Schmidt变换算法、 主成分分析和连续投影法降维, 基于粒子群算法的支持向量机回归建立水稻纹枯病病情指数检测模型并对比分析。 主要结论如下:
(1)高光谱数据经过合适的光谱变换可以提高建模精度。 其中, 低空遥感冠层高光谱, 经倒数之对数处理效果较好; 地面冠层高光谱数据, 经一阶微分处理较好。
(2)本文提出的分窗Gram-Schmidt变换算法可以有效降低高光谱维度, 并能找到敏感波段, 此方法优于主成分分析法和连续投影法。
(3)基于无人机低空遥感和地面冠层两个尺度进行水稻纹枯病病情指数检测是可行的。 通过光谱变化与分窗Gram-Schmidt降维算法, 以PSO-SVR模型可以有效地反演出水稻纹枯病病情指数。
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
Article Outline
肖文, 曹英丽, 冯帅, 刘亚帝, 江凯伦, 于正鑫, 闫丽. 基于分窗Gram-Schmidt变换和PSO-SVR算法的水稻纹枯病病情指数检测[J]. 光谱学与光谱分析, 2021, 41(7): 2181. Wen XIAO, Ying-li CAO, Shuai FENG, Ya-di LIU, Kai-lun JIANG, Zheng-xin YU, Li YAN. Detection of Rice Sheath Blight Disease Index Based on Split-Window Gram-Schmidt Transformation and PSO-SVR Algorithm[J]. Spectroscopy and Spectral Analysis, 2021, 41(7): 2181.