1 河南农业大学信息与管理科学学院, 河南 郑州 450002 河南粮食作物协同创新中心, 河南 郑州 450002
2 河南农业大学信息与管理科学学院, 河南 郑州 450002
3 Universidade Nova de Lisboa, NOVA Informantion Managment School, Lisboa, 1070-312, Portuga
土壤全氮是重要的养分指标, 利用高光谱技术研究并构建砂姜黑土全氮含量高光谱估测模型, 为作物施肥及发展精确农业提供参考。 尝试研究离散小波估测土壤全氮含量的可行性, 以河南省商水县不同小麦氮肥处理为试验区, 采集100份0~20 cm的砂姜黑土, 土壤样本风干并经研磨过筛等处理后, 在实验室暗室内采集光谱。 利用含量梯度法, 将总样本(100个砂姜黑土)划分为建模集75个和验证集25个。 将原始光谱进行一阶导数变换, 并对一阶导数光谱分别进行相关分析和离散小波变换, 同时结合支持向量机和K邻近算法构建高光谱土壤全氮估测模型。 系统分析了原始光谱和一阶导数光谱的单波段与土壤全氮的相关性, 结果表明, 经一阶导数变换后的光谱与土壤全氮有更好的相关性, 在1 373 nm处相关系数达到最高为0.84。 利用离散小波算法对一阶导数光谱进行最佳母小波和分解层次选择, 结果显示, 经sym8函数分解的小波系数能较好的重构土壤全氮光谱信息, 进一步基于分解层L1—L11的低频系数分别建立支持向量回归和K邻近回归土壤全氮含量估测模型, 比较全部估测模型, 以分解层L5的低频系数结合K邻近构建的模型最优, 建模决定系数为0.90, 均方根偏差为0.09 g·kg-1, 相对分析误差为3.78, 验证决定系数为0.97, 均方根偏差为0.05 g·kg-1, 相对分析误差为4.30。 同时与全波段和经相关分析后挑选出的敏感波段作为输入构建的模型进行比较, K邻近模型精度提高了3.2%和9%, 支持向量机模型精度提高了6.7%和11.6%。 研究结果表明一阶导数变换与离散小波技术可有效减少噪声影响, 提高土壤全氮含量的估测精度, 又实现了光谱数据降维, 简化了模型复杂度, 为砂浆黑土全氮含量的精确估测提供参考。
砂姜黑土 全氮 高光谱 离散小波 K邻近算法 Shajiang black soil Total nitrogen Hyperspectral Discrete wavelet K-neighbor 光谱学与光谱分析
2023, 43(10): 3223
1 华东交通大学电气与自动化工程学院, 江西 南昌 330013
2 华东交通大学土木建筑学院, 江西 南昌 330013
土壤养分直接关系到作物产量与品质状况, 然而传统化学方法检测存在化学试剂消耗大、 耗时费力等问题, 不能满足精细农业的需求。 快速获取土壤养分信息是发展精细农业、 绿色农业的关键, 想要了解土壤肥力状况, 必须先了解有机质和总氮的含量状况。 许多研究表明, 长波近红外光谱被广泛应用于土壤检测领域, 然而短波可见/近红外光谱在土壤有机质和总氮的研究上却非常罕见。 以江西省吉安市安福县和南昌市新建区的四个村庄作为研究区, 根据2×2网格法采集了深度为10~30 cm的棕壤、 红壤和水稻土三种最为典型的土壤样品共180份。 经过研磨、 风干等处理后用四分法均匀划分为两份, 用于测定样品光谱信息和理化信息。 将土壤样品按照2∶1(120∶60)划分为建模集和预测集。 考虑到首尾端波段噪声较大, 故去除325~349和1 051~1 075 nm波段, 将350~1 050 nm波段用于光谱分析。 通过连续投影算法(SPA)筛选出有机质12个特征波长点, 总氮11个特征波长点, 考虑到土壤光谱信息与土壤理化性质之间可能存在非线性联系, 建立全波段与特征波长的线性偏最小二乘回归(PLSR)模型和非线性最小二乘支持向量机(LS-SVM)模型对土壤有机质和总氮进行研究, LS-SVM模型采用两步网格搜索法优化了两个超参数γ和σ2。 研究结果表明: (1)土壤的光谱反射率随波长增加反射率升高, 反射率曲线中460、 550、 580、 740和900 nm处有较为明显的吸收特征。 (2)从PLSR模型和LS-SVM模型结果分析可知, 非线性模型LS-SVM具有更好的预测精度, 分析认为土壤光谱信息与土壤理化性质之间存在一些非线性关系。 (3)通过连续投影算法筛选的特征波长提高了模型精度, 优化了模型运行效率。 SPA-LS-SVM模型是所有模型中最优的预测模型, 其中有机质模型的R2pre为0.884 7, RMSEp为0.104 8, RPD为2.945 0, 总氮模型的R2pre为0.901 8, RMSEp为0.010 4, RPD为3.191 1。 (4)本研究说明可见/近红外光谱能够用于测量不同类型的土壤有机质和总氮含量, 并且达到较好的预测效果。 可见/近红外光谱在土壤检测领域具有巨大潜力。
土壤有机质 总氮 连续投影算法 偏最小二乘回归 最小二乘支持向量 Soil organic matter Total nitrogen Successive projections algorithm Partial least squares regression Least-squares support vector machine 光谱学与光谱分析
2023, 43(7): 2226
1 中国科学院长春光学精密机械与物理研究所, 吉林 长春 130033
2 中国科学院大学, 北京 100049
水是维系生命与健康的基本需求, 人类的生产、 生活都离不开水。 水体中氮磷的超标导致水中营养元素过剩从而水体富营养化, 进而水质恶化甚至造成大范围的影响。 高光谱遥感在内陆水质监测领域的应用越来越广泛, 研究以此为基础, 为减少室外水体特异性因素影响, 通过实验室模拟外界条件搭建实验室实验系统, 并根据国家排放标准分别配制浓度范围在0~2.5 mg·L-1 的40个不同浓度梯度的磷酸钠标准溶液和浓度范围在0~20 mg·L-1 的40个不同浓度梯度氯化铵标准溶液。 获取所有标准溶液的高光谱图像, 对水质参数总磷、 总氮的光谱响应进行了分析, 找出其对应的敏感波段分别在420、 720 nm附近和410 nm附近。 利用主成分分析(PCA)建立高光谱水质反演数据集, 对高光谱图像作辐射定标、 Savitzky-Golay滤波(SG滤波)预处理并利用BP人工神经网络分别构建实验室高光谱总磷、 总氮反演模型, 构建的实验室高光谱总磷反演模型的决定系数为0.980 2, 实验室高光谱总氮反演模型的决定系数为0.860 2。 以江苏宜兴市内某河道为研究对象, 将该模型应用到室外无人机搭载高光谱成像系统获取到的室外高光谱图像数据, 分散选取五个点分别计算结果, 得到总磷、 总氮浓度均值的反演精度分别为95.00%和93.52%。 利用传统方法直接在待测河道观测点取水构建的室外高光谱水质反演模型反演相同五个点得到的总磷、 总氮浓度均值的反演精度分别为86.87%和86.48%。 两组反演结果对比, 发现本研究构建的实验室高光谱水质反演模型得到的光谱反演结果中90%的反演精度略高于室外水质反演模型的反演精度, 证实该研究可对待测河道内总磷、 总氮的含量进行有效预测, 也可为水体总磷、 总氮高光谱遥感反演提供一定技术支持。
高光谱 总磷 总氮 水质反演 Hyperspectral Total phosphorus Total nitrogen Water quality inversion
安徽省农业科学院土壤肥料研究所, 安徽 合肥 230031
氮素是作物生长发育必需的营养元素之一, 作物的全氮含量是表征其氮素状况的主要指标。 田块尺度的冬小麦全氮含量空间分布监测可以辅助其精准定量追肥, 减少环境污染。 无人机高光谱遥感具有分辨率高、 时效性高、 成本低等优势, 可为作物长势信息反演提供重要数据源。 XGBoost(extreme gradient boosting)作为一种新兴集成学习算法, 运行效率高, 泛化能力强, 可以有效的应用于构建冬小麦全氮含量遥感反演模型, 预测田块尺度冬小麦全氮含量空间分布。 以农业部蒙城砂姜黑土生态环境站内拔节期冬小麦为研究对象, 开展以下工作: (1)以低空无人机搭载高光谱成像仪获取冬小麦拔节期冠层成像光谱影像, 结合地面采样数据, 获取126个样点全氮含量数据; (2)分析拔节期冬小麦冠层光谱特征, 并根据Person相关系数分析176个波段的光谱反射率与全氮含量之间的相关性; (3)构建基于XGBoost算法的不同土壤肥力条件下拔节期冬小麦全氮含量无人机高光谱反演模型。 结果表明: (1)176个波段(400~1 000 nm)的光谱反射率与冬小麦全氮含量之间具有较强的相关性, 除了735.5 nm外其他波段光谱反射率与全氮含量之间的相关系数均大于0.5; (2)基于XGBoost算法构建的拔节期冬小麦全氮含量无人机高光谱遥感反演模型具有较高的反演精度(R2=0.76, RMSE=2.68); (3)基于XGBoost算法的冬小麦全氮含量反演模型可以获取不同土壤肥力条件下田块尺度的全氮含量空间分布图, 总体上呈现较为显著的空间差异。 该研究可为冬小麦精准定量追肥提供一定的科学依据, 也为发展无人机高光谱遥感的精准农业应用提供了参考。
冬小麦全氮含量 无人机高光谱 遥感反演 Winter wheat total nitrogen content (TNC) UAV hyperspectral data XGBoost Remote sensing estimation XGBoost 光谱学与光谱分析
2022, 42(10): 3269
1 塔里木大学农学院, 新疆 阿拉尔 843300
2 中国农业大学土地科学与技术学院, 北京 100083
3 浙江大学环境与资源学院, 浙江 杭州 310058
快速准确监测农田土壤全氮含量, 可显著提高土壤肥力诊断与评价工作的效率。 传统测定土壤全氮的方法存在耗时费力、 成本高、 环境污染等缺点, 而基于光谱学原理的土壤全氮定量方法克服了传统测量的劣势。 中红外(MIR)光谱相较于可见光-近红外(VNIR)光谱而言, 具有更多的波段数和信息量, 如何利用中红外光谱监测土壤全氮含量是具有重要应用前景的研究课题。 为了探索中红外光谱对土壤全氮监测的可行性, 以新疆南疆地区采集的246个农田土样为研究对象, 以室内测定的全氮含量和中红外光谱反射率数据为数据源, 分析了不同全氮含量土样的中红外光谱特征差异, 以主成分分析法(PCA)和连续投影算法(SPA)对光谱数据进行降维, 然后采用偏最小二乘回归(PLSR)、 支持向量机(SVM)、 随机森林(RF)和反向传播神经网络(BPNN)四种建模方法分别构建基于全波段和降维数据的土壤全氮含量定量反演模型。 研究结果表明: (1)土壤在中红外波段光谱反射率随全氮含量的增加而增加, 在3 620, 2 520, 1 620和1 420 cm-1附近存在明显的吸收谷; 将中红外光谱数据进行最大值归一化处理后, 可明显提高土壤光谱反射率与全氮含量的相关性。 (2)对比两种数据降维方法, PCA和SPA分别使模型变量数减少了99.8%和97.5%, 但以PCA提取的8个主成分为自变量建立的模型预测精度总体要高于SPA对应的模型, 因此以PCA提取的主成分建模更适于土壤全氮模型的构建。 (3)在建模集中, PLSR和SVM模型以全波段建模精度最高, 但建模变量数多, 建模效率较低, 而RF和BPNN模型分别以PCA和SPA降维后的数据建立的模型在保持精度相当的前提下, 可显著提高建模效率; 在预测集中, 基于PCA降维数据的BPNN模型预测能力最高, R2和RMSE分别为0.78和0.12 g·kg-1, RPD和RPIQ值分别为2.33和3.54, 模型具备较好的预测能力。 研究结果可为农田土壤全氮含量快速估测提供一定的参考价值。
中红外光谱 土壤全氮 反演模型 光谱数据降维 Mid-infrared spectrum Soil total nitrogen Inversion model Dimension reduction of spectral data 光谱学与光谱分析
2022, 42(9): 2768
燕山大学信息科学与工程学院, 河北省特种光纤与光纤传感重点实验室, 河北 秦皇岛 066004
提出了一种将表面增强拉曼光谱技术(SERS)和基于灰狼优化(GWO)算法的支持向量回归(SVR)相结合快速定量检测水中总氮(TN)、 总磷(TP)含量的定量分析方法。 传统的TN、 TP检测方法不但过程繁杂, 实验环境要求高, 而且耗时较长, 不能实现快速检测。 而SERS技术操作简单, 耗时短, 将其与GWO-SVR算法相结合可以实现快速精确检测。 以实验室配制的银溶胶作为拉曼光谱增强基底, 不同浓度梯度TN、 TP溶液为研究对象, 分别配制TN、 TP样本溶液26组和23组, 其中TN溶液选取8组作为测试集, TP溶液选取7组作为测试集, 剩余样本溶液作为训练集。 根据待测溶液与银溶胶不同体积配比确定最佳实验方案, 将TN、 TP分别与银溶胶进行1:1, 1:2, 1:3, 2:1和3:1的体积比混合, 结果表明当待测溶液与银溶胶以2:1比例混合时增强效果最佳。 采集光谱信息并对特征峰进行归属, 然后采用暗电流扣除、 背景扣除(基线校正)和平滑处理对原始光谱数据进行预处理。 经光谱分析结果可知, 由于不同浓度溶液官能团浓度差异, 光谱特征峰强度随溶液浓度变化而变化。 以训练集样本溶液光谱特征峰强度和溶液浓度值作为回归预测模型的输入值和输出值, 建立GWO-SVR定量分析模型。 通过测试集样本溶液的相关系数(r)和均方误差(MSE)对模型的预测能力进行分析, 并将GWO-SVR模型和其他两种模型进行对比。 结果表明, GWO-SVR模型对TN溶液预测的相关系数为0.999 5, 均方误差为0.005 8, 高于人工蜂群算法优化支持向量回归(ABC-SVR)和粒子群算法优化神经网络(PSO-BP)的0.993 8, 0.052 7和0.998 3, 0.022 7。 对TP溶液预测的相关系数为0.998 5, 均方误差为0.037 6, 也均高于另外两种模型。 而且与ABC-SVR和PSO-BP模型相比, GWO-SVR定量分析输入参数更少, 收敛速度更快, 更容易找到全局最优解。 因此, 该方法可以实现对水中TN、 TP含量的快速准确检测, 为水质检测提供了新方法。
表面增强拉曼光谱 灰狼优化 支持向量回归 总氮 总磷 Surface-enhanced Raman spectrum Gray Wolf optimization Supportvector regression Total nitrogen Total phosphorus 光谱学与光谱分析
2021, 41(10): 3147
南京信息工程大学应用气象学院, 江苏省农业气象重点实验室, 江苏 南京 210044
土壤团聚体是土壤生态系统的重要组成部分, 其碳氮含量及动态决定着土壤碳氮循环过程、 稳定性及肥力。 由于团聚体分级方法的差异, 不同研究所获得的团聚体粒径也不尽相同, 应用红外光谱对土壤团聚体性质进行建模预测时若对不同粒径团聚体分别建模需要大量样本且难以对所有组分同时进行合理预测。 该研究对不同粒径团聚体样本进行综合建模预测, 探寻一种高效可行的不同粒径团聚体性质的综合预测方法。 采集了内蒙古淡栗钙土土壤样本进行傅里叶变换红外光谱分析, 用遗传算法对特征波长进行了选择, 基于偏最小二乘法(PLSR)、 支持向量机(SVM)、 人工神经网络(ANN)和随机森林(RF)等方法建立了不同粒径团聚体土壤有机碳(SOC)、 全氮(TN)和红外光谱吸光度之间的估测模型。 结果表明, 基于遗传算法筛选的特征光谱区间构建的土壤团聚体SOC和TN含量的ANN模型的预测能力均是最好的(RPD>2), 显著优于PLSR、 SVM及RF模型; 基于全谱数据的ANN模型对土壤团聚体SOC和TN的预测效果均低于基于GA选择的特征光谱区间的ANN模型, 说明基于GA的特征光谱区间选择不仅可以简化模型结构, 剔除无关的信息, 而且可以提高模型的精度和预测效果。 该研究将不同粒径土壤团聚体FTIR数据混合建模, 通过遗传算法筛选特征光谱, 发现人工神经网络模型可以很好地对土壤团聚体碳氮含量进行预测, 且不会受团聚体粒径的影响, 主要由于在遗传算法选择特征光谱时已将某些反映土壤矿物、 粘粒等特征的波长区间包含在内, 而人工神经网络所建立的模型可能已包含了不同粒径对土壤碳氮含量的影响, 该结果表明基于遗传算法筛选特征波长区间并采用人工神经网络可以将不同粒径土壤团聚体统一建模, 用于团聚体土壤有机碳和全氮含量的估测。
淡栗钙土 有机碳 全氮 团聚体 红外光谱 Light chestnut soil Soil organic carbon Total nitrogen Soil aggregates FTIR spectroscopy 光谱学与光谱分析
2020, 40(12): 3818
为实现现场、 快速且相对准确地获得规模化奶牛场粪便从牛舍到还田前各环节的全氮含量, 连续6天采集天津市某典型奶牛场粪便处理全过程环节(收集—筛分—堆储)111个粪便样品, 使用电热鼓风干燥箱将样品烘干后粉碎并过18目筛。 采用凯氏定氮仪测得各环节样品中全氮含量, 其浓度范围为0.20%~3.86%; 采用美国PE公司的傅里叶近红外光谱仪在4 000~12 000 cm-1范围内采集所有样品的近红外漫反射光谱。 基于蒙特卡洛交叉验证法对异常样品进行检查, 剔除17个异常样品, 并对剩余94个样品的近红外漫反射光谱进行SG一阶导数与去噪预处理。 接着对94个样品预处理后的近红外漫反射光谱数据进行主成分分析, 前两个主成分可以解释所有变量方差的89%, 通过主成分分析得出规模化奶牛场粪便处理全过程环节样品的变异情况: 从鲜粪到混合粪环节, 样品的性质和有机组分变化不大, 而到垫料环节, 性质和有机组分发生较大变化, 表明粪便样品随着处理环节的变化, 其性质和组成在发生动态的变化。 因此, 要实现对规模化奶牛场粪便处理全过程环节样品动态的、 实时的总氮快速检测, 就必须建立适用于粪便处理全过程环节的定量分析模型。 最后, 采用K-S法从94个样品中选择63个样品, 包括24个鲜粪样品、 28个混合粪样品、 11个垫料样品, 作为校正集建立规模化奶牛场粪便处理全过程环节定量分析总氮的偏最小二乘模型。 利用所建立的全环节模型对预测集31个未知样品, 包括12个鲜粪样品、 9个混合粪样品、 10个垫料样品, 进行预测, 预测浓度与实际浓度的相关系数(R)为0.91, 预测均方根误差(RMSEP)为0.151%。 表明: 将近红外漫反射光谱与化学计量学结合快速定量分析规模化奶牛场全程粪便中全氮的含量完全可行, 为粪便全氮快速检测近红外仪器的开发和现场应用提供理论和实验依据, 为粪便定量还田提供技术支撑。
规模化奶牛场 粪便 全氮 近红外漫反射光谱 偏最小二乘 Large-scale dairy farm Manure Total nitrogen (TN) Near-infrared diffuse reflectance spectroscopy Partial least squares 光谱学与光谱分析
2020, 40(10): 3287
1 中国农业大学信息与电气工程学院食品质量与安全北京实验室, 北京 100083
2 中国农业大学烟台研究院, 山东 烟台 264000
3 苏州大学基础医学与生物科学学院, 江苏 苏州 215200
4 中国农业大学工学院, 北京 100083
应用紫外(Ultraviolet, UV)光谱技术对水产养殖水质总氮含量进行快速检测。 为了消除各种系统误差与偶然误差对模型预测性能造成的影响, 将88个水样的总氮浓度实测值数据和光谱吸光度数据作为原始数据, 将模型建立分为样本集划分、 数据预处理、 特征波段提取、 模型选择与LV数量选择5个阶段, 以求达到最优预测效果, 其中前4个阶段分别使用多种方法进行比较。 结果证明每个阶段都是必不可少的, 只有通过对比其优劣才能找到最适合总氮含量测定的建模过程及方法。 首先用浓度梯度(CG)法对原始数据进行相同的样本集划分处理, 然后在此基础上分别建立主成分回归(PCR)、 逐步回归(SR)和偏最小二乘回归(PLSR)三种模型, 选择预测效果最好的PLSR作为本文的预测模型。 PLSR的建模效果会在很大程度上受到潜在变量(LVs)数量的影响, 通常选取模型预测均方根误差RMSEP值最小时所对应的LV个数为最优LV个数。 其次, 选用CG法、 随机抽样(RS)法、 Kennard Stone(KS)法和SPXY法4种样本集划分算法对样本进行处理, 并对所建立的PLSR模型预测效果进行比较, 最终选择SPXY算法作为最优样本划分算法。 然后在对样本集进行SPXY法划分的基础上, 运用多种预处理算法对光谱吸光度数据进行预处理, 包括小波变换(WT)、 一阶导数法(Der1st)与二阶导数法(Der2nd)三种单一算法和小波变换与两种导数法的组合预处理算法WT-Der1st和WT-Der2nd。 然后在预处理的基础上分别使用连续投影变换(SPA)和逐步回归(SR)两种特征波段提取方法, 对比可知, SPA特征提取方法比SR的提取效率高且建模效果好。 SPA算法既可以大大地简化模型, 又可以在一定程度上提升模型的预测精度。 基于WT-Der1st-SPA提取的特征波段为218 nm, 与总氮特征波段区间相一致, 由此说明该方法比较科学。 综合上述建立的10个PLSR模型, 考虑到预测精度与模型复杂度2个因素, 最终选择基于WT-Der1st-SPA建立的PLSR模型作为最优模型, 该模型预测决定系数r2为0.996, 预测均方根误差RMSEP为0.042 mg·L-1。 由此可见, 所建立的模型预测效果非常好, 可以快速准确地测定水体的总氮含量, 为实现光谱技术在水产养殖其他水质监测指标的在线检测以及快速测定提供了经验。
紫外光谱 总氮 小波变换 连续投影变换 潜在变量 偏最小二乘回归 Ultraviolet spectroscopy Total nitrogen Wavelet transform Successive projections algorithm Latent values (LVs) Partial least squares regression (PLSR)
北方工业大学 机电工程研究所, 北京 100084
针对地表水和城镇污水对于总磷(TP)总氮(TN)联合测定的需求, 基于国标法提出了联合测定原理, 利用顺序注射技术和微控技术建立水质总磷总氮多量程在线监测系统, 完成了TP和TN的测定。总磷的测定量程分为0~1.2, 1.2~2.5, 2.5~5 μg·mL-1; 总氮测定量程分为0~10, 10~20, 20~40 μg·mL-1。测定范围涵盖地表水环境I~V类水和城镇污水处理厂排放标准中总磷、总氮的标准限值。利用交替最小二乘拟合算法建立了总磷与总氮测定的回归模型。实验结果表明, 其校正决定系数≥0.996 4, 最低检出限分别为0.01 μg·mL-1和0.05 μg·mL-1, 重复性相对标准偏差(RSD)分别为1.36%~3.84%、0.78%~3.69%, 贵州七大水库实际水样数据比对中, 总磷相对误差≤±3.7838%, 总氮相对误差≤±3.69%。系统运行稳定, 可以精准、高效地分析不同地表水样的总磷总氮, 为环境保护和污水排放提供了技术支持, 尤其适用于实验室、站房式、便携式在线水质监测。
多量程 总磷 总氮 朗伯比尔定律 在线监测 光电二极管 multi-range total phosphorus total nitrogen Lambert-Beer law on-line monitoring photodiode