作者单位
摘要
1 青海师范大学地理科学学院,青海省自然地理与环境过程重点实验室, 青海 西宁 810008
2 中国环境科学研究院, 北京 100012
针对高光谱数据量大、信息冗余严重的现象,应用稳定竞争性自适应重加权采样(sCARS)、连续投影算法(SPA)、遗传算法(GA)、迭代保留有效信息变量(IRIV)和稳定竞争性自适应重加权采样结合连续投影算法(sCARS-SPA),从全波段光谱数据中筛选特征变量,并利用全波段和特征波段建立偏最小二乘回归(PLSR)、支持向量机(SVM)和随机森林(RF)模型预测土壤有机质含量。结果表明, PLSR和SVM模型结合特征变量选择,不仅提高了模型运算效率,而且模型预测能力较全波段均有一定提高;RF模型采用特征变量建模,对模型精度的提高不是十分明显,但其构建模型的变量数量却显著减少,大大提高建模效率。RF模型精度优于SVM和PLSR模型,IRIV结合RF建立的土壤有机质含量预测模型,变量数仅63个,校准集和验证集模型决定系数(R2)分别为0.941和0.96,验证集相对分析误差(RPD)为4.8。与全波段建模相比,特征变量选择和回归方法相结合,在保证模型精度的同时,可有效提高建模效率。
光谱学 土壤有机质含量 特征变量选择 回归模型 
光学学报
2019, 39(9): 0930002
作者单位
摘要
1 青海师范大学 地理科学学院, 青海 西宁 810008
2 青海省自然地理与环境过程重点实验室, 青海 西宁 810008
3 中国环境科学研究院, 北京 100012
针对土壤高光谱数据量大、存在光谱信息冗余和重叠现象, 应用稳定竞争性自适应重加权采样策略挑选特征变量, 结合偏最小二乘回归和随机森林建立土壤有机质含量估算模型, 并与竞争性自适应重加权算法、迭代保留有效信息变量、连续投影算法和遗传算法所得结果进行比较。结果显示, 5种变量选择算法挑选的特征变量主要分布在1 900~2 400 nm的近红外光谱区域。RF模型的预测效果优于PLSR模型; 与PLSR模型相比, RF模型鲁棒性更好, 对异常值和噪声的敏感度更低。基于sCARS算法挑选的特征变量建立RF模型, 变量数为51个, 仅占全波段的2.55%, 验证集R2=0.958, 获得的RPD为4.7, 能够很好地预测SOM含量。
土壤有机质 可见-近红外光谱 稳定竞争性自适应重加权 随机森林 湟水流域 soil organic matter Vis-near infrared spectra stabilization competition adaptive reweighted samp random forest Huangshui River Basin 
发光学报
2019, 40(8): 1030

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!