钱瑞 1徐伟恒 2,3,4黄邵东 2王雷光 2,3,4[ ... ]欧光龙 1
作者单位
摘要
1 西南林业大学林学院, 云南 昆明 650233
2 西南林业大学大数据与智能工程学院, 云南 昆明 650233
3 西南林业大学大数据与智能工程研究院, 云南 昆明 650233
4 西南林业大学生态大数据国家林业与草原局重点实验室, 云南 昆明 650233
为探究高光谱影像丰富的光谱信息对山区茶园的提取效果, 促进国产卫星高光谱影像在茶园分布制图与资源监测中的应用, 以普洱市南部山区茶园典型分布区为研究区, 以高分五号AHSI(GF-5 AHSI)影像以及数字高程模型(DEM)为主要数据源, 结合实地调查数据, 构建基于随机森林(RF)分类器的亚热带山区茶园提取算法。 首先, 将去除噪声影响后剩余的250个波段作为光谱特征(SF); 在分析研究区主要地物(茶园、 森林、 农田)光谱的基础上, 分别构建植被指数特征(VIF)45个, 地形特征(TRF)3个。 然后, 利用RF进行特征重要性排序, 按照特征重要性从大到小依次将特征输入RF分类器进行茶园提取, 随着特征的不断输入, 茶园提取的F1-Score达到饱和不再明显增加时的特征维度即为最优选择特征。 依据3种特征因子(SF, VIF和TRF)构建12种分类方案。 最后, 比较12种方案的茶园提取精度, 最终确定最优方案。 结果显示, 不同特征组合茶园提取F1-Score排序为SF+VIF+TRE+FS>TRF+VIF+FS>SF+TRF+FS>TRF+VIF>VIF+FS>SF+VIF+FS>SF+VIF+TRF>SF+FS>SF+TRF>VIF>SF+VIF>SF。 FS后6种分类方案中, SF参与分类的4种方案中被选中2次的波段为b4、 b5、 b6、 b27、 b133、 b150和b281; 在VIF参与分类的4种方案中被选中4次的指数分别为REP、 VOG2、 SR2、 SR3、 WBI、 TIP3和TIP9; TRF参与分类的4种方案中坡度、 坡向、 高程均被选中。 此外, SF+TRF+VIF特征进行FS后结合RF算法能够对亚热带茶园分布进行有效识别, 具有较好的识别精度和可信度, GF-5 AHSI卫星数据在茶园分布制图和资源监测等领域有着较好的应用潜力和前景。
GF-5影像 高光谱 茶园 特征重要性 提取 GF-5 image Hyperspectral Feature importance Tea plantations, Extraction 
光谱学与光谱分析
2023, 43(11): 3591
陈蕊 1王雪 1,2王子文 1曲浩 1[ ... ]高睿 3
作者单位
摘要
1 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163319
2 农业农村部农产品及加工品质量监督检验测试中心(大庆), 黑龙江 大庆 163319
3 东北农业大学电气与信息学院, 黑龙江 哈尔滨 150030
为建立快速近红外光谱定量分析模型, 特征波长筛选是提高定量分析预测精度较为有效的方法之一。 它能够筛选出有效波长信息, 减少数据冗余、 提高数据有效性。 随机森林(RF)作为一种集成算法, 可根据计算特征重要性进行特征筛选。 RF将基于袋外数据(OOB)的平均精度下降(MDA)方法计算均方误差平均值作为特征重要性结果, 通过设置特征重要性阈值筛选特征变量构成特征波长子集, 但该阈值范围的设定无理论依据, 因此需要对特征重要性阈值范围进行探究。 另一方面, 由于RF的随机特性, 特征波长子集中可能包含无效甚至是干扰变量, 并不能保证所选变量的有效性。 故而进一步提出RF-iPLS波长筛选方法。 区间偏最小二乘法(iPLS)筛选出的特征波长多为连续特征波段的特性, 对特征波长子集划分区间, 弥补RF因自身随机性造成的无效变量问题; 同时, RF筛选的离散特征波长解决了iPLS筛选的连续波段中含冗余信息的问题。 为了说明RF-iPLS算法的合理性, 特征子集经过蒙特卡洛(MC)方法500次样本特征采样后, 构建RF-MC-iPLS算法。 虽然RF-iPLS与RF-MC-iPLS算法结构接近, 但运行时间缩短了11.12%, 结果说明RF-iPLS算法在预测模型中的特征波长筛选是有效的, 且具有较低的时间复杂度。 为了进一步验证改进的RF-iPLS算法的有效性, 应用一组公开谷物蛋白质近红外光谱数据, 建立PLSR模型, 并与全谱的PLSR模型以及基于不同波长筛选方法的PLSR模型进行比较。 实验结果表明, 相比于全谱的117个波长, RF-iPLS优选出12个特征波长, 建模集的RMSEC从2.61降到0.64, 预测精度提升了约75.5%, 预测集的RMSEP从2.63降到0.69, 预测精度提升了73.8%, 极大地提高了预测精度且预测结果最优, 说明RF-iPLS是一种有效的特征波长筛选方法, 可以简化近红外光谱定量分析模型的复杂度并实现高效降维。
波长筛选 特征重要性计算 谷物蛋白质含量 定量分析 Wavelength selection Feature importance calculation Grain protein content Quantitative analysis 
光谱学与光谱分析
2023, 43(4): 1043
作者单位
摘要
1 重庆邮电大学计算机科学与技术学院,重庆 400065
2 重庆市气象科学研究所,重庆 401147
为了减少高光谱图像中的冗余以及进一步挖掘潜在的分类信息,本文提出了一种基于特征重要性的卷积神经网络( convolutional neural networks,CNN)分类模型。首先,利用贝叶斯优化训练得到的随机森林模型( random forest,RF)对高光谱遥感图像进行特征重要性评估;其次,依据评估结果选择合适数目的高光谱图像波段,以作为新的训练样本;最后,利用三维卷积神经网络对所得样本进行特征提取并分类。基于两个实测的高光谱遥感图像数据,实验结果均表明:相比原始光谱信息直接采用支持向量机( support vector machine,SVM)和卷积神经网络的分类效果,本文所提基于特征重要性的高光谱分类模型能够在降维的同时有效提高高光谱图像的分类精度。
高光谱图像 特征重要性 波段选择 卷积神经网络 支持向量机 hyperspectral image, feature importance, band sele 
红外技术
2020, 42(12): 1185
作者单位
摘要
1 中国矿业大学(北京)地球科学与测绘工程学院, 北京 100083
2 华北理工大学, 河北 唐山 063210
铁矿是全球储量最高的金属矿产之一。 全铁含量是评价铁矿石、 铁矿粉品质的重要指标, 在铁矿开采、 矿石精选、 矿粉冶炼等生产环节中有特殊意义。 传统的铁矿粉全铁含量化学分析方法存在耗时久、 操作复杂、 污染严重等缺点, 因此, 探寻一种快速、 有效、 无污染的检测方法越来越成为矿山环境的研究热点。 高光谱技术具有光谱分辨率高、 曲线连续、 无损伤、 无污染、 可对物质特征或成分进行精确探测等特点。 使用铁矿粉高光谱数据, 通过建立用于光谱特征筛选的光谱特征重要性评分(SFIM)指标, 并结合随机森林回归(RFR)方法构建铁矿粉全铁含量预测的SFIM-RFR模型。 以河北省阳原县三义庄铁矿为研究区, 于2018年11月与2019年3月在研究区收集铁精粉、 铁尾砂原料, 分别制作第一批次的训练组和验证组铁矿粉试样以及第二批次的二次验证组铁矿粉试样, 并使用ASD Field Spec4型光谱仪测量试样的光谱反射率; 然后使用第一批次的训练组光谱数据训练SFIM-RFR模型, 对第一批次的验证组样本的全铁含量进行预测, 同时采用常规RFR、 线性回归(LR)预测模型来对比分析铁矿粉样本全铁含量预测结果; 最后使用二次验证组光谱数据检验多模型鲁棒性。 结果表明: SFIM-RFR, RFR和LR模型全铁含量预测结果与2018年11月采集的验证组样本全铁含量真实值的确定系数(R-Square)分别为0.991 8, 0.988 4和0.898 7, 均方根误差(RMSE)分别为0.016 9, 0.020 1和0.059 6, 多模型预测效果总体较好, SFIM-RFR模型预测结果误差最小, 说明了SFIM-RFR模型用于预测铁矿粉中全铁含量的可行性和有效性, 且SFIM-RFR模型预测效果优于常规的预测模型; SFIM-RFR, RFR和LR模型全铁含量预测结果与2019年3月采集的二次验证组样本全铁含量真实值的R-square分别为0.976 8, 0.974 5和0.914 0, RMSE分别为0.034 6, 0.036 2和0.071 9, 证明了SFIM-RFR模型的预测效果较为理想且鲁棒性很强。
高光谱 铁矿粉全铁含量 预测模型 光谱特征重要性评分 随机森林回归 Hyperspectral Total iron contents of iron ore powder Prediction model SFIM Random forest regression 
光谱学与光谱分析
2020, 40(8): 2546
作者单位
摘要
长春师范大学 计算机科学技术学院, 吉林 长春 130032
土壤温度是地球科学多个领域的重要变量。其时空变化受多种环境因素影响, 这对土壤温度的准确预测带来巨大挑战。以机器学习为核心的数据驱动方法, 在土壤温度预测中是重要研究领域, 为基于物理过程模型提供重要补充。然而目前针对土壤温度影响因素量性研究较少, 因此本文提出XGBoost-LSTM的数据驱动方法。基于极限梯度提升算法(XGBoost)分析土壤温度影响因素的重要性, 然后根据影响因素重要性依次组合, 并输入至长短期记忆网络(LSTM), 得到最优预测模型并实现土壤温度预测。最后在长白山和海北两个气象站完成实验, 本文方法的最优均方根误差为2.234、平均绝对误差为1.716、纳什效率系数为0.932、LMI系数为0.729和威尔莫特一致性指数为0.983。结果表明本文提出的XGBoost-LSTM预测模型与目前土壤温度中常用的数据驱动模型相比, 均表现出更高的精确度。
土壤温度预测 长短期记忆网络 极限梯度提升 特征重要性 数据驱动方法 soil temperature estimation long short-term memory extreme gradient data-driven method weight of feature 
光学 精密工程
2020, 28(10): 2337
作者单位
摘要
1 北大学计算机与控制工程学院, 山西 太原 030051
2 北大学信息与通信工程学院, 山西 太原 030051
激光扫描与测距系统(LIDAR)所获取的点云数据能够表达地物的三维信息,而光谱相机能够获得同场景的四个波段的多光谱信息。二者从不同的侧面表现了地物的特征,但不同特征对分类精度的贡献具有较大的差异。提取不同类型的地物特征,将特征分成四组;以随机森林为分类框架,得到不同特征子集的重要性测度和每个像元对各类别的隶属度;提出自适应D-S 证据方法对各特征子集的分类证据进行合成,实现地物类别信息提取。充分利用两分类器的优点挖掘分析遥感不确定性信息,实验结果表明,分类精度达到90%,能够达到应用要求。但通过进一步分析,由于仍然是像元级的处理,初始分类结果在特殊区域存在混淆现象,影响了分类精度,通过采用基于空间限制的方法对混淆区域分类结果进行优化,提高了分类精度。
图像处理 随机森林 D-S 证据合成 地物分类 激光雷达 特征重要性 
激光与光电子学进展
2016, 53(3): 031001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!