作者单位
摘要
新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆维吾尔自治区重点实验室“新疆干旱区湖泊环境与资源实验室”, 新疆 乌鲁木齐 830054
高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。 旨在寻求特征波段筛选的最佳算法, 以实现土壤重金属铅含量的准确监测, 为土壤污染防治提供参考。 以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源, 利用蒙特卡洛交叉验证(MCCV)算法确定92个有效土壤样品, 通过相关分析选取倒数对数一阶微分变换处理的光谱数据, 采用随机蛙跳(RF)算法, 并结合竞争性自适应重加权(CARS)算法、 迭代保留有效信息变量(IRIV)算法及连续投影算法(SPA), 构建RF-CARS、 RF-IRIV及RF-SPA三种算法对波段进行筛选。 以倒数对数一阶微分变换处理下的特征波段反射率为自变量, 土壤重金属铅含量为因变量, 采用极端梯度提升(XGBoost)和地理加权回归(GWR)方法构建土壤重金属铅含量估测模型。 结果表明: (1)光谱变换处理可有效增强光谱与土壤铅含量的敏感性, 其中倒数对数一阶微分变换后的土壤光谱特征更为明显, 相关系数可达到0.620(p<0.001)。 (2)RF-CARS、 RF-IRIV及RF-SPA算法分别从高光谱数据中筛选出6、 9和7个特征波段, 全部位于近红外光谱区域, 3种算法具有较强的特征提取能力, 极大减少光谱数据中的冗余信息。 (3)基于RF-IRIV算法构建的土壤铅含量估测模型的精度和稳定性高于RF-CARS和RF-SPA算法构建的模型, 说明RF-IRIV算法能更为准确的保留与土壤铅含量相关的波段。 此外, GWR模型的性能优于XGBoost模型, 构建的RF-IRIV-GWR模型具有较好的预测能力, 可作为研究区土壤铅含量的最优估测模型, 其验证集的决定系数(R2)为0.892, 均方根误差(RMSE)为0.825 mg·kg-1, 相对分析误差(RPD)为3.09。 基于随机蛙跳(RF)与迭代保留有效信息变量(IRIV)算法, 结合地理加权回归(GWR)建模方法在快速准确估测土壤铅含量方面具有一定优势, 可进行土壤重金属污染的动态监测。
特征波段 随机蛙跳算法 竞争性自适应重加权算法 迭代保留有效信息变量算法 连续投影算法 极端梯度提升 地理加权回归 土壤铅 Feature band Random frog algorithm Competitive adaptive reweighted sampling algorithm Iteratively retaining informative variables algori Successive projections algorithm Extreme gradient boosting Geographically weighted regression Soil lead 
光谱学与光谱分析
2023, 43(10): 3302
作者单位
摘要
石河子大学机械电气工程学院/农业农村部西北农业装备重点实验室, 新疆 石河子 832003
棉花杂质在轧棉过程中对棉纤维造成损伤, 导致成品纺织品出现瑕疵。 因此, 杂质的检测和分类在棉花生产过程及质量检验中至关重要。 地膜是我国机采棉中特有的杂质。 该研究将包括地膜碎片等12种常见棉花杂质放置于两层皮棉层之间, 采用推扫式高光谱成像系统在透射模式下对杂质与皮棉混合样本进行图像采集, 在400~1 000 nm范围内利用光谱信息识别嵌在皮棉层中的12种杂质。 首先对高光谱图像进行平场校正, 对边缘噪声进行裁剪; 选择500 nm处灰度图像进行人工感兴趣区域(ROIs)提取, 从ROIs提取皮棉和杂质平均透射光谱并进行标准化; 使用典型判别分析(CDA)对皮棉和杂质光谱进行处理并利用前三个典型变量绘制散点图, 观察散点分组情况, 采用多变量方差分析(MANOVA)对前三个典型变量评估每两种杂质之间的差异。 然后使用区间随机蛙跳(iRF)方法提取特征波段, 采用支持向量机(SVM)分类器, 分别对全波段及特征波段的透射光谱进行杂质和皮棉13个类别的分类研究, 对比分析两次分类的准确率。 结果表明, 全波段的各类杂质和皮棉的平均分类准确率为84.4%, 该方法对棉花内层杂质的检测与分类是可行的, 包括与皮棉外观相近的地膜、 塑料包装和纸的分类效果较好。 在提取12个特征波段后, 4种具有相似外观和相似化学成分的杂质(裂茎、 茎皮、 棉铃壳、 棕叶)分类准确率较低但都超过73%; 棉籽、 绿叶、 纸片、 塑料包装、 地膜、 皮棉的分类准确率均超过90%; 各类杂质和皮棉的平均分类准确率为86.2%; 与全波段光谱的分类结果相比, 特征波段光谱的平均分类准确率提高1.8%。 该研究结果可为棉花内层杂质检测研究提供理论依据, 并对高光谱透射成像技术的应用有较好的指导作用。
棉花杂质分类 高光谱成像 透射 随机蛙跳 特征波长提取 Foreign matter classification Hyperspectral imaging Transmittance images Interval Random Frog Feature selection 
光谱学与光谱分析
2023, 43(10): 3230
作者单位
摘要
1 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163319
3 黑龙江省农业科学院绥化分院, 黑龙江 绥化 152052
4 大庆市绿色农产品监测中心, 黑龙江 大庆 163311
大豆品种快速准确的鉴别, 对于鉴定种子品质、 净化种业市场以及保障粮食安全具有重要意义。 为解决传统农作物品种鉴别方法中存在精度差和效率低等问题, 采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型, 对黑龙江省4个高蛋白大豆品种(黑农88、 黑农98、 绥农71以及绥农76)进行快速鉴别。 随机蛙跳(RF)算法是一种通过迭代计算变量被选概率, 以确定变量重要性的新型特征波长选择算法, 可以有效剔除全光谱数据中的冗余信息。 该方法存在初始变量集随机性、 所需迭代次数大、 阈值选取不确定的问题, 因此提出一种基于最小绝对收敛与选择算子(LASSO)回归的改进随机蛙跳(MRF)算法。 采用LASSO算法提取与属性变量最相关的特征波长点作为RF初始变量集F0, 消除初始变量的随机性, 在此基础上开始迭代计算, 可以减少无用迭代次数, 提高模型的预测精确度。 RF算法通过设定阈值的方法选择变量, 因此提取的特征波长往往具有不确定性。 改进如下: 首先去除被选概率为0的变量, 对于排序后变量以10个波长点为间隔, 每次增加1个间隔建立特征波长与大豆品种属性的偏最小二乘回归模型, 当交叉验证均方根误差(RMSECV)取最小值时的建模波长为优选特征波长。 以MRF优选特征波长作为输入变量建立PLS鉴别模型, 并与全光谱以及常用的RF、 LASSO和ElasticNet特征波长选择算法建模结果进行对比分析。 结果表明, MRF算法提取300个特征波长点, 仅占全谱波长的9.37%, 有效筛选了关键特征变量, 简化了模型复杂度。 预测结果中均方根误差(RMSEP)和决定系数(R2p)分别为0.246 9和0.951 2, 识别准确率达到100%, 为所有模型中最优。 拉曼光谱结合MRF算法可以实现大豆品种的快速鉴别, 同时也为其他农作物品种的快速鉴别提供了一种新思路。
拉曼光谱 大豆 特征波长选择 随机蛙跳 最小绝对收敛与选择算子 Raman spectroscopy Soybean Characteristic wavelength selection Random frog LASSO 
光谱学与光谱分析
2023, 43(12): 3763
作者单位
摘要
1 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
润滑油是农业机械正常作业的必要物资, 农业机械发动机工作的动力性、 安全性、 经济性以及寿命与润滑油状况有着紧密联系。 污染浓度作为油液的综合评价指标, 常规的实验室检测耗时长、 成本高, 所以开发高效的润滑油污染浓度检测技术具有重要意义。 提出了一种基于近红外光谱技术的农机润滑油污染浓度的检测方法, 同时针对随机蛙跳(RF)特征波长选择算法中迭代次数大, 结果再现性低等缺点, 提出了一种迭代保留信息变量的随机蛙跳(IRIV-RF)特征波长选择算法。 该算法一方面利用迭代保留信息变量(IRIV)算法提取出强信息变量和弱信息变量, 将其作为RF算法中的初始变量集, 消除初始变量集的随机性对结果再现性的影响。 另一方面通过对变量按被选概率值由大到小正向排序后, 从首个波长开始依次增加一个波长建立偏最小二乘回归(PLSR)模型, 选择交叉验证均方根误差(RMSECV)值最小时的变量子集为特征波长, 消除RF算法所提取的特征波长数量的不确定性。 利用近红外光谱仪采集自行配制的101份不同污染浓度的农机润滑油原始光谱数据, 选用三种不同的预处理方法分别对原始光谱进行处理, 确定最佳的预处理方法为变量标准化(SNV)。 在此基础上通过RF, IRIV和IRIV-RF三种算法分别对全谱进行特征波长选择, 并建立PLSR模型。 通过对全谱-PLSR, RF-PLSR, IRIV-PLSR以及IRIV-RF-PLSR模型的预测精度进行比较, 结果表明, 经过IRIV-RF算法提取特征波长后所建立的PLSR模型预测精度最高, 预测相关系数(Rp)为0.965 7, 预测均方根误差(RMSEP)为9.0584, 显著提升了预测精度与运行效率, 降低模型复杂程度。 IRIV-RF是一种有效的特征波长选择算法, 研究证明了近红外光谱联合改进的IRIV-RF算法检测农机润滑油污染浓度的可行性, 为鉴定润滑油品质提供了一种新的思路。
特征波长选择 随机蛙跳 迭代信息保留变量 农机润滑油 污染浓度 近红外光谱 Feature wavelength selection Random frog Iteratively retains informative variables Agricultural lubricating oil Pollution concentration Near-infrared spectroscopy 
光谱学与光谱分析
2022, 42(11): 3482
刘杨 1,4,5张涵 2冯海宽 1,3,5孙乾 1,5[ ... ]杨贵军 1,5
作者单位
摘要
1 农业部农业遥感机理与定量遥感重点实验室,北京农业信息技术研究中心,北京 100097
2 University of New South Wales,Sydney NSW 2052,Australia
3 南京农业大学国家信息农业工程技术中心,江苏 南京 210095
4 山东科技大学测绘科学与工程学院,山东 青岛 266590
5 国家农业信息化工程技术研究中心,北京 100097
地上生物量(AGB)的精准监测是农田生产管理的重要环节, 因此快速准确地估算AGB, 对于精准农业的发展十分重要。 传统上, 获取AGB的方法是采用破坏性取样法, 这使得大面积、 长期的测量变得困难。 无人机高光谱遥感因具有机动性强、 光谱分辨率高和图谱合一的优势, 成为当前估算大面积作物AGB最有效的技术手段。 该研究通过无人机平台搭载成像高光谱传感器分别获取马铃薯块茎形成期、 块茎增长期、 淀粉积累期的冠层高光谱影像以及利用烘干称重法获取相应生育期实测AGB数据。 然后, 采用相关性分析法(CAM)、 随机蛙跳算法(RFM)和高斯过程回归波长分析工具(GPR-BAT)分别筛选冠层原始光谱(COS)和一阶导数光谱(FDS)的敏感波长, 结合偏最小二乘回归(PLSR)和高斯过程回归(GPR)构建各生育期的AGB估算模型, 并对比不同模型的估测效果。 结果显示: (1)基于同种方法分别筛选COS和FDS的特征波长, 结合2种回归技术估算AGB的效果均从块茎形成期到淀粉积累期由好变差。 (2)基于FDS分别通过3种方法筛选的特征波长, 通过同种回归技术构建的模型效果要优于基于COS的相应效果。 (3)基于COS和FDS使用CAM, RFM和GPR-BAT方法筛选的特征波长个数在块茎形成期分别为28, 12, 6个和12, 23, 10个, 在块茎增长期分别为32, 8, 2个和18, 28, 4个, 在淀粉积累期分别为30, 15, 3个和21, 33, 5个。 (4)各生育期基于COS和FDS通过3种方法筛选的敏感波长估算AGB效果由高到低依次均为GPR-BAT, RFM和CAM。 (5)各生育期基于FDS通过GPR-BAT方法筛选的敏感波长, 结合PLSR建立的模型精度更高、 稳定性更强, R2分别为0.67, 0.73和0.65, NRMSE分别为16.63%, 15.84%和20.81%。 研究表明利用无人机高光谱成像技术可以准确地估算AGB, 这为实现马铃薯作物长势动态监测, 提供科学指导和参考。
马铃薯 无人机 成像高光谱 随机蛙跳 高斯过程回归 地上生物量 Potato UAV Imaging hyperspectral Random frog Gaussian process regression Above-ground biomass 
光谱学与光谱分析
2021, 41(9): 2657
作者单位
摘要
1 陕西科技大学电气与控制工程学院, 陕西 西安 710021
2 陕西科技大学电子信息与人工智能学院, 陕西 西安 710021
红参中提取出的有效活性成分人参皂苷含量对后续产品的质量有重要的影响。 传统的红参提取质量控制化学检测方法成本高, 具有滞后性。 已有的研究表明快速无损的近红外检测方法用于红参提取过程具有可行性, 但现有方法依赖仪器自带数据处理软件, 无法满足生产实际的精度和速度需求。 为实现红参提取过程的快速、 精确监测, 提出将多种智能光谱筛选算法应用在近红外光谱建模中, 并对比不同光谱筛选算法的性能和稳健性。 以红参提取液中含量高的人参皂苷Rg1和含量较低的人参皂苷Rc为目标, 采集了三个不同批次前两次红参提取液样本128份, 在线获取1 000~2 499 nm波段近红外原始光谱吸光度数据, 并同时采用国标方法高效液相色谱法测定目标人参皂苷含量, 首先采用竞争适应性重加权采样法(CARS)、 无信息变量消除法(UVE)、 随机蛙跳算法(RF)和连续投影算法(SPA)四种波长筛选算法进行波长降维处理, 然后使用筛选后的波长建立线性偏最小二乘(PLS)定量模型, 并通过模型的均方根误差(RMSE)、 决定系数(R2)和预测相对分析误差(RPD)等来评估模型的性能。 从四种波长优选算法PLS建模结果可知, 经RF优选后, 建模特征波长变量下降为原来的0.67%, 红参提取液中人参皂苷Rg1和Rc含量的R2都达到了0.94以上, 预测均方误差分别为0.024 6和0.013 5, 预测集相对分析误差达到了4.84以上, 降低了建模的难度, 提高了建模的精度; 将RF和CARS在原始光谱、 全光谱、 SNV预处理后的全光谱上建模对比, RF波长筛选算法建模模型的性能整体较好, 不同的光谱范围和预处理方法下性能影响较小, 稳健性好。 综上表明RF是红参提取液建模相对理想的波长筛选算法, 基于RF的PLS算法实现了对红参两次提取液的一次建模, 可用于提取液中人参皂苷成分含量的快速检测, 为药物的在线提取控制提供理论支撑。
近红外光谱 红参提取 随机蛙跳 稳健性 人参皂苷 Near infrared spectroscopy Red ginseng extraction RF Robustness Ginsenoside 
光谱学与光谱分析
2021, 41(8): 2443
撒继铭 1,2,3江河 1,*谢凯文 1顾瀚文 1[ ... ]张朱珊莹 3,4,5,**
作者单位
摘要
1 武汉理工大学信息工程学院, 湖北 武汉 430070
2 宽带无线通信与传感器网络湖北省重点实验室, 湖北 武汉 430070
3 医学信息分析及肿瘤诊疗湖北省重点实验室, 湖北 武汉 430074
4 中南民族大学生物医学工程学院, 湖北 武汉 430074
5 中南民族大学认知科学国家民委重点实验室, 湖北 武汉 430074
在随机蛙跳算法的基础上,提出了一种改进的窗口随机蛙跳算法,即使用连续窗口代替单个波长点,所提算法提高了原蛙跳算法的寻优精度,降低了随机蛙跳算法的迭代次数,从而提高了算法的收敛速度。血液样本的实验结果表明,相较于全波段,建立的偏最小二乘法模型的预测均方根误差下降了47.9%,预测集相关系数Rp提高了4.07%,证明了所提算法的有效性。通过对3种主流算法及改进随机蛙跳算法筛选出的特征波长建立回归分析模型,证明了改进算法在特征波长选择上的优越性。
光谱学 红外光谱 随机蛙跳算法 定量分析 特征波长选择 
光学学报
2021, 41(15): 1530001
作者单位
摘要
黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
在近红外光谱的建模预测分析中, 数据的冗余及共线性会严重影响模型的预测精度和稳健性。 特征波长选择是提高定量分析预测精度的一种有效方法。 随机蛙跳(RF)是一种依据不同的变量具有不同的被选择可能性的特征波长选择算法, 近年来在特征波长提取方面展现良好的性能。 该方法通过多次迭代, 计算每个变量被选择的概率, 以优选概率高的变量为特征波长。 但由于其初始变量集V0的产生是随机的, 具有较大的不确定性, 可能会包含无用或干扰信息, 难以保证初始信息的有效性, 使得迭代次数过大, 运行时间过长。 故而提出一种改进的联合区间随机蛙跳(Si-RF)特征波长选择算法, 通过联合区间偏最小二乘法(SiPLS)对全谱进行变量初选, 此时得到的波长对目标变量变化最为敏感, 将其作为RF的初始变量子集, 以解决RF运行时间较长、 效率较低的问题。 另一方面, RF在选择特征波长时, 选择被选概率值大于阈值的变量为特征波长, 但对概率值阈值的设定无理论依据, 易受人为因素影响。 通过对变量按被选概率值降序排列后逐次增加一个波长建立多元线性回归(MLR)模型, 以验证均方根误差(RMSEV)值最低时的变量子集为特征波长, 以找到预测精度最高点所包含的波长, 提高预测精度。 针对上述两点进行改进, 将其应用于一组土壤样本近红外光谱数据集, 进行特征波长选择后, 建立MLR模型, 与RF-MLR及全谱-PLSR模型的预测精度进行比较。 结果表明: RF经过10 000次迭代, 优选出10个波长点, 建立的MLR模型的预测均方根误差(RMSEP)为1.6276; 而改进后Si-RF只需进行1 000次迭代, 优选出17个波长点, 其MLR模型的RMSEP减小到0.818 4, 大大提升了预测精度, 提高运行效率。 相较于全谱, 也极大的提高了预测精度, 简化模型的复杂度, 证明改进的Si-RF是一种有效的特征波长选择算法。
近红外光谱 特征波长选择 多元校正 随机蛙跳 联合区间偏最小二乘 Near-infrared spectroscopy Feature wavelength selection Multivariate calibration Random frog Synergy interval partial least squares 
光谱学与光谱分析
2020, 40(11): 3451
作者单位
摘要
东北农业大学电气与信息学院, 黑龙江 哈尔滨 150030
粗蛋白(CP)是评价牧草营养价值和品质参数的关键指标。 快速、 准确地对牧草中粗蛋白含量进行评估在畜牧业生产研究中具有重要意义。 为确定牧草粗蛋白含量的高光谱特征波段及最优检测模型, 研究分别于2017年5月至9月间在黑龙江省杜尔伯特自治区的人工牧草场(羊草)内每月随机选取35个样本, 5个月共采集175个样本。 采样时在样本点处放置1 m×1 m的样方, 将样方内所有牧草全部齐地面收割采集后称重并冷藏保存。 将样本带回实验室后, 立即进行牧草叶片高光谱图像采集, 同时采用凯氏定氮法对采集的牧草样本进行粗蛋白化学值测定, 以此建立牧草粗蛋白含量高光谱数据集。 研究首先通过Savitzky-Golay卷积平滑(SG)、 多元散射校正(MSC)、 变量标准化(SNV)、 一阶导数(1-Der)和直接正交信号校正(DOSC)方法5种预处理方法对高光谱数据进行处理后分别建立偏最小二乘回归(PLSR)检测模型, 从中确定最优预处理方法。 利用最优预处理结果, 分别采用连续投影算法(SPA)和随机蛙跳算法(RF)进行牧草粗蛋白含量的特征波段选择, 并利用选择结果分别进一步建立PLSR模型, 以此确定适合粗蛋白含量的特征波段选择方法, 确定最优高光谱检测模型。 结果表明, 在五种高光谱预处理方法中, 基于SNV方法预处理后所建立的高光谱PLSR模型表现最优(R2-P=0.929, RMSE-P=6.344 mg·g-1, RPD=4.204)。 利用连续投影算法筛选的粗蛋白含量特征波长为30个, 分布于530~700和940~1 000 nm范围内。 经随机蛙跳算法确定的粗蛋白含量特征波段为6个, 分别为826.544, 827.285, 828.766, 971.012, 972.494和973.235 nm。 因此, 该研究中牧草粗蛋白含量最优高光谱检测模型为SNV-RF-PLSR(R2-P=0.933, RMSE-P=6.034 mg·g-1, RPD=4.322), 模型精度较高。 该研究结果为牧草粗蛋白含量的高光谱检测提供了最优模型和理论基础, 同时为指导草业生产开拓了新的技术思路。
牧草 粗蛋白, 高光谱成像 连续投影算法 随机蛙跳算法 Pasture Crude protein Hyperspectral Successive projections algorithm Random frog 
光谱学与光谱分析
2019, 39(10): 3245
作者单位
摘要
1 宁夏大学 农学院, 宁夏 银川 750021
2 宁夏尚农生物科技产业发展有限公司, 宁夏 固原 756000
利用可见/近红外(400~1 000 nm)及近红外(900~1 700 nm)高光谱成像技术结合特征波长筛选方法对安格斯牛、力木赞牛、西门塔尔牛3个品种的牛肉进行鉴别研究,且测定肉样的色泽、嫩度、pH值以及水分、脂肪、蛋白质含量。根据不同波段光谱的特点,分别对原始光谱进行预处理,并利用SPA、IRF和IRF-SPA方法筛选特征波长,建立基于全波段及特征波长下的PLS-DA牛肉品种鉴别模型。结果显示:400~1 000 nm波段采用SNV-IRF-SPA-PLS-DA方法建立的模型最优,校正集与预测集准确率分别为98.56%和97.12%,900~1 700 nm波段采用SG-SPA-PLS-DA方法建立的模型准确率为94.09%和96.04%,说明不同波段高光谱对牛肉品种识别均有较好的效果;400~1 000 nm波段的识别准确率优于900~1 700 nm,说明3种牛肉在色泽纹理上的差异比成分含量显著。研究表明,利用高光谱成像技术结合特征波长筛选方法能够获得较好的牛肉品种鉴别效果。
高光谱成像技术 特征波长 牛肉品种 多波段识别 间隔随机蛙跳 hyperspectral imaging technology characteristic wavelengths beef breeds multichannel recognition interval random frog 
发光学报
2019, 40(4): 520

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!