作者单位
摘要
新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆维吾尔自治区重点实验室“新疆干旱区湖泊环境与资源实验室”, 新疆 乌鲁木齐 830054
高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。 旨在寻求特征波段筛选的最佳算法, 以实现土壤重金属铅含量的准确监测, 为土壤污染防治提供参考。 以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源, 利用蒙特卡洛交叉验证(MCCV)算法确定92个有效土壤样品, 通过相关分析选取倒数对数一阶微分变换处理的光谱数据, 采用随机蛙跳(RF)算法, 并结合竞争性自适应重加权(CARS)算法、 迭代保留有效信息变量(IRIV)算法及连续投影算法(SPA), 构建RF-CARS、 RF-IRIV及RF-SPA三种算法对波段进行筛选。 以倒数对数一阶微分变换处理下的特征波段反射率为自变量, 土壤重金属铅含量为因变量, 采用极端梯度提升(XGBoost)和地理加权回归(GWR)方法构建土壤重金属铅含量估测模型。 结果表明: (1)光谱变换处理可有效增强光谱与土壤铅含量的敏感性, 其中倒数对数一阶微分变换后的土壤光谱特征更为明显, 相关系数可达到0.620(p<0.001)。 (2)RF-CARS、 RF-IRIV及RF-SPA算法分别从高光谱数据中筛选出6、 9和7个特征波段, 全部位于近红外光谱区域, 3种算法具有较强的特征提取能力, 极大减少光谱数据中的冗余信息。 (3)基于RF-IRIV算法构建的土壤铅含量估测模型的精度和稳定性高于RF-CARS和RF-SPA算法构建的模型, 说明RF-IRIV算法能更为准确的保留与土壤铅含量相关的波段。 此外, GWR模型的性能优于XGBoost模型, 构建的RF-IRIV-GWR模型具有较好的预测能力, 可作为研究区土壤铅含量的最优估测模型, 其验证集的决定系数(R2)为0.892, 均方根误差(RMSE)为0.825 mg·kg-1, 相对分析误差(RPD)为3.09。 基于随机蛙跳(RF)与迭代保留有效信息变量(IRIV)算法, 结合地理加权回归(GWR)建模方法在快速准确估测土壤铅含量方面具有一定优势, 可进行土壤重金属污染的动态监测。
特征波段 随机蛙跳算法 竞争性自适应重加权算法 迭代保留有效信息变量算法 连续投影算法 极端梯度提升 地理加权回归 土壤铅 Feature band Random frog algorithm Competitive adaptive reweighted sampling algorithm Iteratively retaining informative variables algori Successive projections algorithm Extreme gradient boosting Geographically weighted regression Soil lead 
光谱学与光谱分析
2023, 43(10): 3302
作者单位
摘要
电子科技大学自动化工程学院, 四川 成都 611731 电子科技大学长三角研究院(湖州), 浙江 湖州 313001
研究高效、 准确、 便捷的土壤重金属检测方法对于了解土壤的污染状况以及开展污染防治工作具有重要的意义。 由于X射线荧光光谱分析(XRF)技术具备快速、 准确、 无损检测、 样品制备简单等优势, 在土壤重元素定量检测获得广泛应用。 XRF仪器测试标准样品的荧光光谱并建立校准曲线, 通过反演计算得到待测样品的元素含量。 由于样品元素间存在基体效应, 以及荧光谱特征峰存在叠加干扰, 未经优化的校准曲线的线性度较差, 这给反演计算来困难。 为了解决上述问题, 分别利用小波变换、 非对称加权惩罚最小二乘法(arPLS)对光谱进行去噪和扣除本底基线, 提高校准曲线的决定系数(R2); 运用竞争性自适应重加权算法(CARS), 针对不同目标元素优化变量选取; 进一步地, 基于选取的变量建立粒子群算法(PSO)优化的支持向量机回归(SVR)模型, 并通过该模型反演计算各元素含量, 提高定量分析的准确度和预测的泛化能力。 实验结果显示, 经过小波去噪和arPLS本底扣除后的校准曲线的决定系数(R2)有明显提升, Cr、 Cu、 Zn、 As、 Pb分别从0.965、 0.979、 0.971、 0.794、 0.915提高为0.979、 0.987、 0.981、 0.828、 0.953; 通过CARS选取的谱线变量的个数大幅度减少, 从2 048个通道降低到30个以下, 为原来变量个数的1.5%, 提高了变量选择的精准性; 与偏最小二乘法(PLS)、 未优化的SVR模型进行对比, 采用CARS变量选择和PSO优化的SVR模型进行含量预测, 训练集R2C与测试集R2P的决定系数分别在0.99、 0.90以上, 预测准确性有明显提高。 因此, 所提出的竞争性自适应重加权算法和PSO优化的SVR定量分析模型对于土壤重金属元素定量分析具有较好的理论指导和应用价值。
X射线荧光光谱 土壤重金属 竞争性自适应重加权算法 粒子群算法 支持向量机回归模型 X-ray fluorescence spectroscopy Soil heavy metals Competitive adaptive reweighted sampling Particle swarm optimization Support vector regression 
光谱学与光谱分析
2023, 43(12): 3742
作者单位
摘要
华东交通大学 智能机电装备创新研究院, 南昌 330013
为了获得稳健的近红外光谱模型, 采用变量选择结合模型更新的方法, 以240个红富士苹果为对象, 取得近红外漫透射光谱和糖度数据, 建立偏最小二乘回归模型, 对苹果糖度含量进行预测, 并采用后向区间偏最小二乘法和竞争性自适应重加权算法, 对建模变量进行了选择, 通过将新批次中的一些样品加入到旧批次中重新校准来实现模型更新。结果表明,变量选择可以提高模型性能, 预测决定系数提高到0.7915, 预测均方根误差降低到0.5810, 预测偏差降至0.2627;结合模型更新策略, 可以进一步降低预测均方根误差和预测偏差;仅使用20个样品进行模型更新已经明显改善了模型性能, 预测决定系数提高到0.8506, 预测均方根误差降到0.4358, 预测偏差降到0.1045。这一结果对于多种水果建立稳健的近红外光谱模型是有帮助的。
光谱学 后向区间偏最小二乘 竞争性自适应重加权 苹果 模型更新 spectroscopy backward interval partial least squares competitive adaptive reweighted sampling apple model update 
激光技术
2023, 47(5): 666
作者单位
摘要
1 河南科技大学农业装备工程学院, 河南 洛阳 471003
2 机械装备先进制造河南省协同创新中心, 河南 洛阳 471003
3 江苏大学现代农业装备与技术教育部重点实验室, 江苏 镇江 212013
4 河南科技大学物理工程学院, 河南 洛阳 471023
圣女果可溶性固形物(SSC)含量对圣女果内部品质影响至关重要, 但基于高光谱成像及介电性质特征的SSC检测技术存在局限性, 且目前鲜见圣女果SSC无损检测模型。 为实现圣女果SSC的无损检测, 提出基于圣女果可见/近红外光谱特征的SCC预测模型构建, 及改进的BP神经网络算法研究, 以期解决圣女果内部品质的快速无损检测。 以圣女果为研究对象, 试验样本188个, 将其划分为训练集150个和测试集38个, 采用可见/近红外光谱采集系统获取350~1 000 nm范围内的圣女果表面反射强度, 经光谱校正得样本反射率, 为增强信噪比, 截取481.15~800.03 nm范围内的光谱波段作为有效波段进行分析。 通过对比三种预处理模型, 对有效波段进行SG平滑(Savitzky-Golay Smoothing)预处理, 建立BP神经网络预测模型, 测试集决定系数(R2)和均方根误差(RMSE)分别为0.578 5和0.563 9; 在此基础上, 对BP神经网络的网络结构进行改进, 寻求BP神经网络最优预测结构, 计算输出层与期望值间误差, 调整网络结构参数, 将隐含层学习率和神经元个数分别设置为0.01和5, 建立改进的BP神经网络模型(SG-IBP), 测试集R2和RMSE分别为0.981 2和0.102 3; 通过竞争自适应重加权采样算法(CARS)筛选出18个特征波段, 测试集R2和RMSE分别为0.997 8和0.047 9, 同时检测速度显著提升。 研究结果表明: 经过改进的BP神经网络模型性能明显提高, 通过CARS提取特征波段后, 测试集R2提高了0.419 3, RMSE降低了0.516, 检测速度明显提升。 采用CARS提取特征波段的改进BP神经网络模型(SG-CARS-IBP)具有明显的优越性, SG-CARS-IBP模型较为适合圣女果SSC无损检测研究。 该研究可为圣女果SCC的高效无损检测提供参考。
可见/近红外光谱 圣女果 改进BP神经网络模型 竞争自适应重加权采样算法 Visible/near-infrared spectroscopy Cherry tomato Improved BP neural network model Competitive adaptive reweighted sampling algorithm 
光谱学与光谱分析
2023, 43(3): 737
作者单位
摘要
内蒙古农业大学计算机与信息工程学院, 内蒙古 呼和浩特 010000
牛奶中包含着很多人体需要的营养元素, 如脂肪、 蛋白质、 钙等; 对牛奶营养元素进行分析是牛奶安全检测关键的一部分。 高光谱技术可以有效地结合图像和光谱数据识别牛奶种营养元素。 为了实现对牛奶中蛋白质含量快速、 精确的预测, 采用竞争性自适应重加权(CARS)算法选取特征波长, 并提出一种基于麻雀搜索算法(SSA)优化支持向量机(SVM)实现对牛奶蛋白质含量预测。 利用高光谱仪获取牛奶反射光谱(400~1 000 nm)。 通过选取归一化(N)、 标准化(Standardization)和多元散射校正(MSC)对原始的牛奶数据进行光谱降噪处理提高光谱利用率; 利用竞争性自适应重加权算法和连续投影算法(SPA)对经过处理的牛奶光谱数据提取特征波长, 求取蛋白质和光谱间的相关系数并进行重要性排序, 获取重要的特征波段; 最后, 通过遗传算法(GA)优化SVM, 粒子群算法(PSO)优化SVM和偏最小二乘法(PLS)算法对牛奶蛋白质进行预测并比较预测结果, 为了提高蛋白质预测的精度和模型稳定性, 提出利用SSA对SVM的核函数g和惩罚参数c进行优化, 以均方根误差(RMSE)作为适应度函数, 通过迭代选择最优的回归参数训练模型。 牛奶数据预测结果表明最优组合模型为: MSC-CARS-SSA-SVM。 模型测试集的决定系数R2为0.999 6, 均方根误差RMSE为0.001 1, 耗时4.112 1 s。 结果表明: 使用CARS算法能实现特征波段的提取和冗余信息的剔除, 从而提高模型效率, 简化了算法的复杂度; SSA算法优化SVM的参数, 通过迭代更新麻雀最优位置, 可以快速得到全局最优解, 与SVM, GA-SVM, PSO-SVM和PLS相比, 牛奶蛋白质的预测准确度和模型稳定性都得到了明显提高, 满足了对乳品检测的精确度要求, 是快速检测牛奶蛋白质的一个可行新方法。 为光谱模型的优化及预测模型精度的提高提供参考。
高光谱 牛奶蛋白质 竞争性自适应重加权算法 支持向量机 麻雀算法 Hyperspectral Milk protein Competitive adaptive reweighted sampling Support vector machine The sparrow search algorithm 
光谱学与光谱分析
2022, 42(5): 1601
作者单位
摘要
南京理工大学电子工程与光电技术学院, 江苏 南京 210094
对转炉炼钢终点的实时精准控制能够有效提高钢铁产出的质量, 炉口火焰光谱在炼钢不同时期的变化明显, 对其进行分析处理并与机器学习方法相结合可有效用于炼钢终点的实时控制。 针对炉口火焰光谱数据量大、 现有方法对光谱特征提取在可信度和实时性上不足的缺陷, 提出一种基于窗口竞争性自适应重加权采样(WCARS)结合迭代式连续投影算法(ISPA)的光谱特征波长选择方法, 该方法在有效解决模型过拟合问题的同时, 能够降低高维数据计算的复杂度。 将火焰光谱数据沿波长方向进行窗口划分后, 使用CARS进行计算选出特征窗口波段, 再将迭代式选择与传统连续投影算法相结合, 通过重复迭代精选出特征波长, 在此基础上使用支持向量机回归(SVR)建立炼钢终点碳含量预测模型。 实验采集363组炼钢后期的炉口火焰光谱数据作为样本, 并对其进行Savitzky-Golay平滑预处理。 使用WCARS-ISPA算法从全光谱数据中选出10个特征波长作为SVR模型的输入, 碳含量为模型输出, Kennard-stone算法对训练集和测试集进行划分, 选择碳含量的平均预测误差、 预测误差在±2%以内的命中率以及运行30次的平均时间作为模型评价指标。 实验结果显示, 模型的平均碳含量预测误差为1.413 2%, 命中率高达90.63%, 运行时间为0.019 679 s。 与使用全光谱和WCARS-ISPA, CARS-SPA, WCARS和SPA四种不同特征选择方法选出的特征波长建模得到的结果进行对比, 基于WCARS-ISPA方法选出的特征波长建立的终点碳含量预测模型误差最小、 命中率最高。 提出一种新的炉口火焰光谱特征波长提取方法, 使用窗口竞争性自适应重加权采样结合迭代式连续投影算法选取特征波长, 并在此基础上建立转炉炼钢终点碳含量预测模型, 实验结果表明, 该方法能够有效提取火焰光谱特征, 所建模型能够对转炉炼钢终点进行准确预测, 满足工业生产的实时控制要求, 为实际生产提供可靠帮助。
转炉炼钢 火焰光谱 窗口竞争性自适应重加权采样 迭代式连续投影算法 终点预测 BOF steelmaking Flame spectra Window competitive adaptive reweighted sampling Iterative successive projection algorithm End-point prediction 
光谱学与光谱分析
2021, 41(8): 2332
作者单位
摘要
1 桂林电子科技大学计算机与信息安全学院, 广西 桂林 541004
2 桂林电子科技大学商学院, 广西 桂林 541004
3 北京邮电大学人工智能学院, 北京 100876
4 中国食品药品检定研究院, 北京 100050
近红外光谱分析技术对检测样品无损伤且检测速度快、 精度高, 因此被广泛应用在了药品检测、 石油化工等领域, 尤其近年来机器学习和深度学习建模方法的深入应用使其具备了更准确的检测性能。 然而, 样品的近红外光谱数据具有比较高的维度且存在谱间重合、 共线性和噪声等问题, 对近红外光谱模型的性能产生消极影响, 此时样品有效特征波长的筛选极为重要。 为了提高近红外光谱定量和定性分析模型的准确性和可靠性, 提出了一种近红外光谱变量选择方法, 其结合了最小角回归(LAR)和竞争性自适应重加权采样(CARS)的优点, 具有更优的性能。 该方法利用LAR初步筛选样品全谱区的特征波长, 接着利用CARS对筛选出来的特征波长进一步选择, 从而有效去除无关特征波长。 为验证该方法的有效性, 从定量和定性分析两个方面评价该方法。 在定量分析实验中, 以FULL, LAR, CARS, SPA和UVE作为对比方法, 以药品样品数据集为实例建立PLS回归分析模型, 经LAR-CARS筛选出的变量建立的PLS模型在药品数据集表现出较高的预测决定系数和较低的预测标准偏差。 在定性分析实验中, 以SVM, ELM, SWELM和BP作为对比方法、 不同比例训练集的药品数据集为实例建立分类模型, 经LAR-CARS筛选出的变量建立的SVM分类模型精度最高达100%。 从实验结果可见, LAR-CARS可有效的筛选出表征样品特征的波长, 利用其筛选出的波长建立的定量、 定性分析模型具有更好的鲁棒性, 可用于样品光谱的特征波长筛选。
近红外光谱 波长筛选 最小角回归 自适应重加权采样 Near infrared spectroscopy Wavelength selection Least angle regression Competitive adaptive reweighted sampling 
光谱学与光谱分析
2021, 41(6): 1782
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
生鲜调理牛排超过货架期时, 其散发的腐败气味易被调料气味掩蔽, 使消费者难以分辨。 挥发性盐基氮(TVB-N)是表征肉品新鲜度的有效指标。 由于测定TVB-N含量的化学方法繁琐耗时, 利用高光谱对生鲜调理牛排中TVB-N含量进行预测, 并讨论了不同波长选择算法所建模型的预测效果。 分别在第0, 2, 4, 6, 8天取出制备好的生鲜调理牛排, 进行高光谱数据采集和TVB-N含量测定。 采用1st Der, 2nd Der, MC, MSC, SG和SNVT六种光谱预处理方法对光谱数据进行预处理, 并建立偏最小二乘模型(PLS)优选出最佳预处理方法。 采用竞争性自适应重加权算法(CARS)、 变量组合集群分析法 (VCPA)、 间隔随机蛙跳(iRF)、 iRF-CARS、 iRF-VCPA等方法对预处理后的光谱数据进行波长选择, 建立特征波长下的预测模型。 将CARS和VCPA重复运行50次考察其稳定性, 并选择频次较高波长建模与单次运行比较。 结果表明: 在六种光谱预处理方法中, 1st Der为最佳预处理方法。 CARS和VCPA单次运行时分别选择了21和11个波长, 其中VCPA选择波长建模预测效果更好, 模型的RCRP分别为0.944和0.931, RMSECV和RMSEP分别为1.12和1.28 mg·(100 g)-1。 统计CARS和VCPA重复运行50次时各波长被选择频次, 结果表明VCPA因其二进制矩阵采样法(BMS)为每个变量提供相同的采样机会而有更好的稳定性。 同时发现两种方法有共同的高频次波长: 694.9, 696.6, 761.8, 763.5, 811.5和813.3 nm等。 将波长被选频次降序排列, 选择与单次运行数量相同的较高频次的波长建模, 所得模型性能较差。 将iRF分别与CARS和VCPA联用, 其中iRF-CARS表现出较强的预测能力, 选择了24个波长建模, 模型的RCRP分别为0.966和0.938, RMSECV和RMSEP分别为0.91和1.22 mg·(100 g)-1。 这说明将波长区间选择和波长点选择联用可以实现它们的优势互补。 高光谱技术结合波长选择方法可以很好地预测调理牛排中TVB-N含量, 研究可为波长选择算法联用策略和调理牛排新鲜度快速检测提供理论参考。
高光谱成像 生鲜调理牛排 挥发性盐基氮 竞争性自适应重加权采样 变量组合集群分析 Hyperspectral imaging Freshprepared steaks Total volatile basic nitrogen Competitive adaptive reweighted sampling Variables combination population analysis 
光谱学与光谱分析
2020, 40(10): 3224
Author Affiliations
Abstract
1 Graduate School of Science and Technology, Niigata University 8050 Ikarashi 2-no-cho Nishi-ku Niigata 950-2181, Japan
2 Faculty of Agriculture, Niigata University 8050 Ikarashi 2-no-cho, Nishi-ku Niigata 950-2181, Japan
3 College of Water Resources & Civil Engineering China Agricultural University, 17 Qinghua Donglu Beijing 100083, P. R. China
4 Faculty of Tourism Management Niigata University of Management 2909-2 Kibougaoka, Kamo-shi Niigata 959-1321, Japan
5 Postharvest Technology Research Center, Faculty of Agriculture Chiang Mai University, 239 Huay Kaew Road, Muang District, Chiang Mai 50200, Thailand
Chronic kidney disease (CKD) is becoming a major public health problem worldwide, and excessive potassium intake is a health threat to patients with CKD. In this study, visible–shortwave near-infrared (Vis–SWNIR) spectroscopy and chemometric algorithms were investigated as nondestructive methods for assessing the potassium concentration in fresh lettuce to benefit the CKD patients' health. Interactance and transmittance measurements were performed and the competencies were compared based on the multivariate methods of partial least-square regression (PLS) and support vector machine regression (SVR). Meanwhile, several preprocessing methods [first- and second-order derivatives in combination with standard normal variate (SNV)] and wavelength selection method of competitive adaptive reweighted sampling (CARS) were applied to eliminate noise and highlight the spectral characteristics. The PLS models yielded better prediction than the SVR models with higher correlation coefficients (R2) and residual predictive deviation (RPD), and lower root-mean-square error of prediction (RMSEP). Excellent prediction of green leaves was obtained by the interactance measurement with R2 = 0.93, RMSEP = 24.86 mg/100 g, and RPD = 3.69; while the transmittance spectra of petioles provided optimal prediction with R2 = 0.92, RMSEP = 27.80 mg/100 g, and RPD=3.34, respectively. Therefore, the results indicated that Vis–SWNIR spectroscopy is capable of intelligently detecting potassium concentration in fresh lettuce to benefit CKD patients around the world in maintaining and enhancing their health.
Lettuce leaves competitive adaptive reweighted sampling partial least-square regression support vector machine regression interactance measurement 
Journal of Innovative Optical Health Sciences
2020, 13(6): 2050029
作者单位
摘要
安徽理工大学电气与信息工程学院, 安徽 淮南 232001
快速且准确识别矿井涌水水源对于防范煤矿水灾事故有着重大的研究意义。 利用激光诱导荧光(LIF)光谱融合智能分类算法进行矿井涌水水源识别打破了传统水化学方法耗时过长等不足, 具有灵敏度高、 响应速度快等特点; 然而目前这些已使用的算法仅能依靠分类准确率定性判别不同矿井涌水水样的种类。 把随机森林(RF)算法和竞争性自适应重加权(CARS)算法相结合, 基于激光诱导荧光的水样荧光光谱数据建立偏最小二乘回归(PLSR)模型来预测不同矿井涌水的含量, 实现水样的定量评估。 首先, 采集300组以老空水为基础混入不同含量砂岩水的矿井涌水样本, 将采集到的水样按4∶1比例随机划分成校正集和预测集, 校正集共240组用于建立回归模型, 预测集共60组用于预测不同水样, 搭建激光诱导荧光涌水光谱系统完成光谱数据的获取并生成荧光光谱图。 然后分别通过S-G卷积平滑法和Lowess平滑法对原始荧光光谱进行去噪处理, 发现处理后的荧光光谱较原始光谱更为分散, 适合光谱分析, 对比了两种去噪方法的预测精度, 选择Lowess平滑法作为最终去噪方法。 接着采用RF算法约简去噪后属性重要度较低的光谱属性, 依据最优回归模型的性能选择约简出的223个属性再用于CARS算法的二次属性精简, 根据CARS算法采样过程中交叉验证均方根误差值最小原则选择出的77个属性光谱数据建立PLSR模型。 最后与全光谱、 其他变量选择方法、 不同回归模型相比, RF-CARS算法属性精简效果最好, 较全光谱建模, 属性由2 048个减少到77个, 模型预测集判定系数R2pre由0.991 4增长到0.996 7, 预测均方根误差RMSEP由0.029 4减少到0.018 3, 预测精度得到提升, 其余评估指标也相对较好。 实验结果表明, RF-CARS结合激光诱导荧光光谱可快速、 精准预测矿井涌水, 精简出的光谱属性用来建立回归模型, 为实现矿井涌水含量的实时定量评估提供了一定的理论保障。
激光诱导荧光光谱 回归模型 随机森林 竞争性自适应重加权 矿井涌水 Laser-induced fluorescence spectroscopy Regression model Random forest Competitive adaptive reweighted sampling Mine water inflow 
光谱学与光谱分析
2020, 40(7): 2170

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!