作者单位
摘要
1 合成与天然功能分子教育部重点实验室,西北大学化学与材料科学学院,陕西 西安 710127
2 西安石油大学化学化工学院,陕西 西安 710065
钪(Sc)被广泛用于固体氧化燃料电池、陶瓷材料、催化剂与轻质高温合金等的制造,是不可或缺的重要战略资源,稀土矿石中Sc元素的定量分析对于稀土矿的勘探、开采具有重要意义。笔者提出了一种基于激光诱导击穿光谱(LIBS)结合随机森林(RF)算法的稀土矿石样品中Sc元素定量分析的方法。首先,考察了不同光谱预处理方法对RF校正模型预测性能的影响;然后,利用变量重要性测量(VIM)进行RF校正模型输入变量的选择与优化。为了进一步验证VIM-RF模型的预测性能,将其与标准曲线法、偏最小二乘(PLS)以及基于波段选择的RF模型进行了比较。最后,在最优化的光谱预处理(WT)和VIM阈值(阈值为0.016)等条件下,建立了基于小波变换结合VIM的RF校正模型。结果表明,VIM-RF校正模型表现出了良好的预测性能:RCV2为0.9981,RMSECV为0.0430 mg/kg,MRECV为0.0047,RP2为0.9993,RMSEP为0.4964 mg/kg,MREP为0.0481。因此,LIBS技术结合RF算法可以有效实现稀土矿石中稀土元素Sc的定量分析,可为稀土矿石的品位分析与精准开采提供借鉴。
光谱学 激光诱导击穿光谱 稀土矿石 定量分析 随机森林 变量选择 
中国激光
2024, 51(2): 0211001
作者单位
摘要
1 内蒙古蒙牛乳业(集团)股份有限公司, 内蒙古 呼和浩特 011500
2 天津大学精密仪器与光电子工程学院, 天津 300072
随着生活和消费水平提高, 消费者对于乳制品食品安全及品质的要求越来越高。 原料奶质量直接影响乳制品的生产与消费安全, 在牛奶收储及生产环节都需要对各种非法添加物进行严格检测, 以保证产品质量。 目前常用的检测方法主要以化学法与仪器分析方法为主, 需要针对不同类型添加物设计前处理步骤, 过程繁琐, 检测效率低, 无法满足实时在线需要。 针对多种类掺假异常牛奶样品实时在线检测需要, 研究了基于中红外光谱的非靶向检测方法。 实验样品选择蒙牛公司六个奶质稳定的奶源地收集到的天然原奶样品, 并配制含有多种掺假物的异常牛奶样品集。 采集样品中红外光谱, 并针对在线检测过程中的干扰来源, 选择平滑滤波、 多元散射校正、 基线校正及归一化等预处理方法, 提高光谱信噪比与一致性。 为了提高非靶向模型识别准确度及稳健性, 根据牛奶样品中红外光谱特征, 选择无信息变量消除(MC-UVE)、 无变量信息消除-连续投影(UVE-SPA)与竞争自适应重加权采样(CARS)三种方法, 筛选原始光谱中的特征波长变量。 在得到的不同特征波长变量组合的基础上, 分别建立基于偏最小二乘判别(PLS-DA)及支持向量机(SVM)的鉴别模型, 对多种掺假物异常牛奶样品进行非靶向鉴别。 实验结果表明, SVM模型鉴别准确度优于PLS-DA, CARS方法筛选得到的变量组合应用于不同鉴别模型的效果均较优, 与SVM模型结合对训练集与测试集的分类准确率分别达到97.84%与94.55%。 分析特征波长变量分布可知, CARS方法筛选出的变量主要集中在异常牛奶样品光谱特征比较明显的区域。 样品误分类结果表明, 该模型组合可以较为准确识别异常牛奶样品, 具有较好的特异性。 研究结果表明, 基于红外光谱技术建立非靶向鉴别模型可以实现多种异常牛奶样品快速准确识别, 为牛奶掺假及生产过程在线检测提供了支持。
中红外光谱 非靶向检测 变量选择 判别模型 Mid-infrared spectroscopy Untargeted detection Variable selection Discriminant models 
光谱学与光谱分析
2023, 43(10): 3009
作者单位
摘要
青岛科技大学自动化与电子工程学院, 山东 青岛 266061
针对衰减全反射-傅里叶变换红外(ATR-FTIR)光谱仪用于测量结晶过程溶液浓度时, 因光谱谱线维度高、 无关变量多, 导致的标定模型预测精度低、 可解释性差等问题, 提出了一种变量稳定加权混合收缩的新方法。 首先提出对光谱变量进行随机二进采样, 将建立的优秀子模型中变量被选频率与所有子模型中变量回归系数的稳定性指标进行加权评价的稳定加权变量种群分析法(SWVCPA)。 通过对变量的重要性进行排序, 采用指数递减函数在迭代过程中逐渐强制滤除重要性低的变量, 实现了对光谱变量空间的初步收缩, 并大幅提高了收缩的稳定性。 然后在收缩后的子空间继续使用一种新的动态麻雀算法(DSSA), 以最小化训练预测均方根误差(RMSEC)为适应度函数进一步优化变量组合。 这种混合优化方式融合了两类变量选择算法的优点, 通过子模型竞争的方法确保了前期变量收缩的稳定性, 防止算法陷入局部最优; 通过智能优化算法避免了对剩余变量组合的遍历寻优, 允许保留更多的变量进行精准选择。 为了验证新方法的性能, 使用L-谷氨酸溶液冷却结晶过程中6种不同浓度下采集到的ATR-FTIR光谱数据进行测试。 结果表明, 新方法将光谱变量数从613个减少到46个, 与原始光谱相比, 使用选择后变量建立的偏最小二乘法(PLSR)模型其预测均方根误差(RMSEP)为从1.727 9降低到0.165 4, 预测决定系数(R2)从0.973 7提高到0.999 7。 另外相比于特征谱段、 遗传算法(GA)以及变量种群组合分析法(VCPA)选择变量建立的模型, 使用新方法建立的溶液浓度预测模型具有更高的准确性和稳定性, 说明该方法对提高使用ATR-FTIR光谱法测量冷却结晶过程溶液浓度准确性和可靠性具有一定的实际应用价值。
变量选择 溶液浓度测量 结晶 ATR-FTIR光谱 智能优化算法 Variable Selection Solution concentration monitoring Crystallization ATR-FTIR spectra Intelligent optimization algorithm 
光谱学与光谱分析
2023, 43(5): 1413
作者单位
摘要
中国农业大学理学院, 北京 100193
利用衰减全反射傅里叶变换红外光谱(ATR-FTIR)结合偏最小二乘法(PLS)对牛预混料中违禁添加的盐酸土霉素含量进行了快速定量检测。 在空白牛预混料中中添加不同质量的98.00% (W/W)盐酸土霉素原药, 配制成盐酸土霉素浓度为0.00%~5.00%的113个混合样品, 纯水作为萃取剂, 萃取液经红外灯烤干后用于红外光谱测定。 为考察不同光谱预处理方法及变量选择方法对模型结果的影响, 选用了3种预处理方法: Savitzky-Golay卷积平滑法(S-G)、 标准正态变换法(SNV) 和多元散射校正法(MSC)和3种变量选择算法: 区间偏最小二乘法(iPLS)、 移动窗口偏最小二乘法(MWPLS)、 自主软收缩法(BOSS)。 其中, SNV预处理结合BOSS算法获得了最佳模型效果: RMSECV=0.337, R2CV=0.947, RMSEP=0.317 7, R2pre=0.935。 所得模型对含量在0.53%~4.67%的29个样品进行外部验证, 预测结果的平均相对误差为0.127, 预测效果较好。 同时, BOSS算法选取的变量主要集中在盐酸土霉素特征峰的吸收区域(1 674~1 593和1 175~1 017 cm-1), 可以为ATR-FTIR技术对饲料中土霉素盐酸盐的快速检测提供有价值的参考。
衰减全反射 偏最小二乘法 定量分析 变量选择 盐酸土霉素 Infrared spectrum Quantitative analysis Partial least squares Variable selection Oxytetracycline Hydrochloride 
光谱学与光谱分析
2023, 43(3): 842
赵停停 1,2,*王克俭 1,2司永胜 1,2淑英 3[ ... ]张志胜 3
作者单位
摘要
1 河北农业大学信息科学与技术学院, 河北 保定 071000
2 河北省农业大数据重点实验室, 河北 保定 071000
3 河北农业大学食品科技学院, 河北 保定 071000
高光谱数据中不仅含有关键性信息还存在一些干扰信息和无效信息, 带有干扰信息和无效信息的数据建立模型会降低效率和模型精度。 从全波段数据中提取特征波长是提高关系模型精度的有效方法。 有序预测选择(OPS)是一种依据信息向量选择有效波长变量的特征波长提取算法, 在特征波长变量筛选方面表现了较好地性能。 但由于建立模型时, 没有去除重要性较低的变量, 导致过多的无效变量参与到模型中, 降低了模型的准确率。 论文以羊肉高光谱数据作为研究对象, 提出了一种改进的特征波长变量选择方法, 基于信息向量和指数衰减函数的有序预测选择方法(AW-OPS)对羊肉新鲜度进行检测, 该算法通过光谱数据和理化值数据之间的关系来计算信息向量并对波长变量进行排序, 采用指数衰减函数(EDF)通过多次迭代去除一些信息向量绝对值比较低的波长变量, 最后在已获取的有效波长变量中逐渐增加波长点建立多元回归模型, 选取交叉均方根误差(RMSECV)最小值的波长变量子集为特征波长变量。 实验时, 将OPS法和AW-OPS法在选取特征波长变量后, 分别构建羊肉TVB-N的偏最小二乘(PLS)关系模型, 同时与全光谱波段PLS模型的效果相比较。 结果表明: OPS算法运行程序平均用时为175.9 s, 优选出370个特征波长变量, OPS-PLS模型相关系数(RP)平均为0.963 1, 均方根误差(RMSEP)平均为0.727; 而改进的有序预测选择法(AW-OPS)运行程序平均用时为57.6 s, 优选出275特征波长变量, AW-OPS-PLS模型平均提升到0.973 1, RMSEP平均降低为0.572 8; 全光谱波长数目为1 414个波长变量, 其PLS模型的平均为0.920 8, RMSEP平均为1.048 3。 AW-OPS-PLS模型相较于OPS-PLS模型测试精度提高了21.2%, 相较于全光谱-PLS模型, 测试精度提高了45%, 证明AW-OPS是一种有效特征波长变量筛选方法, 提高了OPS模型精度和程序运行效率, 降低了模型复杂度。
羊肉高光谱数据 信息向量 特征波长变量选择 AW-OPS法 Lamb hyperspectral data Information vector Characteristic wavelength variable AW-OPS 
光谱学与光谱分析
2023, 43(3): 830
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
在近红外光谱分析中, 将近红外光谱和浓度信息建立统计模型, 通过光谱代入模型即可预测未知样本浓度。 但是, 检测条件的变化会导致光谱的改变, 进而导致原有的模型不能准确预测光谱改变后的样本。 对此, 模型转移可以通过校正新测量的光谱(从光谱), 使得从光谱能够被原有光谱(主光谱)建立的模型准确预测。 模型转移可以使用全光谱进行校正, 但是全光谱中往往包括噪声、 背景等干扰信息, 这些干扰会增加预测误差。 故可以使用变量选择方法找出光谱中有化学意义的信息来模型转移。 但是一般的变量选择算法只选择主光谱的区间, 从光谱使用主光谱相同的波长区间模型转移。 但是在实际工作中, 主光谱和从光谱有化学意义的区间往往不一致, 主从光谱使用同一区间模型转移会增加误差; 此外, 有时二者原光谱的波长范围并不一致, 从主光谱选出的区间不能用于从光谱的校正。 对此, 提出了基于双光谱区间遗传算法(GA-IDS), 同时选择主光谱和从光谱有化学意义的区间, 进而实现模型转移。 GA-IDS算法步骤包括, ①随机产生种群; ②分析种群中每条染色体, 删去错误染色体; ③根据每条染色体, 找出其相应的主光谱和从光谱波段组合, 并计算其模型转移后的验证均方根误差(RMSEV); ④按照概率, 执行选择、 交叉、 变异操作。 在一次迭代结束之后, 返回到步骤②, 重新执行纠错、 计算RMSEV、 选择、 交叉、 变异。 达到停止迭代的要求后, 将最低的RMSEV值所对应的染色体保存下来作为最优染色体, 其所对应的主从光谱区间作为最优区间。 用玉米、 小麦两套数据测试了该算法, 结果显示, 与全光谱相比, GA-IDS选择的主从光谱区间可以显著地降低误差; 与向后迭代区间选择法(IIBS)相比, 在小样本情况下, GA-IDS的误差显著地小于IIBS方法。
近红外光谱 模型转移 遗传算法 变量选择 向后迭代区间选择法 Near-infrared spectra Calibration transfer Genetic algorithm Variable selection Iterative interval backward selection 
光谱学与光谱分析
2022, 42(12): 3783
作者单位
摘要
1 东华理工大学核技术应用教育部工程研究中心, 江西 南昌 330013
2 东华理工大学核资源与环境国家重点实验室, 江西 南昌 330013
3 长江大学, 湖北 武汉 430000
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术, 所建立模型优劣对结果的预测准确性显得十分重要。 竞争性自适应重加权算法(CARS)采用自适应重加权采样技术, 利用交互验证选出互验证均方根误差(RMSECV)值最低原则, 寻出最优变量组合。 为了进一步提高PLS模型的解释和预测能力, 将竞争性自适应重加权算法(CARS)与X射线荧光光谱分析技术相结合, 对土壤中重金属元素铅和砷进行特征波长变量筛选后建立偏最小二乘(PLS)模型。 首先, 利用CARS算法对铅含量密切相关的波长变量进行筛选, 当采样次数为26次时, 筛选出60个有效波长点; 对砷含量密切相关的波长变量进行筛选, 当采样次数为34次时, 筛选出19个有效波长点; 然后对优选出的波长点利用PLS方法分别建立土壤中铅和砷含量定量分析模型, 并与经连续投影算法(SPA)及蒙特卡罗无信息变量消除(MC-UVE)方法波长变量筛选后所建立的PLS模型进行比较。 结果显示: 铅的CARS-PLS模型的预测集决定系数(R2)、 交互验证均方根误差(RMSECV)、 预测均方根误差(RMSEP)和相对预测误差(RPD)分别为0.995 5, 2.598 6, 3.228和9.401 1, 砷的CARS-PLS模型的预测集R2, RMSECV, RMSEP和RPD分别为0.989 9, 3.013 2, 2.737 1和8.211 6; 两元素的CARS-PLS模型性能均优于全波段PLS, SPA-PLS和MC-UVE-PLS模型。 基于CARS-PLS的算法可以有效筛选出X射线荧光光谱特征波长点, 在简化了建模复杂程度的同时, 提高了模型的准确性和稳健性。
竞争性自适应重加权算法(CARS) 偏最小二乘(PLS) 波长变量选择 X射线荧光光谱 Competitive adaptive reweighted algorithm (CARS) Partial least squares (PLS) Wavelength variable selection X-ray fluorescence spectrum 
光谱学与光谱分析
2022, 42(5): 1535
作者单位
摘要
1 长春工业大学电气与电子工程学院, 吉林 长春 130012
2 长春工业大学机电工程学院, 吉林 长春 130012
3 吉林建筑科技学院, 吉林 长春 130012
激光诱导击穿光谱技术(LIBS)用于检测时, 由于谱线多且复杂, 存在许多冗余的信息, 这些都会对定量分析造成影响。 因此, 提取有效的特征变量在LIBS的定量分析中具有非常重要的意义。 对CaCl2溶液中的Ca元素进行光谱特征选择方法分析, 对比单变量模型、 偏最小二乘回归和CART回归树定标模型的准确度和稳定性。 针对水体表面的波动性较大, 光谱稳定性差, 同时光谱受基体效应和自吸收效应影响等问题, 首先采用单变量模型得到的拟合系数(R2)仅有0.933 2, 训练均方根误差(RMSEC)、 预测均方根误差(RMSEP)和平均相对误差(ARE)分别为0.019 2 Wt%, 0.017 7 Wt%和11.604%。 经偏最小二乘回归优化后, 模型R2提高到0.975 3, RMSEC, RMSEP和ARE分别降低到0.010 8 Wt%, 0.013 Wt%和7.49%。 为了进一步提高定量分析的准确度, 建立CART回归树定标模型。 该方法在构建树模型时, 通过平方误差最小化准则, 从复杂的光谱信息中选取最优的特征变量组合做分类决策, 从而建立Ca元素的定标曲线。 通过CART回归树的变量选择, 特征变量个数从100个减少到6个, 变量的压缩率达到了94%, 显著降低了无关谱线的干扰, 回归树模型的相关系数R2, RMSEC, RMSEP和ARE分别为0.997 5, 0.003 5 Wt%, 0.006 1 Wt%和2.500%。 相较于传统的单变量模型与偏最小二乘回归, CART回归树模型具有更高的精度、 更小的误差。 通过对特征变量的有效筛选, 剔除无关信号的干扰, 显著降低了基体效应和自吸收效应对LIBS定量分析的影响, 提高了定量分析的准确度和稳定性。
激光诱导击穿光谱 特征变量选择 CART回归树 定量分析 Laser-induced breakdown spectroscopy Feature variable selection CART regression tree Quantitative analysis 
光谱学与光谱分析
2021, 41(10): 3240
沈先春 1,2,3,*徐亮 1,3孙永丰 1,2,3胡运优 1,2,3[ ... ]刘文清 1,3
作者单位
摘要
1 中国科学院合肥物质科学研究院安徽光学精密机械研究所环境光学与技术重 点实验室, 安徽 合肥 230031
2 中国科学技术大学, 安徽 合肥 230026
3 安徽省环境光学监测技术重点实验室, 安徽 合肥 230031
将变量选择方法中 SFS、LASSO 和 Elastic Net 三种不同方法与广义交互验证准则相结合, 实现对 FTIR 光谱气体成分变量的初步筛选, 再采用循环迭代 CLS 方法对初步筛选的变量中浓度小于 0 的成分进行循环剔除, 然后根据变量在测量向量中的方向占比对选择的变量进行精选, 最终得到目标气体成分。为了验证各识别算法的识别性能, 分别进行了 CH4 和 SF6 外场排放实验, 两组实验结果表明建立的识别算法应用于气体目标识别的效率高、识别准确率高, 且能够识别出干扰成分 H2O。此算法为被动 FTIR 技术在危险气体泄露预警监测中的应用提供了方法基础。
光谱学 气体识别方法 变量选择技术 光谱分析 spectroscopy gas identification method variable selection method spectral analysis 
量子电子学报
2021, 38(3): 281
作者单位
摘要
1 西安交通大学电力设备电气绝缘国家重点实验室, 陕西 西安 710049
2 中煤科工集团重庆设计研究院(集团)有限公司, 重庆 400042
烷烃类气体的傅里叶变换红外光谱在中红外区域吸收峰重叠严重, 为此, 提出了一种基于变量影响值与集群分析相结合(IVPA)的波长选择方法对甲烷、 乙烷、 丙烷、 异丁烷、 正丁烷五种烷烃类气体红外光谱进行变量选择。 该方法以迭代的方式逐步实现对变量的筛选, 在每次迭代过程中, 将变量划分为样本空间与变量空间。 在样本空间中计算变量的影响值, 根据变量影响值采用加权自举采样技术将变量划分为精英变量与普通变量; 同时在变量空间中, 统计每个变量在最优模型中出现的频率; 最后利用指数衰减函数剔除普通变量中频率较低的变量, 记录每次迭代过程中获取的均方根误差(RMSE)值。 选择最小RMSE所对应的子集作为最终选择的变量。 利用实测烷烃类光谱数据集来检验该方法的性能, 并将该方法与近年来提出的稳定性竞争自适应重加权采样法(SCARS)、 变量子集迭代优化(IVSO)变量选择方法所测结果进行了对比。 以异丁烷分析结果为例, SCARS, IVSO与IVPA对其它四种气体的最小交叉灵敏度分别为0.67%, 0.56%和0.11%; 最大交叉灵敏度分别为1.69%, 1.49%和1.02%; 对异丁烷预测的相对误差分别为1.94%, 1.65%和0.51%; 上述3种方法选择的特征变量个数分别为52, 17和13。 结果表明, 提出的IVPA方法选择的变量最少, 仅为原始光谱数据的0.36%, 对其他四种气体的交叉灵敏度最低, 对异丁烷的预测最准确。 该方法可以应用在吸收重叠的光谱中, 能够提高分析模型的预测精度与运行效率。
变量选择 变量影响值 加权自举采样 傅里叶变换红外光谱 偏最小二乘 Variableselection Impact value of variable Weighted bootstrap sampling Fourier transform infrared spectrum Partial least squares 
光谱学与光谱分析
2021, 41(6): 1795

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!