作者单位
摘要
1 合成与天然功能分子教育部重点实验室,西北大学化学与材料科学学院,陕西 西安 710127
2 西安石油大学化学化工学院,陕西 西安 710065
钪(Sc)被广泛用于固体氧化燃料电池、陶瓷材料、催化剂与轻质高温合金等的制造,是不可或缺的重要战略资源,稀土矿石中Sc元素的定量分析对于稀土矿的勘探、开采具有重要意义。笔者提出了一种基于激光诱导击穿光谱(LIBS)结合随机森林(RF)算法的稀土矿石样品中Sc元素定量分析的方法。首先,考察了不同光谱预处理方法对RF校正模型预测性能的影响;然后,利用变量重要性测量(VIM)进行RF校正模型输入变量的选择与优化。为了进一步验证VIM-RF模型的预测性能,将其与标准曲线法、偏最小二乘(PLS)以及基于波段选择的RF模型进行了比较。最后,在最优化的光谱预处理(WT)和VIM阈值(阈值为0.016)等条件下,建立了基于小波变换结合VIM的RF校正模型。结果表明,VIM-RF校正模型表现出了良好的预测性能:RCV2为0.9981,RMSECV为0.0430 mg/kg,MRECV为0.0047,RP2为0.9993,RMSEP为0.4964 mg/kg,MREP为0.0481。因此,LIBS技术结合RF算法可以有效实现稀土矿石中稀土元素Sc的定量分析,可为稀土矿石的品位分析与精准开采提供借鉴。
光谱学 激光诱导击穿光谱 稀土矿石 定量分析 随机森林 变量选择 
中国激光
2024, 51(2): 0211001
作者单位
摘要
1 内蒙古蒙牛乳业(集团)股份有限公司, 内蒙古 呼和浩特 011500
2 天津大学精密仪器与光电子工程学院, 天津 300072
随着生活和消费水平提高, 消费者对于乳制品食品安全及品质的要求越来越高。 原料奶质量直接影响乳制品的生产与消费安全, 在牛奶收储及生产环节都需要对各种非法添加物进行严格检测, 以保证产品质量。 目前常用的检测方法主要以化学法与仪器分析方法为主, 需要针对不同类型添加物设计前处理步骤, 过程繁琐, 检测效率低, 无法满足实时在线需要。 针对多种类掺假异常牛奶样品实时在线检测需要, 研究了基于中红外光谱的非靶向检测方法。 实验样品选择蒙牛公司六个奶质稳定的奶源地收集到的天然原奶样品, 并配制含有多种掺假物的异常牛奶样品集。 采集样品中红外光谱, 并针对在线检测过程中的干扰来源, 选择平滑滤波、 多元散射校正、 基线校正及归一化等预处理方法, 提高光谱信噪比与一致性。 为了提高非靶向模型识别准确度及稳健性, 根据牛奶样品中红外光谱特征, 选择无信息变量消除(MC-UVE)、 无变量信息消除-连续投影(UVE-SPA)与竞争自适应重加权采样(CARS)三种方法, 筛选原始光谱中的特征波长变量。 在得到的不同特征波长变量组合的基础上, 分别建立基于偏最小二乘判别(PLS-DA)及支持向量机(SVM)的鉴别模型, 对多种掺假物异常牛奶样品进行非靶向鉴别。 实验结果表明, SVM模型鉴别准确度优于PLS-DA, CARS方法筛选得到的变量组合应用于不同鉴别模型的效果均较优, 与SVM模型结合对训练集与测试集的分类准确率分别达到97.84%与94.55%。 分析特征波长变量分布可知, CARS方法筛选出的变量主要集中在异常牛奶样品光谱特征比较明显的区域。 样品误分类结果表明, 该模型组合可以较为准确识别异常牛奶样品, 具有较好的特异性。 研究结果表明, 基于红外光谱技术建立非靶向鉴别模型可以实现多种异常牛奶样品快速准确识别, 为牛奶掺假及生产过程在线检测提供了支持。
中红外光谱 非靶向检测 变量选择 判别模型 Mid-infrared spectroscopy Untargeted detection Variable selection Discriminant models 
光谱学与光谱分析
2023, 43(10): 3009
作者单位
摘要
青岛科技大学自动化与电子工程学院, 山东 青岛 266061
针对衰减全反射-傅里叶变换红外(ATR-FTIR)光谱仪用于测量结晶过程溶液浓度时, 因光谱谱线维度高、 无关变量多, 导致的标定模型预测精度低、 可解释性差等问题, 提出了一种变量稳定加权混合收缩的新方法。 首先提出对光谱变量进行随机二进采样, 将建立的优秀子模型中变量被选频率与所有子模型中变量回归系数的稳定性指标进行加权评价的稳定加权变量种群分析法(SWVCPA)。 通过对变量的重要性进行排序, 采用指数递减函数在迭代过程中逐渐强制滤除重要性低的变量, 实现了对光谱变量空间的初步收缩, 并大幅提高了收缩的稳定性。 然后在收缩后的子空间继续使用一种新的动态麻雀算法(DSSA), 以最小化训练预测均方根误差(RMSEC)为适应度函数进一步优化变量组合。 这种混合优化方式融合了两类变量选择算法的优点, 通过子模型竞争的方法确保了前期变量收缩的稳定性, 防止算法陷入局部最优; 通过智能优化算法避免了对剩余变量组合的遍历寻优, 允许保留更多的变量进行精准选择。 为了验证新方法的性能, 使用L-谷氨酸溶液冷却结晶过程中6种不同浓度下采集到的ATR-FTIR光谱数据进行测试。 结果表明, 新方法将光谱变量数从613个减少到46个, 与原始光谱相比, 使用选择后变量建立的偏最小二乘法(PLSR)模型其预测均方根误差(RMSEP)为从1.727 9降低到0.165 4, 预测决定系数(R2)从0.973 7提高到0.999 7。 另外相比于特征谱段、 遗传算法(GA)以及变量种群组合分析法(VCPA)选择变量建立的模型, 使用新方法建立的溶液浓度预测模型具有更高的准确性和稳定性, 说明该方法对提高使用ATR-FTIR光谱法测量冷却结晶过程溶液浓度准确性和可靠性具有一定的实际应用价值。
变量选择 溶液浓度测量 结晶 ATR-FTIR光谱 智能优化算法 Variable Selection Solution concentration monitoring Crystallization ATR-FTIR spectra Intelligent optimization algorithm 
光谱学与光谱分析
2023, 43(5): 1413
作者单位
摘要
中国农业大学理学院, 北京 100193
利用衰减全反射傅里叶变换红外光谱(ATR-FTIR)结合偏最小二乘法(PLS)对牛预混料中违禁添加的盐酸土霉素含量进行了快速定量检测。 在空白牛预混料中中添加不同质量的98.00% (W/W)盐酸土霉素原药, 配制成盐酸土霉素浓度为0.00%~5.00%的113个混合样品, 纯水作为萃取剂, 萃取液经红外灯烤干后用于红外光谱测定。 为考察不同光谱预处理方法及变量选择方法对模型结果的影响, 选用了3种预处理方法: Savitzky-Golay卷积平滑法(S-G)、 标准正态变换法(SNV) 和多元散射校正法(MSC)和3种变量选择算法: 区间偏最小二乘法(iPLS)、 移动窗口偏最小二乘法(MWPLS)、 自主软收缩法(BOSS)。 其中, SNV预处理结合BOSS算法获得了最佳模型效果: RMSECV=0.337, R2CV=0.947, RMSEP=0.317 7, R2pre=0.935。 所得模型对含量在0.53%~4.67%的29个样品进行外部验证, 预测结果的平均相对误差为0.127, 预测效果较好。 同时, BOSS算法选取的变量主要集中在盐酸土霉素特征峰的吸收区域(1 674~1 593和1 175~1 017 cm-1), 可以为ATR-FTIR技术对饲料中土霉素盐酸盐的快速检测提供有价值的参考。
衰减全反射 偏最小二乘法 定量分析 变量选择 盐酸土霉素 Infrared spectrum Quantitative analysis Partial least squares Variable selection Oxytetracycline Hydrochloride 
光谱学与光谱分析
2023, 43(3): 842
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
在近红外光谱分析中, 将近红外光谱和浓度信息建立统计模型, 通过光谱代入模型即可预测未知样本浓度。 但是, 检测条件的变化会导致光谱的改变, 进而导致原有的模型不能准确预测光谱改变后的样本。 对此, 模型转移可以通过校正新测量的光谱(从光谱), 使得从光谱能够被原有光谱(主光谱)建立的模型准确预测。 模型转移可以使用全光谱进行校正, 但是全光谱中往往包括噪声、 背景等干扰信息, 这些干扰会增加预测误差。 故可以使用变量选择方法找出光谱中有化学意义的信息来模型转移。 但是一般的变量选择算法只选择主光谱的区间, 从光谱使用主光谱相同的波长区间模型转移。 但是在实际工作中, 主光谱和从光谱有化学意义的区间往往不一致, 主从光谱使用同一区间模型转移会增加误差; 此外, 有时二者原光谱的波长范围并不一致, 从主光谱选出的区间不能用于从光谱的校正。 对此, 提出了基于双光谱区间遗传算法(GA-IDS), 同时选择主光谱和从光谱有化学意义的区间, 进而实现模型转移。 GA-IDS算法步骤包括, ①随机产生种群; ②分析种群中每条染色体, 删去错误染色体; ③根据每条染色体, 找出其相应的主光谱和从光谱波段组合, 并计算其模型转移后的验证均方根误差(RMSEV); ④按照概率, 执行选择、 交叉、 变异操作。 在一次迭代结束之后, 返回到步骤②, 重新执行纠错、 计算RMSEV、 选择、 交叉、 变异。 达到停止迭代的要求后, 将最低的RMSEV值所对应的染色体保存下来作为最优染色体, 其所对应的主从光谱区间作为最优区间。 用玉米、 小麦两套数据测试了该算法, 结果显示, 与全光谱相比, GA-IDS选择的主从光谱区间可以显著地降低误差; 与向后迭代区间选择法(IIBS)相比, 在小样本情况下, GA-IDS的误差显著地小于IIBS方法。
近红外光谱 模型转移 遗传算法 变量选择 向后迭代区间选择法 Near-infrared spectra Calibration transfer Genetic algorithm Variable selection Iterative interval backward selection 
光谱学与光谱分析
2022, 42(12): 3783
作者单位
摘要
1 东华理工大学核技术应用教育部工程研究中心, 江西 南昌 330013
2 东华理工大学核资源与环境国家重点实验室, 江西 南昌 330013
3 长江大学, 湖北 武汉 430000
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术, 所建立模型优劣对结果的预测准确性显得十分重要。 竞争性自适应重加权算法(CARS)采用自适应重加权采样技术, 利用交互验证选出互验证均方根误差(RMSECV)值最低原则, 寻出最优变量组合。 为了进一步提高PLS模型的解释和预测能力, 将竞争性自适应重加权算法(CARS)与X射线荧光光谱分析技术相结合, 对土壤中重金属元素铅和砷进行特征波长变量筛选后建立偏最小二乘(PLS)模型。 首先, 利用CARS算法对铅含量密切相关的波长变量进行筛选, 当采样次数为26次时, 筛选出60个有效波长点; 对砷含量密切相关的波长变量进行筛选, 当采样次数为34次时, 筛选出19个有效波长点; 然后对优选出的波长点利用PLS方法分别建立土壤中铅和砷含量定量分析模型, 并与经连续投影算法(SPA)及蒙特卡罗无信息变量消除(MC-UVE)方法波长变量筛选后所建立的PLS模型进行比较。 结果显示: 铅的CARS-PLS模型的预测集决定系数(R2)、 交互验证均方根误差(RMSECV)、 预测均方根误差(RMSEP)和相对预测误差(RPD)分别为0.995 5, 2.598 6, 3.228和9.401 1, 砷的CARS-PLS模型的预测集R2, RMSECV, RMSEP和RPD分别为0.989 9, 3.013 2, 2.737 1和8.211 6; 两元素的CARS-PLS模型性能均优于全波段PLS, SPA-PLS和MC-UVE-PLS模型。 基于CARS-PLS的算法可以有效筛选出X射线荧光光谱特征波长点, 在简化了建模复杂程度的同时, 提高了模型的准确性和稳健性。
竞争性自适应重加权算法(CARS) 偏最小二乘(PLS) 波长变量选择 X射线荧光光谱 Competitive adaptive reweighted algorithm (CARS) Partial least squares (PLS) Wavelength variable selection X-ray fluorescence spectrum 
光谱学与光谱分析
2022, 42(5): 1535
作者单位
摘要
1 华北电力大学(保定)环境科学与工程系, 河北省燃煤电站烟气多污染物协同控制重点实验室, 河北 保定 071003
2 贵州医科大学食品科学学院, 贵州 贵阳 550025
3 中国人民解放军陆军第八十二集团军医院, 河北 保定 071000
4 天津市建筑材料科学研究院有限公司, 天津 300110
如何从海量或高维数据中“提纯”出有用的信息, 这是当前数据分析面临的一个巨大的挑战, 也是当前研究的一个热点。 变量筛选技术能够从众多、 复杂的量测数据中提取出特征信息变量, 达到简化多元模型乃至提高模型预测性能等目的。 在光谱分析中, 来自噪声等诸多因素的影响, 量测数据会不可避免地包含干扰和无关信息变量, 以及变量间存在的多重共线性, 这些都会影响模型的稳健性和预测能力。 近年来变量(波长)筛选方法在光谱解析领域的研究与应用中取得了较大的进展。 结合国内外相关研究文献和作者的研究体会, 不仅仅综述了近红外光谱, 还综述了中红外光谱、 拉曼光谱等众多筛选变量的方法的提出、 特点、 发展、 类别、 比较和近五年来在不同领域的应用进展。 其中, 评价变量重要性的参数及其标准或阈值的选择、 搜索变量的策略和途径是变量筛选方法的关键。 而且每种方法都具有各自的优势和局限性, 实际使用中要根据方法自身特点结合目标体系的特征选择合适的方法。 重点内容: (1)对比了光谱数据分析中常用的波长筛选和波段筛选方法; (2)对比了基于PLS模型参数的不同变量筛选方法的原理和特点; (3)根据搜索和筛选变量策略的不同将变量筛选方法进行分类评述。 最后, 围绕在解析实际复杂体系中变量筛选方法出现的过拟合、 不稳定等问题进行了讨论并提出相应的解决措施, 同时对变量筛选方法的研究趋势、 发展前景和应用方向进行了展望。 其中, 新的评价变量重要性的判据和搜索变量的策略等工作仍需要展开深入地研究。 期望本综述能够对光谱变量筛选的后续研究及应用起到积极的推动作用。
变量筛选 光谱数据 特征变量 冗余信息 Variable selection Spectral data Characteristic variable Redundant information 
光谱学与光谱分析
2021, 41(11): 3331
作者单位
摘要
1 长春工业大学电气与电子工程学院, 吉林 长春 130012
2 长春工业大学机电工程学院, 吉林 长春 130012
3 吉林建筑科技学院, 吉林 长春 130012
激光诱导击穿光谱技术(LIBS)用于检测时, 由于谱线多且复杂, 存在许多冗余的信息, 这些都会对定量分析造成影响。 因此, 提取有效的特征变量在LIBS的定量分析中具有非常重要的意义。 对CaCl2溶液中的Ca元素进行光谱特征选择方法分析, 对比单变量模型、 偏最小二乘回归和CART回归树定标模型的准确度和稳定性。 针对水体表面的波动性较大, 光谱稳定性差, 同时光谱受基体效应和自吸收效应影响等问题, 首先采用单变量模型得到的拟合系数(R2)仅有0.933 2, 训练均方根误差(RMSEC)、 预测均方根误差(RMSEP)和平均相对误差(ARE)分别为0.019 2 Wt%, 0.017 7 Wt%和11.604%。 经偏最小二乘回归优化后, 模型R2提高到0.975 3, RMSEC, RMSEP和ARE分别降低到0.010 8 Wt%, 0.013 Wt%和7.49%。 为了进一步提高定量分析的准确度, 建立CART回归树定标模型。 该方法在构建树模型时, 通过平方误差最小化准则, 从复杂的光谱信息中选取最优的特征变量组合做分类决策, 从而建立Ca元素的定标曲线。 通过CART回归树的变量选择, 特征变量个数从100个减少到6个, 变量的压缩率达到了94%, 显著降低了无关谱线的干扰, 回归树模型的相关系数R2, RMSEC, RMSEP和ARE分别为0.997 5, 0.003 5 Wt%, 0.006 1 Wt%和2.500%。 相较于传统的单变量模型与偏最小二乘回归, CART回归树模型具有更高的精度、 更小的误差。 通过对特征变量的有效筛选, 剔除无关信号的干扰, 显著降低了基体效应和自吸收效应对LIBS定量分析的影响, 提高了定量分析的准确度和稳定性。
激光诱导击穿光谱 特征变量选择 CART回归树 定量分析 Laser-induced breakdown spectroscopy Feature variable selection CART regression tree Quantitative analysis 
光谱学与光谱分析
2021, 41(10): 3240
沈先春 1,2,3,*徐亮 1,3孙永丰 1,2,3胡运优 1,2,3[ ... ]刘文清 1,3
作者单位
摘要
1 中国科学院合肥物质科学研究院安徽光学精密机械研究所环境光学与技术重 点实验室, 安徽 合肥 230031
2 中国科学技术大学, 安徽 合肥 230026
3 安徽省环境光学监测技术重点实验室, 安徽 合肥 230031
将变量选择方法中 SFS、LASSO 和 Elastic Net 三种不同方法与广义交互验证准则相结合, 实现对 FTIR 光谱气体成分变量的初步筛选, 再采用循环迭代 CLS 方法对初步筛选的变量中浓度小于 0 的成分进行循环剔除, 然后根据变量在测量向量中的方向占比对选择的变量进行精选, 最终得到目标气体成分。为了验证各识别算法的识别性能, 分别进行了 CH4 和 SF6 外场排放实验, 两组实验结果表明建立的识别算法应用于气体目标识别的效率高、识别准确率高, 且能够识别出干扰成分 H2O。此算法为被动 FTIR 技术在危险气体泄露预警监测中的应用提供了方法基础。
光谱学 气体识别方法 变量选择技术 光谱分析 spectroscopy gas identification method variable selection method spectral analysis 
量子电子学报
2021, 38(3): 281
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
近红外光谱(NIR)具有快速、 无损、 操作方便的特点, 故广泛用于食品分析。 作为一种间接的分析技术, NIR需要建立光谱与待测浓度之间的统计模型来实现检测。 故模型的维护有助于保证NIR的预测准确性。 在外界条件发生变化的情况下, 诸如样品性状的改变、 仪器对理化指标函数关系的变化、 湿度和温度等环境因素的改变, 会导致相同样品的光谱信号发生偏移, 进而使得原有模型的预测精度下降。 此时, 如果重新建模, 虽然可以解决光谱偏移对建模的影响, 但是重新建模将耗费大量的人力物力。 对此, 模型转移可以在避免重新建模的情况下, 校正光谱的偏移, 进而提高模型预测精度。 通常模型转移算法多用全光谱进行模型转移, 这种方法计算量较大, 且不能找到合适的有化学意义的波段。 故提出一种基于模型转移中的变量选择方法: 向后迭代区间选择法(IIBS), 通过计算主光谱(用于建模的那组光谱)和从光谱(发生偏移, 需要通过模型转移算法将其校正的光谱)中, 变量区间的重要性信息(回归系数(β)、 残差向量(Res)以及变量重要性投影(VIP))。 进而通过计算该区间变量重要性信息的几何平均数, 并以此作为该区间的区间重要性指标。 接着根据区间的重要性, 删除重要性信息较小的变量区间。 然后对主光谱和从光谱重复迭代上述过程: 计算变量的重要性信息, 计算区间的重要性信息, 删除重要性信息较小的区间。 最后, 比较不同的主光谱和从光谱区间组合的验证均方根误差(RMSEV), 选择RMSEV最小的主光谱和从光谱区间作为最优区间。 玉米、 小麦两套NIR数据测试了该算法。 结果显示, 与全波段相比, β, Res以及VIP均可以从主光谱和从光谱中选择较少的, 有化学意义的区间, 提高模型转移的精度。 在比较不同变量重要性向量方面, 基于β的变量选择算法, 模型转移的计算误差较小。
近红外光谱 模型转移 变量选择 回归系数 残差向量 VIP值 Near infrared spectra Calibration transfer Variable selection Regression coefficient Residual error VIP 
光谱学与光谱分析
2021, 41(6): 1789

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!