作者单位
摘要
华东交通大学智能机电装备创新研究院, 江西 南昌 330013
糖度是评价苹果内部品质的重要指标之一。 建立苹果糖度预测模型时, 建模样本和波长的质量影响模型的准确性和后期的更新维护。 以90个苹果样本为研究对象, 采集350~1 150 nm波段共1 044个波长的苹果近红外漫透射光谱, 研究基于最小角回归索套算法(LASSOLars)优选建模样本和波长的有效性和可行性。 结合使用Norris平滑、 一阶微分和归一化变量排序对光谱预处理。 根据浓度排序划分样本集的75%为原始训练集(68个)和25%为预测集(22个), 使用LASSOLars建立优选训练集, 对比LASSOLars和蒙特卡罗无信息变量消除、 竞争性自适应重加权法, 从样本、 波长的数目和分布以及模型的结果进行对比分析。 结果表明, 优选训练集压缩了原始训练集16%的样本, 在不改变原始训练集平均水平的前提下, 更接近预测集分布, 没有削弱模型质量。 优选和原始的训练集交叉验证均方根误差RMSECV分别为0.460和0.491, 交叉验证决定系数R2CV分别为0.913和0.916, 预测集均方根误差RMSEP分别为0.462和0.471, 预测集决定系数R2P分别为0.909和0.906。 LASSOLars筛选出40个信噪比高的波长, 数目最少, 建立的模型效果最好, RMSECV, R2CV, RMSEP, R2P和RPD分别是0.933, 0.400, 0.944, 0.373和2.838。 基于LASSOLars优化建模样本和波长建立苹果糖度预测模型, 拓展了LASSOLars算法在子集选择方面的应用, 为优化、 更新和维护模型提供思路。
近红外光谱分析技术 基于最小角回归索套算法 样本优选 波长优选 Near-infrared spectrum LASSOLars Samples optimization Wavelengths optimization 
光谱学与光谱分析
2023, 43(5): 1419
作者单位
摘要
1 桂林电子科技大学计算机与信息安全学院, 广西 桂林 541004
2 桂林电子科技大学商学院, 广西 桂林 541004
3 北京邮电大学人工智能学院, 北京 100876
4 中国食品药品检定研究院, 北京 100050
近红外光谱分析技术对检测样品无损伤且检测速度快、 精度高, 因此被广泛应用在了药品检测、 石油化工等领域, 尤其近年来机器学习和深度学习建模方法的深入应用使其具备了更准确的检测性能。 然而, 样品的近红外光谱数据具有比较高的维度且存在谱间重合、 共线性和噪声等问题, 对近红外光谱模型的性能产生消极影响, 此时样品有效特征波长的筛选极为重要。 为了提高近红外光谱定量和定性分析模型的准确性和可靠性, 提出了一种近红外光谱变量选择方法, 其结合了最小角回归(LAR)和竞争性自适应重加权采样(CARS)的优点, 具有更优的性能。 该方法利用LAR初步筛选样品全谱区的特征波长, 接着利用CARS对筛选出来的特征波长进一步选择, 从而有效去除无关特征波长。 为验证该方法的有效性, 从定量和定性分析两个方面评价该方法。 在定量分析实验中, 以FULL, LAR, CARS, SPA和UVE作为对比方法, 以药品样品数据集为实例建立PLS回归分析模型, 经LAR-CARS筛选出的变量建立的PLS模型在药品数据集表现出较高的预测决定系数和较低的预测标准偏差。 在定性分析实验中, 以SVM, ELM, SWELM和BP作为对比方法、 不同比例训练集的药品数据集为实例建立分类模型, 经LAR-CARS筛选出的变量建立的SVM分类模型精度最高达100%。 从实验结果可见, LAR-CARS可有效的筛选出表征样品特征的波长, 利用其筛选出的波长建立的定量、 定性分析模型具有更好的鲁棒性, 可用于样品光谱的特征波长筛选。
近红外光谱 波长筛选 最小角回归 自适应重加权采样 Near infrared spectroscopy Wavelength selection Least angle regression Competitive adaptive reweighted sampling 
光谱学与光谱分析
2021, 41(6): 1782
作者单位
摘要
1 桂林电子科技大学电子工程与自动化学院, 广西 桂林 541004
2 北京邮电大学自动化学院, 北京 100876
近红外(NIR)光谱一般具有较多的波长变量数, 对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。 最小角回归(LAR)是一种相对较新和有效的机器学习算法, 常用于进行回归分析和变量选择。 面向光谱建模应用, 提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法, 可有效筛选出少数特征波长点。 首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点, 然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。 为验证本文方法的有效性, 以药片和汽油的近红外光谱回归分析作为应用案例, 对原光谱进行预处理后, 采用该方法进行变量筛选, 然后分别建模其中的活性成分含量和C10含量。 结果显示, 在这两个应用中, 最终优化得到的特征波长点数均只需七个, 而两者的预测决定系数R2p分别达到0933 9和0951 9, 与全光谱、 无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比, 特征波长点更少, 同时R2p和预测均方根误差RMSEP值更优。 因此, LAR结合GA-PLS, 能有效地从近红外光谱中选择出信息变量从而减少建模波数, 提高预测精度, 拥有较好的模型解释性。 该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。
近红外光谱 最小角回归 变量选择 共线性 遗传偏最小二乘法 Near-infrared spectroscopy Least angle regression Variable selection Collinearity Genetic algorithm-partial least square 
光谱学与光谱分析
2017, 37(6): 1733

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!