作者单位
摘要
1 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163319
3 黑龙江省农业科学院绥化分院, 黑龙江 绥化 152052
4 大庆市绿色农产品监测中心, 黑龙江 大庆 163311
大豆品种快速准确的鉴别, 对于鉴定种子品质、 净化种业市场以及保障粮食安全具有重要意义。 为解决传统农作物品种鉴别方法中存在精度差和效率低等问题, 采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型, 对黑龙江省4个高蛋白大豆品种(黑农88、 黑农98、 绥农71以及绥农76)进行快速鉴别。 随机蛙跳(RF)算法是一种通过迭代计算变量被选概率, 以确定变量重要性的新型特征波长选择算法, 可以有效剔除全光谱数据中的冗余信息。 该方法存在初始变量集随机性、 所需迭代次数大、 阈值选取不确定的问题, 因此提出一种基于最小绝对收敛与选择算子(LASSO)回归的改进随机蛙跳(MRF)算法。 采用LASSO算法提取与属性变量最相关的特征波长点作为RF初始变量集F0, 消除初始变量的随机性, 在此基础上开始迭代计算, 可以减少无用迭代次数, 提高模型的预测精确度。 RF算法通过设定阈值的方法选择变量, 因此提取的特征波长往往具有不确定性。 改进如下: 首先去除被选概率为0的变量, 对于排序后变量以10个波长点为间隔, 每次增加1个间隔建立特征波长与大豆品种属性的偏最小二乘回归模型, 当交叉验证均方根误差(RMSECV)取最小值时的建模波长为优选特征波长。 以MRF优选特征波长作为输入变量建立PLS鉴别模型, 并与全光谱以及常用的RF、 LASSO和ElasticNet特征波长选择算法建模结果进行对比分析。 结果表明, MRF算法提取300个特征波长点, 仅占全谱波长的9.37%, 有效筛选了关键特征变量, 简化了模型复杂度。 预测结果中均方根误差(RMSEP)和决定系数(R2p)分别为0.246 9和0.951 2, 识别准确率达到100%, 为所有模型中最优。 拉曼光谱结合MRF算法可以实现大豆品种的快速鉴别, 同时也为其他农作物品种的快速鉴别提供了一种新思路。
拉曼光谱 大豆 特征波长选择 随机蛙跳 最小绝对收敛与选择算子 Raman spectroscopy Soybean Characteristic wavelength selection Random frog LASSO 
光谱学与光谱分析
2023, 43(12): 3763
作者单位
摘要
重庆邮电大学光电工程学院, 光电信息感测与传输技术重庆重点实验室, 重庆 400065
硝酸盐氮(NO3-N)是水中“三氮”(硝酸盐氮、 亚硝酸盐氮、 氨氮)之一, 能够反映水体受污染的程度, 是水质评估的一项重要指标。 水体中的硝酸盐氮浓度过高不仅会导致水环境污染加重, 而且会对人畜及水产构成较大威胁。 传统的硝酸盐氮检测必须先反应后测定, 具有时间长、 操作复杂、 有二次污染等缺点。 光谱法具有快速、 无损、 无试剂消耗等显著优点。 针对硝酸盐氮难以快速检测的问题, 提出了一种基于紫外吸收光谱的快速定量分析硝酸盐氮的方法。 采集42份浓度为0~20 mg·L-1的硝酸盐氮标准溶液样本的紫外吸收光谱, 每份样本经11次平均处理以减少仪器噪声和环境的影响。 采用SPXY算法按照7∶3的比例划分训练集、 测试集, 对紫外吸收光谱数据使用Savitzky-Golay(SG)滤波算法进行预处理, 通过10折叠交叉验证获得套索回归(lasso regression)合适的正则化参数λ=0.203 6, 再使用Lasso回归在全光谱范围内筛选出与硝酸盐氮相关的光谱特征波长, 将特征波长处的吸光度与样本浓度进行偏最小二乘(PLS)拟合建立硝酸盐氮的回归模型。 采用此建模方法所建立的模型训练集的R2与RMSE分别为0.999 91和0.060 15 mg·L-1, 测试集的R2与RMSE分别为0.999 72和0.046 91 mg·L-1。 为了验证提出的SG-Lasso-PLS预测模型效果, 另外建立了Lasso-PLS, SG-PCA-PLS和SG-PCA-SVR三种预测模型进行对比。 验证结果表明, SG-Lasso-PLS建立的预测模型的R2和RMSE均优于其他三种预测模型。 说明SG滤波能够消除光谱信号的随机噪声, 提高模型的预测精度。 与PCA数据降维算法相比, Lasso可实现全光谱范围内的光谱特征选择和数据降维, 能有效消除光谱数据的冗余信息, 提高模型的预测精度。 因此, 本文提出的SG-Lasso-PLS混合模型能够快速准确的对水体中的硝酸盐氮进行预测。 作为硝酸盐氮浓度检测的基础研究, 能为快速无污染的水质在线监测场景提供算法参考。
硝酸盐氮 紫外吸收光谱 Lasso回归 PLS回归 Nitrate nitrogen UV absorption spectroscopy Lasso regression PLS regression 
光谱学与光谱分析
2023, 43(4): 1037
朱华 1,2吴珽 2,3房桂干 2,3梁龙 2,3[ ... ]佘光辉 1,2
作者单位
摘要
1 南京林业大学林学院, 江苏 南京 210037
2 南京林业大学林业资源高效加工利用协同创新中心, 江苏 南京 210037
3 中国林业科学研究院林产化学工业研究所, 江苏 南京 210042
为解决速生桉抽出物测定方法繁琐耗时, 木浆生产能耗居高不下等问题, 以引种的3种广西速生尾巨桉原料(DH32-29, DH32-26, DH33-27)为研究对象, 采集了144个样本的近红外光谱, 按国标方法测定全部样品的苯醇抽出物和1%NaOH抽出物含量。 在Matlab 8.0中采用信号平滑, 一阶、 二阶导数, 矢量归一化, 多元散射校正等方法预处理原始光谱, 用偏最小二乘法、 支持向量机法和人工神经网络法以及常用于宏观经济分析的LASSO法分别结合上述预处理方法建立模型, 筛选出最优建模方法。 运用遗传算法对波段进行选择, 提高了模型的精确度从而优化了模型。 确定了建立苯醇抽出物含量模型时, 可联用平滑、 MSC和一阶导数预处理光谱数据, 以1 345.0~1 821.4和2 127.8~2 241.3 nm区间波段参与建模, 建模方法为偏最小二乘法, 最佳主成分数为9时, 模型有最好的精确度。 其RMSEP值可达0.25%, 绝对偏差范围为-0.39%~0.38%。 筛选出的波段包含了如1 410和1 447 nm附近酚羟基伸缩振动的一级倍频, 2 133 nm处苯环上碳氢键的伸缩振动与碳碳双键伸缩振动的合频等苯醇抽出物的特征波段。 建立1%NaOH抽出物分析模型时, 可联用平滑、 矢量归一化和一阶导数预处理, 选择1 138.2~2 363.0 nm波段数据, 建模方法为LASSO, 选取的调整参数值μ为12.61, 此时模型精确度最高。 RMSEP值为0.37%, 绝对偏差范围为-0.56%~0.53%。 筛选出的波段包含了1 158和1 170 nm附近乙酰脂基团CH3中C—H的伸缩振动二级倍频吸收, 1 666, 1 681和1 790 nm附近CH3中C—H伸缩振动的一级倍频吸收等特征吸收。 模型的预测能力从组分结构角度得到了解释。 模型的RPD值分别为4.67和5.77, 模型性能均可满足实际需求, 有望应用于制浆造纸生产线上的速生桉抽出物含量分析。 研究结果表明, 通过预处理方法选择和建模方法选择, 结合遗传算法的应用, 可以建立并优化广西速生桉木抽出物含量的近红外测定模型; 同时, LASSO算法作为一种新兴算法, 在近红外光谱分析中表现出了较好的处理共复线性数据的能力, 可以建立准确性较好的分析模型。
近红外技术 LASSO算法 预处理 遗传算法 Near-infrared technique LASSO algorithm Pretreatment Genetic algorithm 
光谱学与光谱分析
2020, 40(3): 793
作者单位
摘要
1 江苏大学电气信息工程学院, 江苏 镇江 212013
2 安徽大学电气工程与自动化学院, 安徽 合肥 230061
3 江苏大学食品与生物工程学院, 江苏 镇江 212013
近红外光谱技术是一种通过分析样本的特征光谱数据, 实现定性或定量分析的无损检测方法, 特征数据的完整性和代表性决定了所建模型的性能, 而现有分析方法只能实现光谱子区间特征筛选, 导致分析模型稳定性差、 且难以再优化。 为实现近红外光谱区间高维数特征提取, 有效提高近红外光谱定性分析模型的精度和稳定性, 提出一种基于最小绝对收缩和选择算法(LASSO)的光谱特征筛选方法, 并以我国特色高值外贸产品云南松茸为分析对象进行聚类应用研究, 讨论了该方法对于高维光谱特征筛选的有效性、 分析对比了LASSO筛选特征变量及主元分析(PCA)降维算法所建松茸真伪甄别及食用菌分类模型的预测精度及稳定性。 通过调研发现, 云南产鲜松茸因其独特外形易于分辨, 而片状的干松茸失去其独有的外形特征, 导致国内干松茸掺假事件屡禁不止。 选取云南产松茸、 杏鲍菇、 老人头、 姬松茸四种干样共166样本数据进行分析, 采用光谱范围为900~1 700 nm的NIRQuest512型近红外光谱仪获得166×512维原始光谱数据, 剔除异常数据后采用标准正态变换对光谱数据进行预处理。 在此基础上, 利用LASSO筛选出全光谱区间的特征变量, 再使用Kennard-Stone法并结合典型线性(KNN)和非线性建模(BP)算法, 构建松茸真伪甄别模型和食用菌分类模型, 对两种模型进行盲样测试, 并分析了LASSO与PCA算法的不同点, 最后使用蒙特卡罗方法检测两种模型的稳定性。 实验结果表明基于LASSO光谱特征选择的松茸真伪甄别模型和食用菌分类模型预测精度和稳定性均高于PCA方法, 其中基于原始光谱数据所建真伪甄别模型的预测准确率为69.57% (BP)和60.87% (KNN), 食用菌分类模型准确率为67.39% (BP)和65.22% (KNN), 基于LASSO特征筛选的真伪甄别模型预测准确率分别达到100% (BP)和78.26% (KNN), 食用菌分类模型预测准确率分别达到89.13% (BP)和80.43% (KNN), 对两种模型进行10次蒙特卡罗实验, 其结果平均值分别为99.93%和97.22%, 由此可知, 与PCA等数据降维算法相比, LASSO可实现全光谱区间的光谱特征选择和数据降维, 有效地提高了近红外定性分析模型的预测性能, 为近红外分析提供了一种新的特征筛选方法。
近红外光谱 特征选择 松茸鉴别 蒙特卡罗方法 NIRS Feature extraction LASSO LASSO Tricholoma Matsutake discrimination Monte Carlo method 
光谱学与光谱分析
2019, 39(12): 3809
作者单位
摘要
中国科学院合肥物质科学研究院安徽光学精密机械研究所, 安徽 合肥 230031
在开放光路条件下,污染气体与大气成分的光谱特征相互混叠,难以直接对污染气体进行识别。提出了一种自适应特征提取算法,预先生成各种大气条件下的光谱特征,利用Lasso算法进行快速特征优选,选择最优目标/背景组合重构背景光谱,提取目标特征。为了验证所提算法的有效性,开展了不同背景下的甲烷遥测实验、不同相对湿度条件下的氨气遥测实验,以及室内近距离乙烯探测实验。将所提算法与Harig算法进行对比,结果表明:所提算法能更好地扣除背景,具有较强的实用性。
遥感 自适应 Lasso算法 亮温光谱 
光学学报
2019, 39(5): 0530003
作者单位
摘要
江南大学自动化研究所, 轻工过程先进控制教育部重点实验室, 江苏 无锡 214122
当近红外光谱信息远大于样本量时, 对光谱信息进行自动变量选择进而建立光谱与样品含量的稀疏线性模型重要且具有挑战性。 利用近红外光谱, 将变量选择方法Elastic Net用于聚苯醚生产过程中微量成分邻甲酚的测量, 建立近红外光谱与邻甲酚含量之间的定量校正模型, 并将其模型预测效果与Lasso方法进行对比。 在变量数目远远大于样本量的情形下, Lasso方法虽可实现变量选择, 但由于对系数的过度压缩, 使得模型的预测精度受到影响, 而Elastic Net通过增加L2惩罚项避免了过多删失数据, 可以提高模型预测精度。 为了验证Elastic Net方法的模型性能指标, 用复相关系数R2和调整的复相关系数R2a来评价模型的可解释性, 利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。 Lasso方法建立的模型性能指标为: R2=0.94, R2a=0.93, MRPE=4.51%, Rp=0.96; Elastic Net方法的性能指标为: R2=0.97, R2a=1, MRPE=3.25%, Rp=0.98。 结果表明, Elastic Net所建立模型的性能指标优于Lasso方法, 可以得到可解释性较强和预测精度较高的稀疏线性模型。
近红外光谱 可解释性 预测精度 Near infrared spectroscopy Elastic Net Elastic Net Lasso Lasso Interpretable Prediction accuracy 
光谱学与光谱分析
2018, 38(10): 3096
作者单位
摘要
1 中国林业科学研究院林产化学工业研究所, 国家林业局林产化学工程重点开放性实验室, 江苏省生物质能源与材料重点实验室, 江苏 南京 210042
2 南京林业大学林业资源高效加工利用协同创新中心, 江苏 南京 210037
3 南京林业大学轻工科学与工程学院, 江苏 南京 210037
近年来, 随着林纸一体化战略的推进, 多使用混合原料制浆。 而混合原料比例及成分含量的快速分析难以实现已成为制约制浆工业发展的瓶颈。 为解决此问题, 以广泛使用的杨木-桉木混合原料为研究对象, 用傅里叶近红外光谱仪采集了131个不同比例的杨木-桉木混合样品和30个单一杨木、 桉木样品的近红外光谱; 用化学法测定其综纤维素、 聚戊糖及Klason木素含量。 因主要化学成分含量的近红外光谱信息集中于7 600~4 000 cm-1区间, 对该区间的光谱数据进行平滑、 标准正态变换和一阶导数的预处理, 运用LASSO算法建立了杨木含量与聚戊糖含量模型; 对该区间数据进行平滑、 标准正态变换和二阶导数预处理后结合LASSO算法建立了综纤维素含量模型; 对该区间数据进行平滑、 多元信号校正和二阶导数预处理后结合LASSO算法建立了Klason木素含量模型。 杨木含量、 综纤维素、 聚戊糖、 Klason 木素含量模型的预测均方根误差分别为1.82%, 0.52%, 0.67%和0.59%; 绝对偏差范围分别为-3.01%~2.94%, -0.91%~0.83%, -0.91%~1.07%, -0.79%~0.92%。 4种模型的性能总体上略优于传统偏最小二乘法所建的模型且满足实际需求, 可以用于工业生产。
近红外技术 LASSO算法 预处理 混合原料 Near-infrared spectroscopy technology LASSO algorithm Pretreatment Mixed raw materials 
光谱学与光谱分析
2018, 38(8): 2400
作者单位
摘要
江南大学自动化研究所轻工过程先进控制教育部重点实验室, 江苏 无锡 214122
以油砂中钠元素为研究对象, 首次应用近红外光谱, 结合Lasso(least absolute shrinkage and selection operator)建模方法, 建立了油砂金属钠含量的近红外光谱定量校正模型, 并与传统的PLS建模方法进行比较。 结果表明, 两种方法建立的油砂金属钠含量校正模型都具有很高的精度, 预测性能方面略有差异。 在实验验证集与预测集中, PLS与Lasso算法的相关系数分别是: Rv=0.878 8, Rp=0.857 9和Rv=0.887 4, Rp=0.860 0。 实验验证了使用近红外光谱快速测定油砂金属钠含量的有效性, 并分析了PLS与Lasso算法的适用范围。
近红外光谱 油砂金属钠元素 定量校正模型 Near infrared spectroscopy Sodium content in oil sand Lasso Lasso Quantitative calibration model 
光谱学与光谱分析
2018, 38(7): 2274
梅从立 1,2,*陈瑶 2尹梁 2江辉 2[ ... ]刘国海 2
作者单位
摘要
1 浙江水利水电学院电气工程学院, 浙江 杭州 310018
2 江苏大学电气信息工程学院, 江苏 镇江 212013
近红外技术广泛应用于食品、 药品等生产过程和产品质量检测, 具有样品无需预处理、 成本低、 无破坏性、 测定速度快等优点。 但是, 全光谱数据维数高、 冗余信息多, 直接应用于建模会导致模型复杂性高、 稳定性差等问题。 siPLS是最常见的光谱数据降维方法, 但是难以处理光谱数据的共线性问题。 LASSO是一种相对新的数据降维方法, 但在小样本应用中具有不稳定性。 针对siPLS和LASSO在近红外光谱数据应用中存在的问题, 提出了基于siPLS-LASSO的近红外特征波长选择方法, 并将其应用于秸秆饲料蛋白固态发酵过程pH值监测。 该方法首先采用siPLS算法, 实现对光谱波长最佳联合子区间的优选; 然后, 对优选联合子区间使用LASSO算法进行特征波长选择, 在此基础上建立PLS校正模型。 同时, 将siPLS-LASSO方法与其他传统特征波长选择方法进行了对比。 结果表明: 建立在siPLS-LASSO方法优选33个特征波长基础上的PLS模型预测结果更好, 其预测方差(RMSEP)和相关系数(Rp)分别为0071 1和0980 8; 所提siPLS-LASSO方法有效选取了特征波长, 提高了模型预测性能。
近红外光谱 波长优选 固态发酵过程 NIR spectroscopy Wavelength selection LASSO LASSO siPLS siPLS Solid state fermentation process 
光谱学与光谱分析
2018, 38(2): 436
叶树彬 1,2,*沈先春 1,2徐亮 1金岭 1[ ... ]刘文清 1
作者单位
摘要
1 中国科学院安徽光学精密机械研究所, 中国科学院环境光学与技术重点实验室, 安徽 合肥 230031
2 中国科学技术大学, 安徽 合肥 230031
采用红外光谱技术对未知气体组分进行监测, 需要对气体组分进行定性识别分析。 基于多元线性回归模型的LASSO变量选择技术广泛应用于数据分析领域。 将LASSO方法引入到红外光谱分析领域, 提出一种LASSO变量选择技术结合循环线性最小二乘(LCLS)分析的定性识别方法, 并开展了相关的实验对其进行验证。 实验采集CO, C2H4, NH3, C3H8, C4H10和C6H14六种单组分傅里叶变换红外(FTIR)光谱吸光度谱以及一组C2H4和NH3混合组分的吸光度谱, 结合实验室自建光谱数据库, 先采用LASSO方法对采集的光谱进行初步定性分析, 然后使用LCLS方法剔除干扰组分。 实验结果表明, LASSO结合LCLS的方法能有效识别出光谱中的目标组分, 即使是在干扰严重的光谱波段也可以剔除掉大部分的干扰组分。
定性识别 LASSO LASSO FTIR FTIR Qualitative identification CLS CLS 
光谱学与光谱分析
2017, 37(10): 3037

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!