1 西安交通大学电气工程学院,电气绝缘与电力设备国家重点实验室,陕西 西安 710049
2 西安交通大学电子科学与工程学院,电子物理与器件教育部重点实验室,陕西 西安 710049
面向天然页岩与砂岩矿物元素组分快速定量分析的检测需求,笔者搭建了具有自动化分析功能的显微分析激光诱导击穿光谱系统,并采用该系统对油气页岩与砂岩天然岩石样本进行了快速检测。分析了砂岩与页岩光谱的不确定度差异,形成了流程化的包括光谱数据提取、筛选、校正、归一化的预处理方法,有效降低了单一样本与样本间光谱不确定度。基于偏最小二乘回归,形成了模型输入参数优化流程,避免了模型过拟合与欠拟合,提高了定量预测准确度。对岩石中的Si、Ca、Fe、Al、Mg等元素进行了定量分析,多数样本的平均预测均方根误差小于1%。本研究为天然岩石的矿物组分分析与岩性识别提供了技术支持。
光谱学 激光诱导击穿光谱 页岩 砂岩 光谱预处理 元素定量分析
吉林大学地球信息探测仪器教育部重点实验室, 吉林 长春 130061吉林大学国家地球物理探测仪器工程技术研究中心, 吉林 长春 130061吉林大学仪器科学与电气工程学院, 吉林 长春 130061
甲醇汽油因其辛烷值高、 成本低等优势成为新型化石燃料替代物, 其甲醇含量的精确检测是决定其品质的重要环节, 甲醇汽油组分的精确定量检测与分析对于缓解我国传统石油资源短缺但需求量增多的现状具有重大的现实意义。 甲醇汽油中甲醇检测的常规方法如酒醇仪测定法、 速测盒测定法等, 操作复杂, 准确定性低。 近红外光谱分析具有测量速度快、 灵敏度高、 可连续测量等诸多优点, 在石油化工领域定性、 定量分析中具有巨大应用潜力。 为研究甲醇汽油近红外光谱无损定量检测方法, 配制了0.5%~30%组分的甲醇汽油标准样品, 设计了甲醇汽油近红外光谱数据采集系统并采集60个组分的甲醇汽油近红外光谱数据; 利用移动平均平滑法、 S-G卷积平滑法(Savitzky-Golay)和多元散射校正(MSC)对甲醇汽油近红外光谱数据进行预处理分析, 研究了BP人工神经网络(ANN)和主成分回归(PCR)模型的决定系数和均方根误差, 对两种算法的结果和预测效果进行对比。 结果显示: 各模型的均方根误差均小于1%, SG平滑-主成分回归预测模型拟合度最好, 其决定系数为0.998 98; 基于SG卷积平滑算法和神经网络算法建立的模型预测值与真值偏差最小, 其均方根误差RMSEP为0.322 84%。 研究表明近红外光谱检测分析技术检测甲醇汽油中的甲醇含量应用中SG平滑-神经网络预测模型性能较好, 满足应用需求, 因而为甲醇汽油组份实际检测应用提供了科学依据, 为有效开发与利用甲醇汽油提供了技术支持。
光谱预处理 甲醇汽油 近红外光谱 主成分分析 Spectra pretreatment Methanol gasoline Near infrared spectrum Principal component analysis 光谱学与光谱分析
2023, 43(5): 1489
岳岩松 1,2,3张朱珊莹 1,2,3,*朱思聪 1,2,3曹汇敏 1,2,3[ ... ]谢勤岚 1,2,3
1 中南民族大学生物医学工程学院,湖北 武汉 430074
2 中南民族大学认知科学国家民委重点实验室,湖北 武汉 430074
3 医学信息分析及肿瘤诊疗湖北省重点实验室,湖北 武汉 430074
中红外衰减全反射光谱技术在人体血糖检测方面具有快速、绿色的天然优势。但人体血液中其他组分的存在会影响葡萄糖含量检测的准确度。因此,研究了人体血液中胆固醇、白蛋白以及尿素的存在对红外光谱法血糖检测的干扰程度。以117份含有不同干扰物以及不同质量浓度的葡萄糖仿体溶液为研究对象,对原始光谱进行SG(Savitzky-Golay)平滑处理后构建偏最小二乘回归模型,并构建Clarke Error Grid以及预测值与真实值对比图进行进一步分析。结果表明:全干扰物模型预测集相关系数(Rp)以及预测集均方根误差(RMSEP)分别为0.9785和40.0187,有85.7%的预测结果落在Clarke Error Grid可靠区(A区);缺失胆固醇模型的Rp以及RMSEP分别为0.9042和175.7292,有40%的预测结果落在A区;缺失白蛋白模型的Rp以及RMSEP分别为0.9616和103.6627,有42.9%的预测结果落在A区;缺失尿素模型的Rp以及RMSEP分别为0.9742和38.6716,所有预测结果都落在A区。由此可以看出,胆固醇的干扰程度最大,白蛋白次之,尿素产生的干扰较小。本研究对提高红外光谱法葡萄糖检测的准确度具有一定帮助以及参考价值。
光谱学 光谱分析 光谱预处理 葡萄糖质量浓度 定量模型 激光与光电子学进展
2023, 60(24): 2430001
1 湖北中医药大学药学院, 湖北 武汉 430065
2 湖北省中药保健食品工程技术研究中心, 湖北 武汉 430065
3 北京理工大学光电学院, 北京 100081
4 咸宁市中心医院、 湖北科技学院附属第一医院药学部, 湖北 咸宁 437100
5 华中科技大学武汉光电国家研究中心, 湖北 武汉 430074
6 华中科技大学光学与电子信息学院, 湖北 武汉 430074
7 武汉邮电科学研究院, 湖北 武汉 430074
山药为薯蓣科植物薯蓣的根茎, 其中的多糖、 多酚、 皂苷、 黏蛋白和维生素C等成分使山药具有抗肿瘤、 抗氧化、 抗炎症、 降血糖和降血脂等作用。 不同产地的山药由于生长条件存在差异, 致使药用成分含量显著不同, 结合独特的炮制工艺, 进而导致市场价格差别大, 所以山药饮片的产地识别至关重要。 为对山药饮片进行产地溯源, 本文基于激光诱导击穿光谱(LIBS)技术提出多元散射矫正-改进遗传算法-支持向量机(MSC-IGA-SVM)模型对山药产地进行精确识别。 使用八个不同产地的山药饮片进行LIBS实验, 八种产地的山药饮片磨粉过筛后制成粉末压片, 通过采集山药饮片的LIBS光谱, 分别使用单一分类器与使用光谱预处理、 特征提取及模式识别算法的模型对光谱的识别结果进行对比。 将光谱信号按2∶1的比例划分为训练集和测试集, 使用5次交叉验证K-邻近算法(KNN)模型的测试集准确率作为预处理参数优化的评价指标。 各类药材的平均光谱整体趋势一致, 所含谱峰基本相同, 但因产地不同导致峰值强度各不相同, 道地山药对一些金属元素(K, Na, Ca, Mg, Al)的富集能力大于非道地产区山药, 其中, K元素特征谱线(769.90 nm)的峰值最高, 即山药饮片中K元素含量最多, 相关研究表明山药根茎对K元素的富集能力最强。 选取35条关键谱线进行分析, 在识别种类多、 识别难度大的情况下, 改进遗传算法(IGA)比主成分分析(PCA)更能清楚辨别光谱中的非线性关系, 同时受噪声的影响更小。 MSC-IGA-SVM模型的产地溯源效果最好。 MSC-IGA-SVM模型的交叉验证集准确率为96.9%, 测试集的准确率为97.32%, 与直接使用原信号建立的最好模型支持向量机(SVM)(96.43%)相比, 测试集准确率提高了0.87%。 同时, MSC-IGA-SVM模型将输入变量的维度减少了99.93%。 结果表明, LIBS技术结合MSC-IGA-SVM模型能够快速、 准确对山药饮片进行产地溯源。
激光诱导击穿光谱 光谱预处理 特征提取 模式识别 山药 Laser-induced breakdown spectroscopy Spectral preprocessing Feature extraction Pattern recognition Rhizoma Dioscoreae
水生植物能够净化污染物和抑制藻类生长,在生态系统重建方面具有重要的应用价值。光谱分析作为植物种类识别的一种方法,具有无接触、快速、无污染等特点。受周围水环境的影响,绿色水生植物的光谱特征峰比陆生植物更加难以区分,地面实测光谱数据不仅维度高,且存在大量重叠谱带和背景干扰,特征光谱不明显;同时,通过地面实测获取样本数据较为困难,适用于深度学习的地面光谱数据集较少。针对以上问题,本文提出了一种基于一阶导数法结合AlexNet网络的分类模型。本团队以2019年9—10月上海河道内4种优势种群的近岸挺水水生植物为研究对象,使用地物光谱仪采集4种水生植物叶片部位的光谱信息。实验中,首先使用4种光谱分析法对原始数据进行预处理,比较预处理前后分类模型的准确率,其中一阶导数法结合AlexNet网络的分类模型对4种水生植物的分类精度最高,为99.50%;然后分别选取样本数据的40%、60%和80%作为训练集,验证模型在小样本下的泛化能力;最后利用Grad-CAM算法对模型进行可视化,分析后发现本文模型提取的水生植物的特征光谱与现有研究结果一致。上述研究结果表明,本文模型能够有效提取水生植物的特征光谱,实现对4种水生植物的快速准确分类识别,为高光谱遥感卫星识别此4种水生植物提供了重要参考。
光谱学 近岸水生植物 深度学习 光谱预处理 AlexNet网络
1 武汉大学资源与环境科学学院,湖北 武汉 430079
2 自然资源部数字制图与国土信息应用重点实验室,湖北 武汉 430079
3 土壤与农业可持续发展国家重点实验室,江苏 南京 210008
4 华中农业大学资源与环境学院,湖北 武汉 430070
5 Geographical and sustainability Science,The University of lowa,lowa City,IA 52245,USA
可见近红外非成像光谱分析技术已被广泛用于土壤有机碳(SOC)含量估测, 然而该技术的使用受土壤粗糙度的影响, 对样本的前处理要求较高, 导致模型的实用性受限。 针对这一问题, 以美国爱荷华州农田土壤为研究对象, 使用成像及非成像光谱仪获取土壤样本研磨前后的可见近红外反射光谱, 采用去包络线(CR)、 吸光度变换(AB)、 S-G平滑(SG)、 标准正态变换(SNV)、 多元散射校正(MSC)5种光谱预处理手段, 利用偏最小二乘回归(PLSR)和支持向量回归(SVR)算法构建并对比土壤SOC光谱估算模型, 探究利用成像光谱数据估测高粗糙度样本SOC含量的可行性。 实验结果表明, 使用成像光谱数据能够实现高粗糙度样本的SOC含量估算, 而使用非成像光谱数据则无法估算高粗糙度样本的SOC含量; 基于成像光谱数据建立的高粗糙度SOC最优PLSR估算模型R2能够达到0.739以及最优SVR估算模型R2为0.712, 而基于非成像光谱数据建立的高粗糙度SOC最优PLSR和SVR估算模型R2仅仅分别为0.344和0.311。 基于AB, SG, SNV和MSC这4种预处理手段之后的成像光谱数据建立的土壤样本研磨前的PLSR模型性能优于样本研磨之后建立的PLSR模型, 而SVR模型性能正好相反。 而对于非成像光谱数据来说, 土壤样本研磨后建立PLSR和SVR模型精度总是强于样本研磨前建立的模型精度。 对于这两种光谱数据和两个估算模型而言, 不同的光谱预处理方法提高模型估算精度的能力不同。 土壤样本研磨前后, 基于成像光谱数据建立的PLSR和SVR模型性能均优于非成像光谱数据所构建的模型。 成像光谱技术能够增强高粗糙度土壤样本可见近红外光谱与SOC的相关性, 从而提高模型估算精度; 能够克服土壤粗糙度的影响; 为野外大尺度估测SOC含量提供了新的手段。
成像光谱技术 土壤粗糙度 可见近红外光谱 光谱预处理 土壤有机碳 Imaging spectroscopy Soil roughness Visible and near-infrared spectra Spectra pre-processing Soil organic carbon 光谱学与光谱分析
2022, 42(9): 2788
1 武汉理工大学信息工程学院, 宽带无线通信与传感器网络湖北省重点实验室, 湖北 武汉 430070
2 华中农业大学园艺林学学院, 园艺植物生物学教育部重点实验室, 湖北 武汉 430070
嫁接的目的是为了提高植物抗土传病害和非生物逆境的能力。 甜瓜嫁接愈合状态的早检测是当前育苗厂工业化发展的重要需求。 在标准正态变量变换-Savitzky-Golay平滑-二阶导数(SNV-SG-SD)预处理基础上提出了融合嫁接差异信息的竞争性自适应重加权算法-连续投影法(DIS-CARS-SPA)特征提取算法, 并建立了基于网格寻优径向基核函数支持向量机(GS-RBF-SVM)分类模型, 实现了基于高光谱成像的甜瓜嫁接愈合状态早期分类检测。 首先采集以南瓜为砧木, 甜瓜为接穗的嫁接成活苗和非成活苗愈合期1~7 d内的高光谱图像, 分别采用9种光谱预处理方法, 2种特征提取算法和5种优化算法4种核函数支持向量机(SVM)分类模型进行分析。 结果显示, SNV-SG-SD光谱预处理、 DIS-CARS-SPA特征提取和GS-RBF-SVM分类模型效果最好。 利用该模型进一步分析, 在同一天不同类型二分类中, 愈合期1~7 d内任何一天的分类准确率均能达到99%以上; 在不同天嫁接成活苗二分类中可达 90.17%以上; 在不同天嫁接非成活苗二分类中可达97.03%以上; 在不同天不同类型十四分类中可达到96.85%, 比未融合嫁接差异信息的CARS-SPA特征提取方法准确率提高了0.59%, 比只预处理未特征提取方法提高了3.37%。 结果表明, 所提出的方法不仅能实现同一天不同类型二分类, 还能实现不同天同一类型的二分类, 不同天不同类型的多分类。 在实际应用中, 可将分类时间点提前到嫁接后第1天(肉眼观察第3~4天, 机器视觉技术第1~2天), 同时第3天均是嫁接成活苗和非成活苗的差异突变天数, 嫁接成活苗状态可分为弱—中—强三个阶段, 非成活苗状态可分为弱—更弱两个阶段, 该结论能为甜瓜嫁接苗生产提供有效指导, 具有一定的理论和实践价值。
高光谱成像 甜瓜嫁接 光谱预处理 特征提取 分类识别模型 Hyperspectral imaging Melon grafting Data preprocessing Feature extraction Classification and recognition model 光谱学与光谱分析
2022, 42(7): 2218
东北大学秦皇岛分校控制工程学院, 河北 秦皇岛 066000
采用衰减全反射傅里叶变换红外光谱法(ATR-FTIR), 结合多元校正模型对γ-聚谷氨酸(γ-PGA)发酵过程中两种主要底物葡萄糖和谷氨酸钠的浓度进行间接测量, 为优化发酵系统控制提供重要的反馈信息。 光谱测量中经常出现的基线漂移会严重影响后续多元校正模型的性能, 需要采用基线校正算法对光谱进行预处理。 现有流行的基线校正算法多数是基于Whittaker Smoother(WS)平滑算法, 这些算法均采用整数阶微分对拟合基线进行约束, 表达能力有限。 针对现有基线校正算法中的整数阶微分自适应性差的问题, 利用更加灵活的分数阶微分对基线进行约束, 提出了一种基于分数阶的基线校正算法, 实现对整数阶基线校正的扩展。 总共进行了5个批次的γ-PGA发酵实验, 并对不同批次和全部批次的ATR-FTIR光谱数据分别进行了分数阶基线校正, 模型的预测精度均得到不同程度的提升。 实验结果表明, 只有在批次2时, 基于整数阶的基线校正效果最好; 其他批次的基线校正效果最好时的阶次均为分数阶。 这也表明了分数阶微分(包含整数阶微分)对基线的约束更加合理。 同时发现全部批次的整体基线校正效果远远差于单一批次的效果, 原因可能是各批次发酵光谱的基线是不同的, 对不同的批次需要选用不同的阶次以获得最佳的基线校正。 此外, γ-PGA发酵样品的ATR-FTIR光谱测量是以蒸馏水为背景, 会在3 100~3 600 cm-1波数范围内出现负水峰, 形成有害的干扰信号; 分数阶基线校正后的光谱表明, 分数阶基线校正算法将负的水峰当作基线, 在一定程度上进行了消除。 综上分析, 分数阶基线校正算法不仅扩展了传统整数阶基线校正算法的应用范围, 也为消除ATR光谱中负的水峰提供了新的解决思路。
分数阶微分 光谱预处理 基线校正 Fractional differentiation Spectral preprocessing Baseline correction 光谱学与光谱分析
2022, 42(6): 1848
甲板漆是海事刑事案件中重要的物证之一,对甲板漆进行快速无损准确的鉴定是法庭科学物证检验的重要分支。红外光谱是常用的快速无损鉴定方法,红外光谱的预处理能够消除谱图的噪声和背景干扰,提高谱图的识别率。实验收集了常见的5种不同品牌的甲板漆共计100个样本,利用支持向量机和贝叶斯判别分析对多个红外预处理组合处理后的甲板漆谱图进行识别,根据识别率来筛选甲板漆红外预处理的最优方法,同时对支持向量机和贝叶斯判别分析的识别效果进行比较。结果表明,贝叶斯判别分析的效果要优于支持向量机,贝叶斯判别分析对经Savitzky-Golay二阶求导平滑和傅里叶自去卷积处理的甲板漆谱图训练集识别率为100%,测试集识别率为96%。该方法分类效果好,定性能力强,对法庭科学中甲板漆的鉴定有一定的借鉴意义。
光谱学 甲板漆 光谱预处理 化学计量学 激光与光电子学进展
2022, 59(10): 1030004
1 沈阳农业大学信息与电气工程学院, 辽宁 沈阳 110866
2 辽宁省农业信息化工程技术研究中心, 辽宁 沈阳 110866
在水稻抗倒伏育种中, 水稻茎秆纤维素含量作为重要的作物性状表现型数据, 用传统方法获取时受人力成本和时间成本的约束, 采集群体大小有限。 利用高光谱技术能够实现对作物性状信息的快速、 无损检测。 为探究水稻茎秆纤维素含量近红外光谱反演模型, 以田间小区试验的方式, 采集水稻灌浆期至成熟期茎秆基部倒2、 3节作为实验样本, 并在实验室内使用NIRQuest512型号高光谱仪测得茎秆近红外反射光谱数据; 采用标准变量正态变换(SNV)、 连续小波变换(CWT)及两种方法结合(SNV-CWT)对原始近红外光谱进行预处理, 经对比分析, 原始光谱经SNV处理后再通过CWT对应6尺度分解最优, 然后采用联合区间偏最小二乘法(SiPLS)、 迭代保留信息变量法(IRIV)对最优预处理(SNV-CWT)的光谱特征曲线进行光谱特征变量筛选, 分别提取了64个和16个特征变量; 为优化模型并提高其模型精度, 采用IRIV算法对SiPLS所选的特征变量进行二次筛选, 得到6个特征变量, 特征波长为1 200, 1 207, 1 325, 1 470, 1 482和1 492 nm, 最后基于优选出的特征变量分别建立水稻茎秆纤维素含量的支持向量机回归(εSVR)和核极限学习机(KELM)预测模型, 模型参数(惩罚系数C, 核函数系数γ和不敏感参数ε)分别采用灰狼算法(GWO)、 差分进化灰狼算法(DEGWO)和自适应差分进化灰狼算法(SaDEGWO)进行优化选择。 结果表明, 采用SNV-CWT方法光谱预处理后, 经SiPLS-IRIV方法筛选的特征变量构建的SaDEGWO优化的SVR模型精度最高, 模型参数C, γ, ε分别为302.838 2, 0.087 7, 0.070 8, 测试集的决定性系数(R2p)为0.880, 均方根误差(RMSEP)为15.22 mg·g-1, 剩余预测残差(RPD)为2.91, 表明模型具有较好的预测能力, 可为水稻茎秆纤维素含量预测提供参考。
水稻茎秆 纤维素 近红外光谱 光谱预处理 光谱特征变量 反演模型 Rice stem Cellulose Near-infrared spectroscopy Spectral pretreatment Spectral characteristic variables Inversion model 光谱学与光谱分析
2021, 41(6): 1775