光谱处理技术对提升光丝诱导荧光光谱检测低浓度NaCl气溶胶能力的实验研究 下载: 662次
1 引言
随着中国工业化的不断发展,煤炭燃烧、工业排放、机动车尾气等因素导致的大气污染给人类的健康及生态环境带来了极大的危害[1]。其中,大气气溶胶污染物是导致雾霾天气的重要因素,其成分复杂、形态多样。因此,对大气气溶胶污染物,尤其是低浓度大气气溶胶污染物的精确检测至关重要。
为了检测大气气溶胶成分及质量浓度,很多研究者对其光谱进行分析,并且对于不同的光谱采用了不同的处理手段。郭旺林等[2]通过建立重金属元素定标曲线,实现了对大气气溶胶中的重金属元素含量的检测;且进一步采用快速傅里叶变换、5点SG平滑法和小波阈值降噪法对气溶胶激光诱导击穿光谱(LIBS)数据进行降噪实验[3],通过对比3种降噪算法的信噪比及平滑度值,表明小波阈值降噪法效果最优;第五鹏瑶等[4]对9种物质的光谱测试了不同的预处理方法组合,并使用偏最小二乘法(PLSR)建立定量模型,实验结果表明,根据光谱信号特点选择的预处理组合很难使定量模型的预测效果达到最佳;张朱珊莹等[5]将预处理方法分为4类,选择每类预处理方法中的最优预处理方法进行组合,通过PLSR建模效果来选出最优预处理方法。但不同的数据集其复杂性存在较大差异,且对于大气气溶胶污染物的相关研究较少,尤其是低浓度大气气溶胶污染物。
传统的LIBS会产生较强的连续背景噪声辐射,同时光谱仪在信号处理中带来光/电信号以及数/模信号转换的附加噪声,会影响分析元素时的光谱强度[6],难以获取包含复杂成分和相似化学结构的谱线。在光丝飞秒激光技术下[7-9],物质被高度激发和解离,形成分子碎片的“指纹”荧光,可用于识别大气中的各种物质,包括气体、气溶胶等[10]。使用高强度激光光丝诱导荧光光谱(FIFS)可以实现大气污染远程、多组分、快速测量,是未来实现光丝激光雷达的关键技术[11-13]。本文以此为背景,在实验室中使用低浓度氯化钠气溶胶和云室模拟大气中的气溶胶,使用高功率超快激光激发出光丝并获取其FIFS数据。为降低各类噪声对信号的影响,提升多组分检测和浓度预测的精度。本文面向低浓度NaCl气溶胶的FIFS数据处理方法展开实验研究,并对比了中值滤波(MF)、SG(Savitzkg-Golay)平滑、快速傅里叶变换(FFT)滤波、多元散射校正(MSC)、标准正态变量变换(SNV)和一阶导(FD)、二阶导(SD)、离散小波变换(DWT)、波峰显著度(SOP)等预处理方法及其组合,获得光谱数据的预处理结果,并使用PLSR[14]建立定量模型,进行浓度预测。实验表明,合适的预处理方法能在很大程度上提高低浓度NaCl气溶胶的信噪比及模型预测的准确性。
2 实验部分
2.1 光谱采集与实验设备
光丝激发与光谱采集实验装置系统如
图 1. FIFS采集光谱装置图
Fig. 1. Schematic diagram of filament-induced fluorescence spectrum (FIFS) collection spectrum device
实验中激光脉冲的波长为800 nm,能量设定为6 mJ,脉冲宽度为50 fs,工作频率为500 Hz。使用的光谱仪波长范围为180~920 nm,光谱分辨率为0.1 nm。
2.2 实验样品与数据
实验中的NaCl气溶胶由纯度为99%的NaCl固体与蒸馏水,按照一定的质量分数配比所配置,配置的NaCl气溶胶质量分数分别为150
在采集到的样品中,由于环境温度湿度、仪器误差、样品处理等原因,不可避免地会存在异常样本,而异常样本对模型的预测能力有很大的影响,必须从其样品集中剔除[15]。本文采用马氏距离剔除异常样本,然后采用基于联合x-y距离的样本集划分(SPXY)[16]算法对样品集进行划分。SPXY算法通过计算样品间的欧氏距离,来保证样品的空间分布均匀,同时将光谱与气溶胶的含量考虑在内,能有效地覆盖多维向量空间,提高模型的稳定性。实验训练集与预测集的比例为3∶1。
2.3 光谱预处理方法
在光谱数据采集的过程中,由于受到仪器、环境、测量条件等因素的影响,光谱中除有效信息外,还存在大量的噪声和冗余信息。而噪声的干扰,往往会造成谱峰偏移、基线漂移、信号毛刺等问题,对光谱分析有很大影响。为了获得更准确而有效的数据,需对光谱数据进行预处理。目前光谱预处理的方法存在很多种,不同光谱预处理方式建立的模型也存在着不同的差异[17]。每种预处理方法都有特定的作用与效果,简单地将预处理的方法叠加起来,并不一定能取得预期的效果。此外,还需考虑算法叠加时的相互影响。因此,找出效果最佳的处理方法,对低浓度大气气溶胶光谱的分析至关重要。根据噪声的不同,本文主要从平滑去噪[18-19]、散射校正[20-21]、基线校正[22-23]3个方面,比较不同处理方法对光谱处理的影响[24-25]。
本文采用了3种平滑去噪方式:MF、SG和FFT;两种常见的散射校正算法:MSC和SNV;3种基线校正方法:FD、SD和DWT;以及本文提出的SOP算法。
表 1. 光谱的预处理方法组合
Table 1. Combinations of spectral preprocessing methods
|
2.4 评价指标
2.4.1 去噪性能指标
去噪性能采用信噪比(SNR)[26]与均方根误差(RMSE)[26]作为评价指标。SNR越大,则表明噪声处理得越好。RMSE越小,则认为重构的信号越接近。其分别为
式中:
2.4.2 预测模型性能指标
浓度预测采用决定系数
决定系数
式中:
RMSEP是回归分析中最常用的分析指标,代表着预测的误差大小,其值越低则表明模型预测效果越好,其公式为
式中,
RPD是基于决定系数的一种分析指标,RPD小于1.4时认为模型不可靠,RPD大于1.4时认为模型已经比较可靠,当其大于2时,则认为模型已经具有较高的可靠性,其计算公式为
3 结果与讨论
用2.3节中
3.1 光谱的预处理
3.1.1 光谱特征分析
FIFS信号在采集时会受到激光器激光能量波动、光谱仪分辨率差异、外部环境差异以及样品不均匀等因素影响,为了尽可能地消除或减弱这些扰动噪声,使得特征突出,更好地对光谱特别是低浓度光谱信号进行分析,需对FIFS数据进行光谱预处理。
质量分数分别为150
图 5. 单一预处理方法光谱图。(a)SG;(b)FFT;(c)SNV;(d)MSC;(e)MF;(f)FD;(g)SD;(h)DWT
Fig. 5. Spectra of single preprocessing methods. (a) SG; (b) FFT; (c) SNV; (d) MSC; (e) MF; (f) FD; (g) SD; (h) DWT
导数光谱通过对原始光谱求导,从光谱中分离出特征峰,精确地定位特征峰的位置,提高光谱的检测灵敏度,且有助于消除或降低背景干扰。对于斜线背景,经FD处理后,其FD为常数,从而可消除线性背景。对于SD则可扣除曲线背景。从图
经过预处理后消除了一部分噪声的干扰,但依旧存在伪峰。为了消除伪峰,对于经过预处理后的光谱进行寻峰处理。对于物质,其采集的光谱必含有代表其存在的特征峰,特征峰应在每次测量时均出现。在同浓度的一组数据中,这里将波峰出现的频率称为SOP,计算公式为
式中:m为某一波峰位置出现的次数;N为样本总个数。
当波峰出现的频率大于某一阈值时,认为其为特征峰,这里将这一阈值称为SOP阈值。对于同一组数据来说,当光谱波峰出现次数的比例超过SOP阈值时,认为其为特征谱峰,并且特征峰处应是固定存在且变化不大的光谱数据,因此对寻峰结果进行SOP筛选,认为SOP高的波峰为物质的特征峰。以进行“MSC-MF-SG-FFT”处理、质量分数为150
表 2. 波峰及SOP
Table 2. Peak positions and significance of peak (SOP)
|
从
经处理后,使低浓度NaCl气溶胶的FIFS的特征峰更显著,较大程度上减少了噪声的影响,提高了SNR。
3.1.2 参数优化
本实验中首先通过累加平均技术来降低光谱信号的波动影响,之后采用MF、SG、FFT、MSC、SNV、FD、SD、DWT以及其组合的方法进行预处理,除MSC、SNV之外,其余预处理方法需进行参数优化,MF、SG、FFT、FD、SD窗口的优化方法是窗口数在3~89进行变化,间隔为2,分别计算各自的RMSEP值,RMSEP最小值对应的窗口即为最佳窗口。DWT采用了Haar、db2-db10、coif1-coif5、sym2-sym8等22个小波函数;分解尺度在1~15进行变化,分别计算不同小波函数和分解尺度对应的RMSEP值。优化后的窗口参数分别是:MF窗口为20,SG平滑的平滑点为3,窗口大小为61,FFT窗口为35,FD和SD窗口分别为60和80,DWT采用db7为小波函数,分解尺度为8。
3.2 去噪性能效果分析
合理的光谱预处理方法可以去除光谱中的无用信息,保留特征信息,提高模型预测能力。本实验对低浓度NaCl气溶胶FIFS分别采用
表 3. 组合预处理方法
Table 3. Combinations of preprocessing methods
|
从
3.3 浓度预测结果分析
对不同的预处理方法,分别建立模型,实现对NaCl气溶胶的浓度预测。基于PLSR对原始谱线和经过预处理后的数据建模,得到的NaCl气溶胶含量的拟合结果散点图如
图 8. 不同预处理方法PLSR预测值拟合散点图。(a)Original、FFT、SG;(b)MSC、SD、DWT;(c)FFT-SOP、SG-FD、SG-FFT-SD;(d)MF-SG-FFT、MF-SG-FFT-DWT、MF-SG-FFT-SOP;(e)MSC-MF-SG-FFT、MSC-FFT-MF-SG、MSC-MF-SG-FFT-DWT;(f)MSC-MF-SG-FFT-SOP、SNV-SG-FFT-FD、SNV-MF-SG-FFT-DWT
Fig. 8. Fitting scatter plots of PLSR prediction value for different preprocessing methods. (a) Original, FFT, SG; (b) MSC, SD, DWT; (c) FFT-SOP, SG-FD, SG-FFT-SD; (d) MF-SG-FFT, MF-SG-FFT-DWT, MF-SG-FFT-SOP; (e) MSC-MF-SG-FFT, MSC-FFT-MF-SG, MSC-MF-SG-FFT-DWT; (f) MSC-MF-SG-FFT-SOP, SNV-SG-FFT-FD, SNV-MF-SG-FFT-DWT
不同预处理的模型预测结果如
表 4. 不同预处理方法PLSR建模结果
Table 4. Prediction results of PLSR models under different preprocessing methods
|
4 结论
采用光谱仪获取NaCl气溶胶光谱,并对比分析了MF、SG、FFT、MSC、SNV、FD、SD、DWT、SOP以及其组合预处理方法对光谱噪声去除及PLSR建模的影响。以40个NaCl气溶胶样品为研究对象,从噪声处理结果可以看出,“MSC-MF-SG-FFT-SOP”组合处理后的NaCl气溶胶的特征峰突出明显,与原始光谱相比,RMSE由0.163降至0.030,SNR由25.369提升至46.630,在特征突出及性能保持上有较大的提升,有利于进一步的数据分析。使用SPXY划分数据集,然后对各种预处理方法分别建立浓度预测模型。浓度预测结果表明,当采用“MSC-MF-SG-FFT-SOP”组合时,预测结果表现最好,R2、RPD和RMSEP分别达到0.955、4.712和0.081,准确程度得到较大的提升,能实现对低浓度NaCl气溶胶的预测,具有一定的实际意义。故对本实验的NaCl气溶胶光谱,“MSC-MF-SG-FFT-SOP”的预处理组合方法为其最优预处理方法。由此可见,不同预处理方法,使用顺序及组合的不同,会获得不同的预测结果,在对光谱数据进行预处理时,选择恰当的方法对去噪性能及定量分析的准确度具有较大的影响。
[1] 朱首正, 卜令兵, 刘继桥, 等. 机载高光谱分辨率激光雷达探测大气气溶胶光学特性及污染研究[J]. 中国激光, 2021, 48(17): 1710003.
[2] 郭旺林, 邱荣, 王昶沣, 等. 激光诱导击穿光谱技术用于大气气溶胶中Cr元素的检测[J]. 量子电子学报, 2020, 37(6): 745-751.
[3] 郭旺林. 基于气溶胶成分分析的LIBS系统集成及应用[D]. 绵阳: 西南科技大学, 2020.
GuoW L. Integration and application of LIBS system based on aerosol composition analysis[D]. Mianyang: Southwest University of Science and Technology, 2020.
[4] 第五鹏瑶, 卞希慧, 王姿方, 等. 光谱预处理方法选择研究[J]. 光谱学与光谱分析, 2019, 39(9): 2800-2806.
[5] 张朱珊莹, 顾瀚文, 谢凯文, 等. 基于近红外光谱的预处理及组合方法[J]. 激光与光电子学进展, 2021, 58(16): 1617001.
[6] 陈添兵, 刘木华, 黄林, 等. 不同光谱预处理对激光诱导击穿光谱检测猪肉中铅含量的影响[J]. 分析化学, 2016, 44(7): 1029-1034.
Chen T B, Liu M H, Huang L, et al. Effects of different pretreatment method on laser-induced breakdown spectroscopy measurement of Pb in pork[J]. Chinese Journal of Analytical Chemistry, 2016, 44(7): 1029-1034.
[10] Yuan S, Chin S L, Zeng H P. Femtosecond filamentation induced fluorescence technique for atmospheric sensing[J]. Chinese Physics B, 2015, 24: 014208.
[11] 应璐娜, 周卫东. 对比分析多种化学计量学方法在激光诱导击穿光谱土壤元素定量分析中的应用[J]. 光学学报, 2018, 38(12): 1214002.
[12] 曾和平, 牛盛. 一种飞秒等离子体光栅诱导击穿光谱检测的方法及装置: CN109884034A[P]. 2019-06-14.
ZengH P, NiuS. A method and device for detecting femtosecond plasma grating induced breakdown spectrum: CN109884034A[P]. 2019-06-14.
[13] 张贵银, 张连水, 杨晓冬, 等. NO分子A2Σ→X2Π双光子激光感生荧光光谱[J]. 光学学报, 2003, 23(9): 1119-1122.
[14] 周昆鹏, 刘双硕, 崔健, 等. 基于荧光发射光谱的水质化学需氧量的检测[J]. 光谱学与光谱分析, 2020, 40(4): 1143-1148.
[15] 石鲁珍, 张景川, 王彦群, 等. 马氏距离与浓度残差剔除近红外异常样品研究[J]. 中国农机化学报, 2016, 37(6): 99-103.
Shi L Z, Zhang J C, Wang Y Q, et al. Research for eliminating outerlier samples in near-infrared spectroscopy by method of mahalanob distance-concentration residual[J]. Journal of Chinese Agricultural Mechanization, 2016, 37(6): 99-103.
[16] 郑开逸, 封韬, 张文, 等. 加权SPXYE(WSPXYE)算法及其在近红外光谱模型转移中的应用(英文)[J]. 光谱学与光谱分析, 2021, 41(3): 984-989.
[17] 徐杰, 陈颂伟, 谭煜亮, 等. 红外光谱预处理对粘纤/氨纶交织织物定量分析模型的影响[J]. 化纤与纺织技术, 2020, 49(1): 49-52.
Xu J, Chen S W, Tan Y L, et al. Influence of infrared spectrum pretreatment on the quantitative analysis model of viscose-spandex interweave fabric[J]. Chemical Fiber & Textile Technology, 2020, 49(1): 49-52.
[18] 徐向君, 王宪双, 李昂泽, 等. 基于激光诱导击穿光谱的茶叶品种快速分类[J]. 中国激光, 2019, 46(3): 0311003.
[19] 杨晖, 黄林, 陈添兵, 等. 光谱滤波法提高激光诱导击穿光谱对蔬菜中元素Pb的检测精度[J]. 分析化学, 2017, 45(8): 1123-1128.
Yang H, Huang L, Chen T B, et al. Spectral filtering method for improvement of detection accuracy of lead in vegetables by laser induced breakdown spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2017, 45(8): 1123-1128.
[20] 杨雪倩, 于慧春, 殷勇, 等. 拉曼光谱法检测玉米中黄曲霉毒素B1和玉米赤霉烯酮[J]. 核农学报, 2021, 35(1): 159-166.
Yang X Q, Yu H C, Yin Y, et al. Detection of aflatoxin B1 and Zearalenone in maize by Raman spectroscopy[J]. Journal of Nuclear Agricultural Sciences, 2021, 35(1): 159-166.
[21] 章琳颖, 黎静, 饶洪辉, 等. 基于LIBS的黄龙病脐橙元素检测与品质鉴别[J]. 激光与光电子学进展, 2020, 57(23): 233002.
[22] 张根伟, 彭思龙, 郭腾霄, 等. 一种离子迁移谱谱图重构及特征峰提取算法[J]. 光谱学与光谱分析, 2020, 40(9): 2681-2685.
[23] 惠光艳, 孙来军, 王佳楠, 等. 可见-近红外光谱的小麦硬度预测模型预处理方法的研究[J]. 光谱学与光谱分析, 2016, 36(7): 2111-2116.
[24] 王淑贤, 肖航, 杨振发, 等. 香精掺假普洱茶的近红外光谱检测[J]. 激光与光电子学进展, 2020, 57(23): 233005.
[25] 刘燕德, 张雨, 徐海, 等. 基于近红外光谱检测不同产地石榴的糖度[J]. 激光与光电子学进展, 2020, 57(1): 013002.
[26] 杨帆, 王鹏, 张宁超, 等. 一种基于小波变换的改进滤波算法及其在光谱去噪方面的应用[J]. 国外电子测量技术, 2020, 39(8): 98-104.
Yang F, Wang P, Zhang N C, et al. Improved filtering algorithm based on wavelet transform and its application in spectral denoising[J]. Foreign Electronic Measurement Technology, 2020, 39(8): 98-104.
[27] 余其彪. 基于高光谱的沉积物特征组分预测及沉积环境指示研究[D]. 南京: 南京师范大学, 2014.
YuQ B. Research on prediction of sediment characteristic components and deposition environment indicator based on hyperspectral[D]. Nanjing: Nanjing Normal University, 2014.
Article Outline
职辰好, 高亚敏, 向钰言, 张智, 尚滨鹏, 郭杰伟, 谢茂强, 刘明铭, 张楠, 孙陆, 刘伟伟. 光谱处理技术对提升光丝诱导荧光光谱检测低浓度NaCl气溶胶能力的实验研究[J]. 激光与光电子学进展, 2023, 60(1): 0101001. Chenhao Zhi, Yamin Gao, Yuyan Xiang, Zhi Zhang, Binpeng Shang, Jiewei Guo, Maoqiang Xie, Mingming Liu, Nan Zhang, Lu Sun, Weiwei Liu. Experimental Study of Spectral Processing Technology for Improving Detection Ability of Low-Concentration NaCl Aerosol by Filament-Induced Fluorescence Spectrum[J]. Laser & Optoelectronics Progress, 2023, 60(1): 0101001.