激光与光电子学进展, 2019, 56 (8): 083004, 网络出版: 2019-07-26   

基于拉曼光谱的混合物组分识别方法 下载: 1845次

Identification of Components in Mixtures Based on Raman Spectroscopy
作者单位
1 江南大学轻工过程先进控制教育部重点实验室, 江苏 无锡 214122
2 北京卓立汉光仪器有限公司, 北京 101102
摘要
提出了一种基于拉曼光谱的混合物组分识别新方法。对混合物的拉曼光谱进行背景校正和去噪处理,利用Voigt函数对拉曼谱峰进行拟合,获取其谱峰的拉曼位移、半峰全宽及强度作为混合物特征参数向量,通过与数据库纯净物特征向量进行相关性分析,实现混合物组分的有效识别。构建了由18种纯净物拉曼光谱数据构成的标准组分数据库,并对6种混合物进行了组分识别实验。实验结果表明,所提方法的识别准确率达到100%。
Abstract
A novel algorithm for component identification in mixtures based on Raman spectroscopy is proposed, in which background correction and de-noising operation on the Raman spectra of mixtures are firstly performed, the Voigt function is then used to fit the Raman peaks to obtain the Raman shifts, full widths at half maximum, and peak intensities as the feature parameter vector of mixtures, and finally, the effective component identification of mixtures is finally realized via the correlation analysis of the feature vectors between the mixtures and the pure substances in the database. The Raman spectral data of 18 pure substances are used to build a standard database, and the component identification experiment of 6 kinds of mixtures are conducted. The experimental results show that the recognition accuracy of the proposed algorithm is up to 100%.

1 引言

混合物中的成分识别在食品安全检测[1]、水质鉴定[2]、安检、反恐、缉毒[3]等众多领域应用广泛,识别的方法也多种多样。传统的识别方法有质谱色谱联用法[4]、生物免疫法、固相萃取法[5]、化学实验室法等,它们分别存在着检测对象单一、重复率低、操作复杂和实验条件要求严格等问题。近年来,拉曼光谱因其快速、无损且重复性高等优点,被应用到许多场合。现有的利用拉曼光谱实现混合物成分检测的方法有峰对比法[6-7]、子空间重叠法[8]、最小二乘支持向量机[9]等,但都存在着一些不足。

峰对比法是通过比较混合物拉曼光谱与标准库中物质的拉曼光谱的波峰或波谷位置,并结合有关化学键或功能团的拉曼光谱特征,实现物质识别。峰对比法在一些特定场合能有效识别混合物中的成分,但大部分情况下混合物的拉曼光谱谱峰众多,会出现重叠和覆盖的现象。同时由于检测环境复杂、仪器精度较低,拉曼谱峰可能会有偏移,并且峰对比法依赖于人眼的判定,较为费时费力,这些都在一定程度上造成了峰对比法的局限性。

子空间重叠法将待定性混合物光谱信息视为向量,通过计算混合物光谱与标准库光谱的子空间夹角,并根据其变化,排列筛选出混合物的组分。该方法要求待识别混合物中的所有组分应包含在已知的标准数据库中,当混合物中的待识别成分不在已知数据库中时,算法将无法给出识别结果。

使用基于多重迭代优化的最小二乘支持向量机模型对混合物的拉曼光谱进行识别,可以得到混合物的组分信息。该方法在训练模型时需要大量的训练样本,这会影响识别方法的实用性和快速性。

在已有研究工作的基础上,本文提出一种拉曼光谱结合化学计量学的新方法来实现混合物中的成分识别。该方法首先对混合物的拉曼光谱进行预处理,然后拟合得到谱峰的特征参数向量,最后将混合物光谱特征参数向量与标准数据库中样本的特征参数向量进行相关性分析,能快速、无损地识别混合物中的成分。

2 混合物成分识别算法

所提出的基于拉曼光谱的混合物组分识别算法的整体流程图如图1所示,其主要步骤说明如下。

图 1. 算法流程图

Fig. 1. Flow chart of algorithm

下载图片 查看所有图片

Step1:受混合物本身特性、仪器精度和测量方法等因素影响,所测得的混合物光谱中有较强的荧光背景和噪声,进行背景校正[10-11]和去噪[12-13]等预处理操作是进行后期工作的前提。利用样条插值法对连续背景进行校正[14];对校正后的拉曼光谱采用“sym8”小波进行降噪,小波分解层数为5层,使用启发式软阈值选择策略;最后对降噪后的拉曼信号进行归一化操作,以便于后续的数据处理。

Step2:谱峰辨识。

在整个光谱区间里,利用相邻点极大极小值法获得光谱区间内的所有极大值点( λip, Iip)以及该极大值点的左、右两侧极小值点( λim, Iim)、( λi+1m, Ii+1m),i=1,2,…,N,其中, λipIipλimIim分别为极大值点和左侧极小值点处的拉曼谱峰位移值和拉曼强度值,i为极大值点的序号,p表示该点为极大值点,m表示该点为极小值点,N为极大值点的个数,也是所有待识别拉曼谱峰的总数。

利用斜率比较法判断待识别谱峰( λip, Iip)是否为重叠峰[15]。如图2所示,设( λim, Iim)、( λi+1m, Ii+1m)分别是极大值点( λip, Iip)的左、右两侧极小值点。若斜率K=( Ii+1m- Iim)/( λi+1m- λim)小于给定的阈值TH,则判定待识别谱峰( λip, Iip)为非重叠谱峰,并记待拟合区间Hs=[ λim, λi+1m],s表示单峰;若斜率KTH,则判定待识别谱峰( λip, Iip)为重叠谱峰,计算斜率K=( Ii+2m- Iim)/( λi+2m- λim),若存在KTH,重复这一操作,直至斜率K小于TH,记待拟合区间Hd=[ λim, λi+lm],d表示重叠峰,l为待拟合区间谱峰个数。本文中TH设置为0.000015。

图 2. 重叠谱峰示意图

Fig. 2. Schematic of overlapping spectrum peaks

下载图片 查看所有图片

Step3:进行单峰拟合和重叠峰分解操作。理论上,拉曼光谱的谱峰是洛伦兹线型[15],但由于混合物特性、仪器精度、测量方法等影响,实际得到的拉曼光谱的谱峰是Voigt线型,可表示为

I(λ)=Icθw2(λ-λc)2+w2+(1-θ)exp(λ-λc)22w2,(1)

式中:I(λ)表示拉曼位移为λ处的光谱强度;λcIcwθ分别表示谱峰的拉曼位移、拉曼强度、半峰全宽和高斯-洛伦兹系数;c表示该点为谱峰。不同的纯净物有不同的拉曼特征峰,其特征峰里的λcIcwθ反映了谱峰的波形特征。

拉曼光谱中不可避免会有谱线重叠的现象。谱线之间的重叠会影响每个谱峰特征参数的提取[16-17],这些重叠谱峰可以看作是Vogit峰的线性叠加,即

I(λ)=t=1lItθtwt2(λ-λt)2+wt2+(1-θt)expλ-λt22wt2,(2)

式中:重叠谱峰的序号t=1,2,…,l。对于(1)式的单峰和(2)式的重叠峰,在给定的待拟合区间(HsHd),采用基于Levenberg-Marquardt算法的曲线拟合方法进行谱峰拟合。该算法是一种迭代寻优的算法,其迭代初始值设置如下:初始的拉曼谱峰位移和强度为拟合区间各谱峰位移及其强度,半峰全宽初值为15 cm-1,高斯-洛伦兹系数为0.5。

通过Vogit函数拟合,可得到每个谱峰的拉曼位移、强度和半峰全宽及高斯-洛伦兹系数。利用每个谱峰的拉曼位移、强度和半峰全宽组成待识别谱峰( λip, Iip)的特征向量(λi,Ii,wi),其中i=1,2,…,N,i为谱峰序号,N为谱峰总数。按照拉曼位移λi由小到大的顺序,将N组谱峰特征向量组成一个一维向量,即待测混合物或标准谱库各物质的光谱特征向量A=(λ1,I1,w1,…,λi,Ii,wi,…,λN,IN,wN)。

Step4:利用所得到的混合物特征参数向量组,与标准数据库中各物质的特征参数向量组进行相似度分析,实现混合物成分的检测。

标准谱库中各物质和待识别混合物的谱峰个数不同,导致构建的混合物谱峰特征向量个数与标准谱库中各物质特征向量个数不同,难以直接进行相似度分析。因此有必要对混合物的特征进行筛选匹配,以构建具有相同特征维数的特征向量。考虑到拉曼谱峰漂移现象,利用标准库中物质特征峰的拉曼位移这一特征,在一定的阈值范围内从混合物的特征峰里寻找峰位相近的特征峰[18],以构建最终的识别特征向量。具体方法如下。

设待识别的混合物特征向量为F=( λ1v, I1v, w1v,…, λqv, Iqv, wqv,…, λMv, IMv, wMv),其中q=1,2,…,M,M为混合物拉曼光谱特征峰个数,q为混合物谱峰序号,v表示混合物数据。对于标准谱库中的某种给定物质,设其特征向量P=( λ1h, I1h, w1h,…, λjh, Ijh, wjh,…, λuh, Iuh, wuh),j=1,2,…,u,u为该物质的拉曼光谱特征峰个数,j为纯净物谱峰序号,h表示纯净物数据。对于标准库物质的谱峰信息 λjh,判断混合物M组谱峰特征向量中的 λqv有无在许可的谱峰偏移范围(设置的阈值为8 cm-1)内,若有,则记录混合物中的特征参数向量( λjb, Ijb, wjb);若无,则混合物拉曼峰特征参数向量记为(0,0,0)。重复这一操作,直至纯净物所有特征峰都进行了峰位匹配。这样就可以得到一组和标准库物质特征向量同维数的特征向量Q=( λ1b, I1b, w1b,…, λjb, Ijb, wjb,…, λub, Iub, wub),b表示经匹配得到的数据。

此时,待识别混合物和标准库中给定物质的相关系数可表示为

r=P(QT)PPT)×Q(QT)]12,(3)

式中:符号T表示转置运算。相关系数表示混合物中存在标准谱库中给定物质的可能性,其在区间[0,1)内取值。设置一个合适的阈值来分割所得到的相关系数,即可判断混合物中是否存在该特定纯净物,本文设置的阈值为0.8,遍历标准库从而实现混合物成分的识别。

3 光谱采集设备及数据介绍

利用18种纯净物构建标准数据库:丙酮(acetone)、环己烷(cyclohexane)、乙醇(ethanol)、磷酸(phosphoric acid)、甲基苯丙胺盐酸盐(methamphetamine hydrochloride)、氧-6单乙酰吗啡盐酸盐(oxy-6 monoacetylmorphine hydrochloride)、赤磷(red phosphorus)、海洛因盐酸盐(heroin hydrochloride)、氮芥气(nitrogen mustard)、二苯羟乙酸(diphenyl glycolic acid)、芥子气(mustard gas)、酒石酸(tartaric acid)、硫酸(sulfuric acid)、沙林(sarin)、碳酸钙(calcium carbonate)、硝酸(nitric acid)、乙腈(acetonitrile)、尿素(urea)。在这些纯净物中,丙酮极易溶于水和乙醇、乙醚等有机溶剂,合成的溴代苯丙酮可作为毒品的原料;环己烷易燃,且溶于丙酮,常被添加于丙酮中。准确识别这些有毒有害物质对维护公共安全有着重要作用。将丙酮、环己烷、乙醇三种物质混合,共得到6种混合物,混合物中纯净物按等比例混合,以验证本文方法的识别性能。利用北京卓立汉光仪器有限公司生产的便携式拉曼光谱仪(Finder Edge)采集这24种物质的拉曼光谱(18种纯净物,6种混合物),光谱仪激光波长785 nm,光谱范围为150~2700 cm-1,功率为0~350 mW,分辨率为8~10 cm-1

图3给出了部分纯净物和混合物的拉曼光谱图。从图中可以看出,每种纯净物都含有较多的谱峰,且部分谱峰之间存在重叠现象。

图 3. 6种纯净物和混合物拉曼光谱图。(a)纯净物;(b)混合物

Fig. 3. Raman spectra of six kinds of pure substances and mixtures. (a) Pure substance; (b) mixture

下载图片 查看所有图片

4 实验过程及结果

图4为丙酮、环己烷和乙醇的混合物原始光谱图和连续背景线,以及背景校正和降噪后归一化处理得到的光谱图。

经过预处理操作后,识别单峰和重叠峰,并对单峰进行拟合,对重叠峰进行分解。拟合、分解的效果如图5所示,单峰拟合的平均方均根误差为3.42%,重叠峰分解的平均方均根误差为4.83%,拟合结果较好。

图 4. 实验过程图。(a)原始光谱图和连续背景;(b)预处理后光谱图

Fig. 4. Experimental process. (a) Original spectrum and continuous background; (b) pretreated spectrum

下载图片 查看所有图片

图 5. 谱峰拟合及分解图。(a)单峰的拟合图;(b)重叠峰的分解图

Fig. 5. Peak fitting and decomposition plots. (a) Single peak fitting plot; (b) overlapping peak decomposition plot

下载图片 查看所有图片

分解完重叠峰后,得到重叠峰的特征参数,加上单峰里的特征参数,按特征参数里的拉曼位移值由小到大的顺序,将特征参数向量组进行排序,构成混合物溶液拉曼光谱的特征参数向量。将混合物特征参数向量与标准库中纯净物的特征参数向量作相关性分析,根据相关系数的大小来识别混合物中的成分。

图6所示,含有丙酮、环己烷、酒精的混合物谱峰重叠严重,仅通过人眼采用峰对比法较难将其中的3种成分识别出来。利用提出的方法得到的3种成分相关系数分别为0.8192、0.9897、0.8724,比所设置的阈值大,判定为存在于混合物中,3种成分都被成功识别。

图 6. 混合溶液与3种纯净物的光谱图。(a)丙酮;(b)环己烷;(3)乙醇

Fig. 6. Spectrogram of mixed solution and three kinds of pure substances. (a) Acetone; (b) cyclohexane; (c) ethanol

下载图片 查看所有图片

表1所示的测试结果中,当混合物中含有丙酮、环己烷及乙醇之一或更多时,对应的纯净物组分都能被准确地识别出来(表中黑体所示),验证了方法的有效性。

表 1. 6种混合物的识别结果

Table 1. Identification results of six kinds of mixtures

Pure substanceMixture
Acetone+cyclohexane+ethanolAcetone+cycloexaneEthanol+cycloexaneAcetoneCyclohexaneEthanol
Acetone0.81920.84690.00000.96380.00000.0000
Cyclohexane0.98970.99990.83070.00000.99990.0000
Ethanol0.87240.65280.87250.00000.63660.8604
Phosphoric acid0.56470.49460.00000.56330.00000.0000
MethamphetamineHydrochloride0.55090.51230.40700.44380.37910.2843
Oxy-6 monoacetylmor-phinehydrochloride0.58170.56420.51570.00000.54230.0000
Red phosphorus0.48790.48810.00000.53300.00000.0000
Heroin hydrochloride0.00000.00000.00000.00000.00000.0000
Nitrogen mustard0.18140.46410.33820.00000.54480.0000
Diphenyl glycolic acid0.33540.33540.33520.00000.33520.0000
Mustard gas0.39050.00000.00000.53470.00000.0000
Tartaric acid0.47740.51480.38960.28240.27990.3896
Sulfuric acid0.41130.34680.44380.34590.00000.4438
Sarin0.50030.49860.53220.00000.51210.0000
Calcium carbonate0.00000.00000.57620.00000.00000.5762
Nitric acid0.34090.00000.30230.00000.00000.3410
Acetonitrile0.52590.62340.00000.33520.52060.0000
Urea0.00000.00000.00000.00000.00000.0000

查看所有表

5 结论

提出了一种基于拉曼光谱的混合物组分识别方法,该方法对混合物拉曼光谱进行荧光背景校正和信号降噪等预处理操作;利用斜率判断法对拉曼光谱的谱峰进行重叠峰判断;并基于Voigt函数对原始谱峰进行拟合重构,构建了标准库中的物质和待识别混合物的特征向量;利用标准库中物质的谱峰位置信息对混合物特征向量进行了特征参数匹配筛选;最终获得了混合物和标准库中物质的相关系数。实验研究结果表明,本文方法能够充分利用多谱峰特征信息,克服不同物质混合带来的谱峰重叠干扰,实现混合物中组分的有效识别。需要说明的是,如果两个谱峰因极度重叠而呈现单峰形态,本文的重叠峰分解法将会失去作用,从而导致识别准确率降低。如何提高重叠峰识别的准确度是下一步需要解决的问题。

参考文献

[1] 雷星, 刘晔, 黄竹林, 等. 高灵敏度锥形光纤SERS探针及其在农残检测中的应用[J]. 光学学报, 2015, 35(8): 0806001.

    Lei X, Liu Y, Huang Z L, et al. High sensitivity tapered fiber SERS probe and its application on pesticide residues detection[J]. Acta Optica Sinica, 2015, 35(8): 0806001.

[2] 王娟, 张飞, 王小平, 等. 平行因子法结合自组织映射神经网络的三维荧光特征及其与水质的关系[J]. 光学学报, 2017, 37(7): 0730003.

    Wang J, Zhang F, Wang X P, et al. Three-dimensional fluorescence characteristics by parallel factor method coupled with self-organizing map and its relationship with water quality[J]. Acta Optica Sinica, 2017, 37(7): 0730003.

[3] 和挺, 沈京玲. 太赫兹光谱技术在毒品检测中的应用研究[J]. 光谱学与光谱分析, 2013, 33(9): 2348-2353.

    He T, Shen J L. Applications of terahertz spectroscopy in illicit drugs detection[J]. Spectroscopy and Spectral Analysis, 2013, 33(9): 2348-2353.

[4] 刘彬, 刘云虎. 食品塑料包装中18种多环芳烃的气相色谱-质谱联用检测方法研究[J]. 食品科技, 2018, 43(6): 317-321.

    Liu B, Liu Y H. Determination of 18 kinds of polycyclic aromatic hydrocarbons in food plastic packaging[J]. Food Science and Technology, 2018, 43(6): 317-321.

[5] 吴丽洒, 赵明月, 葛畅, 等. 固相萃取-GC/MS法同时测定卷烟主流烟气中的16种多环芳烃[J]. 烟草科技, 2018, 51(4): 46-52.

    Wu L S, Zhao M Y, Ge C, et al. Simultaneous determination of 16 polycyclic aromatic hydrocarbons in mainstream cigarette smoke by solid phase extraction-GC/MS[J]. Tobacco Science & Technology, 2018, 51(4): 46-52.

[6] 李开开, 苗翠英, 王登魁. 利用拉曼光谱对毒品的检验及基于R软件的数据分析[J]. 光散射学报, 2018, 30(2): 156-162.

    Li K K, Miao C Y, Wang D K. Detection of drugs by Raman spectroscopy and data analysis based on R software[J]. The Journal of Light Scattering, 2018, 30(2): 156-162.

[7] 马靖. 激光拉曼光谱技术对氯代有机混合物的快速检测研究[J]. 光谱学与光谱分析, 2014, 34(7): 1865-1868.

    Ma J. Rapid detection of chlorinated organic mixture by laser Raman spectroscopy[J]. Spectroscopy and Spectral Analysis, 2014, 34(7): 1865-1868.

[8] 黄培贤, 姚志湘, 粟晖, 等. 基于子空间重合判断的混合醇组分光谱识别方法[J]. 分析测试学报, 2013, 32(3): 281-286.

    Huang P X, Yao Z X, Su H, et al. Spectral pattern recognition of mixed alcohols by means of the method based on judging the subspace coincidence[J]. Journal of Instrumental Analysis, 2013, 32(3): 281-286.

[9] 章颖强, 董伟, 张冰, 等. 基于拉曼光谱和最小二乘支持向量机的橄榄油掺伪检测方法研究[J]. 光谱学与光谱分析, 2012, 32(6): 1554-1558.

    Zhang Y Q, Dong W, Zhang B, et al. Research on detection method of adulterated olive oil by Raman spectroscopy and least squares support vector machine[J]. Spectroscopy and Spectral Analysis, 2012, 32(6): 1554-1558.

[10] 杨桂燕, 李路, 陈和, 等. 基于广义Whittaker平滑器的拉曼光谱基线校正方法[J]. 中国激光, 2015, 42(9): 0915003.

    Yang G Y, Li L, Chen H, et al. Baseline correction method for Raman spectra based on generalized Whittaker smoother[J]. Chinese Journal of Lasers, 2015, 42(9): 0915003.

[11] Wang X, Fan X G, Xu Y J, et al. A baseline correction algorithm for Raman spectroscopy by adaptive knots B-spline[J]. Measurement Science and Technology, 2015, 26(11): 115503.

[12] 范贤光, 王秀芬, 王昕, 等. 基于特征提取的低信噪比拉曼光谱去噪方法研究[J]. 光谱学与光谱分析, 2016, 36(12): 4082-4087.

    Fan X G, Wang X F, Wang X, et al. Research of the Raman signal de-noising method based on feature extraction[J]. Spectroscopy and Spectral Analysis, 2016, 36(12): 4082-4087.

[13] 王晓彬, 吴瑞梅, 刘木华, 等. 多菌灵农药激光拉曼光谱的小波去噪方法研究[J]. 食品工业科技, 2014, 35(5): 277-280.

    Wang X B, Wu R M, Liu M H, et al. Study for wavelet denoising methods of laser Raman spectrum of carbendazim pesticide[J]. Science and Technology of Food Industry, 2014, 35(5): 277-280.

[14] Tan B, Huang M, Zhu Q B, et al. Detection and correction of laser induced breakdown spectroscopy spectral background based on spline interpolation method[J]. Spectrochimica Acta Part B: Atomic Spectroscopy, 2017, 138: 64-71.

[15] 檀兵, 黄敏, 朱启兵, 等. 激光诱导击穿光谱谱峰元素自动识别方法研究[J]. 中国激光, 2018, 45(8): 0811002.

    Tan B, Huang M, Zhu Q B, et al. Method on elements automatic identification of spectral peaks in laser-induced breakdown spectroscopy[J]. Chinese Journal of Lasers, 2018, 45(8): 0811002.

[16] 李宝强, 李翠萍, 黄启斌, 等. 基于小波变换的便携式质谱重叠峰解析方法研究[J]. 质谱学报, 2015, 36(3): 199-205.

    Li B Q, Li C P, Huang Q B, et al. Research of portable mass spectrometer overlapped peak resolution method based on wavelet transform[J]. Journal of Chinese Mass Spectrometry Society, 2015, 36(3): 199-205.

[17] Owusu-Ware S K, Chowdhry B Z, Leharne S A, et al. . Quantitative analysis of overlapping processes in the non-isothermal decomposition of chlorogenic acid by peak fitting[J]. Thermochimica Acta, 2013, 565(24): 27-33.

[18] 侯兴松, 张健, 镡云. 拉曼特征峰提取在多组分混合溶液检测中的应用[J]. 现代科学仪器, 2014( 4): 100- 104.

    Hou XS, ZhangJ, TanY. Application of Raman spectra feature extraction in material identification[J]. Modern Scientific Instruments, 2014( 4): 100- 104.

刘财政, 朱启兵, 黄敏, 李敏. 基于拉曼光谱的混合物组分识别方法[J]. 激光与光电子学进展, 2019, 56(8): 083004. Caizheng Liu, Qibing Zhu, Min Huang, Min Li. Identification of Components in Mixtures Based on Raman Spectroscopy[J]. Laser & Optoelectronics Progress, 2019, 56(8): 083004.

本文已被 2 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!