激光与光电子学进展, 2019, 56 (3): 033002, 网络出版: 2019-07-31  

基于组合算法的油类污染物三维荧光光谱分析 下载: 949次

Three-Dimensional Fluorescence Spectra Analysis of Oil Contaminants Based on Algorithm Combination Methodology
作者单位
华北理工大学电气工程学院, 河北 唐山 063210
摘要
针对油类污染物成分复杂、光谱重叠难以识别的问题,提出三维荧光光谱结合组合算法(ACM)。将交替三线性分解(ATLD)、自加权交替三线性分解(SWATLD)与平行因子分析(PARAFAC)算法组合,实现3种算法的优势互补。通过配制以四氯化碳为溶剂的不同质量浓度的柴油、汽油和煤油的混合溶液,利用F-7000荧光光谱仪测量混合溶液的三维荧光光谱,采用空白扣除法与缺损数据修复——主成分分析法进行预处理消除散射干扰,对三维光谱数据矩阵进行分解,并与以上3种算法解析结果进行对比。结果表明,ACM对组分数不敏感,且解析结果更准确,样本中对柴油、汽油和煤油的平均回收率分别为 96.68%、97.83%、97.11%。实现了混合油类物质的定性、定量分析,具有一定的普适性。
Abstract
This study proposes a new technique that combines three-dimensional fluorescence spectra with algorithm combination methodology (ACM) to address issues associated with complex components of oil pollutants and the difficulty in identifying their overlapping spectra. By combining alternating trilinear decomposition (ATLD), self-weighted alternating trilinear decomposition (SWATLD), and parallel factor analysis (PARAFAC), ACM realizes the complementary advantages of using three algorithms. First, using carbon tetrachloride as the target contaminant, a three-component mixed solution of diesel, gasoline, and kerosene with different concentrations are prepared. Then, the three-dimensional fluorescence spectra of the mixed solution are measured using a F-7000 fluorescence spectrometer. Blank deduction and missing data recovery-principal component analysis are then employed as pretreatment methods to eliminate the scattering interference. Finally, ACM is used to decompose the three-dimensional spectral data matrix. Results are compared with the three separate algorithms for component analysis, revealing that ACM is insensitive to component concentration. The average recoveries for diesel, gasoline, and kerosene are 96.68%, 97.83% and 97.11%, respectively, which further indicated that this method is more universal and can be used for the qualitative and quantitative analyses of contaminants in oil mixtures.

1 引言

二阶校正算法可在未知干扰存在的情况下分辨和测量出目标分析物,并保证其具有较高的精度,从而实现“二阶优势”,因此广泛应用于三维荧光光谱数据的分析中[1-7]。目前,研究人员已开发了许多分析性能出色的二阶校正算法。Bro[8]提出的平行因子分析(PARAFAC)算法基于严格意义上的最小二乘原则,具有抗噪声强、模型稳定、微小预期误差等优点,可以实现三维数据阵列的最佳拟合,应用范围较广。但该算法收敛速度较慢,对组分数敏感。基于此,Wu等[9]提出交替三线性分解(ATLD)算法。而通过提取对角主元和切尾奇异值求解广义逆,极大提高了收敛速度并降低了对组分数的敏感度,从而实现三线性分解[10]。然而,在取对角元时ATLD方法对噪声敏感,分析结果的准确性降低。Chen等[11]在ATLD的基础上提出了自加权交替三线性分解(SWATLD)算法。即通过创造性的增加额外权重项,达到了平衡各目标函数的目的,该算法既继承了对组分数不敏感、收敛速度快等优点,又降低了噪声水平的影响。但是在抗共线程度方面,SWATLD算法仍有待提高。

基于三线性分解算法迭代过程中损失函数的变化,本文将迭代过程进行划分,提出了三线性迭代法的组合算法(ACM),即将ATLD、SWATLD与PARAFAC算法有机组合在一起,充分发挥每种算法的优势,实现二阶校正算法的优势互补[12]。采用ACM对三组分矿物油样品的三维荧光光谱数据进行解析,验证了ACM用于光谱重叠的混合油类物质检测的有效性。

2 基本原理

2.1 算法组合策略

三线性模型表达式为

xijk=n=1Nainbjnckn+eijk,i=1,2,,I;j=1,2,,J;k=1,2,,K,(1)

式中xijk为三维数据矩阵X中的元素;eijk为误差矩阵E中的对应元素;ainbjnckn分别为载荷ABC矩阵中的元素。

依据损失函数 i=1Ij=1Jk=1Kxijk-n=1Nainbjnckn2的变化,对三线性分解算法的迭代优化过程进行了分解,图1所示为损失函数随迭代次数增加的变化情况。从算法的随机初始值到具有物理意义的分析结果的收敛,这一过程大致可以分为初始化过程、初值优化过程及算法收敛过程3个部分。

图 1. 损失函数的变化过程

Fig. 1. Change process of loss function

下载图片 查看所有图片

比较ATLD,SWATLD和PARAFAC算法的性能与迭代过程的划分,不难发现3种算法更侧重于优化迭代过程的不同。因此,为了更好地利用各算法的优势,可以采用以下方式对以上三种算法进行组合:1) 采用ATLD算法来对随机初始值进行优化;2) 采用SWATLD算法对ATLD算法收敛结果进行进一步优化;3) 将SWATLD算法所得结果用PARAFAC算法进行优化,这样便可以实现对数据的三线性分解。这一算法被称为组合算法ACM。

当数据结构简单时,每种算法得到的结果无显著差异。因此,为了使算法在处理数据时更高效,可以进一步优化ACM。在SWATLD算法过程中,当数据结构相对简单时,其损失函数单调下降直至收敛,将这种现象整合到ACM中,如果SWATLD算法的损失函数单调收敛,则所得结果无需采用PARAFAC算法优化,否则,需要引入PARAFAC算法。ACM整个流程如图2所示。

图 2. ACM的数据分析流程图

Fig. 2. Data analysis flow chart of ACM

下载图片 查看所有图片

2.2 核一致诊断法

核一致诊断法(CORCONDIA)是由Bro等[13]提出的用于估计三线性模型组分数的方法,通过比较模型中两个相关矩阵(最小二乘拟合阵G和超对角阵T)之间的相似度确定体系的因子数为

c=100×1-i=1Fj=1Fk=1Fgijk-tijk2i=1Fj=1Fk=1Ftijk2,(2)

式中F为模型的因子数;gijk为最小二乘拟合阵G的元素;tijk为超对角阵T的元素。

当模型选取的因子数F小于或等于正确的因子数时,c≈100%;否则,c≈0。通常当c≥60%时,认为因子数选取合理,三线性分解结果具有较高精度。

2.3 残差分析法

在复杂体系中,核一致值并不一定随因子数增加而单调递减。可以结合另一种确定因子数的有效方法即残差分析法确定最优组分数,依据模型残差平方和(RSS)的变化为

s=i=1Ij=1Jk=1Kεijk2(3)

若因子数F由1递增,则RSS会随之减小。随着F值逐渐逼近实际因子的数量,其变化幅度会越来越小。若RSS保持稳定,则对应F值可认定为最佳因子数[14]

3 实验分析

3.1 仪器与试剂

实验采用Hitachi F-7000型荧光光谱仪。选择三种成品油(0#柴油、95#汽油、普通煤油)作为油类污染物的代表,四氯化碳作为溶剂。实验中,四氯化碳的拉曼线和激发光的波长是十分接近的,因此对荧光光谱干扰极其微弱。

3.2 实验方法

分别称量各1 g的0#柴油、95#汽油和普通煤油并置于100 mL容量瓶中,加入四氯化碳溶解稀释后得到三种油的100 mg/L标准溶液;分别量取不同体积的上述溶液并于16支50 mL的容量瓶中混合。加入四氯化碳溶剂,定容配制成不同质量浓度的样品,并对其进行编号:1#~10#为校正样品,11#~16#为预测样品。各样品中矿物油的质量浓度如表1所示。

表 1. 样品中油类物质的质量浓度

Table 1. Concentration of oil in the samplemg/L

Sample0# Diesel95# GasolineKeroseneSample0# Diesel95# GasolineKerosene
11.05.22.690.91.20.8
20.24.82.4101.01.01.0
31.23.61.2110.33.51.3
40.43.21.8120.42.82.0
52.52.63.5130.52.22.6
60.62.45.0140.61.73.3
75.01.24.5150.71.43.9
80.81.02.0160.81.04.5

查看所有表

实验参数设置:激发波长为250~430 nm,步长为5 nm,狭缝宽度为10 nm;发射波长为310~520 nm,步长为5 nm,狭缝宽度为10 nm;扫描速率为12000 nm/min。标准条件下测量3次,取平均值。

4 结果与讨论

采用ACM进行荧光分析的基本步骤如图3所示,通过F-7000荧光光谱仪分别测量实验样品,获得激发-发射光谱矩阵(EEM);对荧光数据进行预处理去散射;并将所有样本的EEM组成三维数据矩阵(EEMs);利用ACM对EEMs进行三线性分解,得到样品中各组分的特征光谱与相对质量浓度。

图 3. 基于ACM的三线性分解

Fig. 3. Trilinear decomposition based on ACM

下载图片 查看所有图片

4.1 数据预处理

以柴油、汽油、煤油的标准溶液为例,如图4(a)~(c)所示,当Ex=Em时,散射峰强度远远大于荧光峰且其数据不符合三线性,不利于三线性分解。鉴于此,可采用空白扣除法消除拉曼散射干扰,采用缺损数据修复——主成分分析(MDR-PCA)法消除瑞利散射的影响[15]。处理后荧光光谱如图4(d)~(f)所示。

图 4. 标准溶液未校正的三维荧光光谱和预处理后的三维荧光光谱。(a)(d) 0#柴油;(b)(e) 95#汽油;(c)(f) 普通煤油

Fig. 4. Three-dimensional fluorescence spectra of uncorrected standard solution and after pretreatment. (a) (d) 0# Diesel; (b)(e) 95# gasoline; (c)(f) ordinary kerosene

下载图片 查看所有图片

4.2 ACM算法分辨柴油、汽油和煤油混合溶液

扫描校正样品1#~10#和预测样品11#~16#,经过数据预处理去除散射,并构造16×37×43的三维数矩阵X1。采用核一致诊断法与残差分析法结合样本的实际情况估计实验测量的三维数据阵的因子数,得到其变化情况,如图5所示。

假设体系中含5个因子,发现其核一致性总是接近100%。而3因子分析的残差平方和显著低于2因子分析的,其与4因子分析的差别较小,表明因子数为3或4时可能较为合理。已知样本是由柴油、汽油和煤油3种物质混合而成,若依照样本配制实际情况选择因子数为3,则ATLD解析所得激发、发射光谱如图6(a)、(b)所示,而ACM解析所得激发、发射光谱如图6(c)、(d)所示。实线为真实光谱,虚线为解析光谱。可以看出,两种算法的解析光谱与真实光谱吻合度较好,表明ATLD、ACM能够成功地实现混合油类的定性光谱解析。相比之下,ACM较之ATLD分辨所得光谱更接近真实值。

图 5. X1的核一致诊断结果及残差平方和分析结果

Fig. 5. X1 nuclear consensus diagnosis results and residual square sum analysis results

下载图片 查看所有图片

选取因子数4来考察各算法对组分数的敏感性,表2~4分别列出了因子数为3和4时各算法解析柴油、汽油、煤油的预测质量浓度和回收率。由于噪声、共线性等影响,可以看出,ATLD与SWATLD解析结果的准确性低于PARAFAC与ACM,但PARAFAC在因子数为4时,出现对组分数敏感的问题,解析出不合理的结果(结果未列出)。而ACM即使在选取因子数大于实际组分数时,也能给出准确的解析结果,表明ACM对组分数不敏感、解析结果稳定可靠。柴油、汽油、煤油的平均回收率分别为96.68%、97.83%、97.11%,质量浓度预测偏差较小,定量表明ACM分解算法对油类混合物具有良好的分辨率。

图 6. 柴油、汽油和煤油的(a)(b) ATLD解析光谱与(c)(d) ACM解析光谱

Fig. 6. (a)(b) ATLD analytical spectra and (c)(d) ACM analytical spectra of diesel, gasoline and kerosene

下载图片 查看所有图片

表 2. 不同组分数下各算法解析柴油所得结果

Table 2. Results obtained by each algorithm for analyzing diesel under different component numbers

SampleActualN=3N=4
ATLDSWATLDPARAFACACMATLDSWATLDACM
110.30.280.280.290.290.280.280.29
120.40.390.390.380.380.370.390.38
130.50.480.470.470.470.480.470.47
140.60.560.580.590.590.560.580.59
150.70.660.670.690.690.660.670.68
160.80.780.780.780.780.780.780.78
Average recovery /%95.3395.7996.6896.6894.5095.7996.44

查看所有表

表 3. 不同组分数下各算法解析汽油所得结果

Table 3. Results obtained by each algorithm for analyzing gasoline under different component numbers

SampleActualN=3N=4
ATLDSWATLDPARAFACACMATLDSWATLDACM
113.53.413.363.383.393.413.293.39
122.82.692.562.772.762.692.562.76
132.22.082.082.102.162.082.082.16
141.71.681.641.671.681.681.641.68
151.41.381.361.371.381.381.291.38
161.00.940.940.950.960.940.940.96
Average recovery /%96.5794.9397.0197.8396.5793.7697.83

查看所有表

表 4. 不同组分数下各算法解析煤油所得结果

Table 4. Results obtained by each algorithm for analyzing kerosene under different component numbers

SampleActualN=3N=4
ATLDSWATLDPARAFACACMATLDSWATLDACM
111.31.271.231.261.241.271.231.24
122.01.871.961.971.951.861.941.95
132.62.562.542.552.552.562.542.55
143.33.273.233.283.263.263.233.26
153.93.743.713.753.773.743.713.77
164.54.344.344.324.334.344.324.33
Average recovery /%96.8596.6397.5197.1196.7296.3997.11

查看所有表

ACM算法用于分离光谱重叠的油类混合物溶液体现了以下优势:1) 光谱解析结果精度高,分析目标组分更加可靠;2) 消除较高噪声水平影响,并保证共线性和组分数的不敏感性;3) 基于数据结构自行判断是否收敛于ATLD、SWATLD或PARAFAC,使解析过程更加高效;4) 集合ATLD、SWATLD和PARAFAC算法优势,具有更高的普适性。

5 结论

将0#柴油、95#汽油、普通煤油视为环境石油类污染物,以四氯化碳为溶剂配制不同质量浓度的混合溶液,并对其进行光谱测量。由于每种石油产品的化学组分存在一定的相似性,使其光谱有一定的重叠区域甚至极其相似,给混合溶液光谱的区分带来了困难。结合ATLD、SWATLD和PARAFAC算法各自的优点,提出了一种算法组合策略,通过核一致诊断和残差平方和方法确定因子个数,利用组合算法ACM结合三维荧光光谱实现油种识别和质量分数测量。结果表明,ACM可以达到预期设计的目的,并且可以在存在未知干扰的情况下实现对目标分析物的准确定性与定量分析。

参考文献

[1] Azcarate S M, Teglia C M, Karp F, et al. A novel fast quality control strategy for monitoring spoilage on mayonnaise based on modeling second-order front-face fluorescence spectroscopy data[J]. Microchemical Journal, 2017, 133: 182-187.

[2] 王娟, 张飞, 王小平, 等. 平行因子法结合自组织映射神经网络的三维荧光特征及其与水质的关系[J]. 光学学报, 2017, 37(7): 0730003.

    Wang J, Zhang F, Wang X P, et al. Three-dimensional fluorescence characteristics by parallel factor method coupled with self-organizing map and its relationship with water quality[J]. Acta Optica Sinica, 2017, 37(7): 0730003.

[3] 王玉田, 刘婷婷, 刘凌妃, 等. 基于三维荧光光谱结合小波压缩与APTLD对水中多环芳烃测定[J]. 光谱学与光谱分析, 2018, 38(4): 1171-1177.

    Wang Y T, Liu T T, Liu L F, et al. Determination of polycyclic aromatic hydrocarbons in water based on three dimensional fluorescence spectroscopy combined with wavelet compression and APTLD[J]. Spectroscopy and Spectral Analysis, 2018, 38(4): 1171-1177.

[4] 徐布一, 叶懿, 阮若云, 等. 三维荧光光谱结合二阶校正算法用于尿液中常见毒品的检测[J]. 高等学校化学学报, 2015, 36(9): 1667-1673.

    Xu B Y, Ye Y, Ruan R Y, et al. Determination of illegal drugs in urine using excitation-emission matrix fluorescence coupled with second-order calibration[J]. Chemical Journal of Chinese Universities, 2015, 36(9): 1667-1673.

[5] 吴海龙, 李勇, 康超, 等. 三维荧光化学多维校正方法研究新进展[J]. 分析化学, 2015, 43(11): 1629-1637.

    Wu H L, Li Y, Kang C, et al. Research progress of three-dimensional fluorescence coupled with chemical multiway calibration[J]. Chinese Journal of Analytical Chemistry, 2015, 43(11): 1629-1637.

[6] 陶春先, 阮俊, 舒顺朋, 等. 三维荧光光谱对食用植物油中煎炸油的检测[J]. 中国激光, 2016, 43(1): 0115001.

    Tao C X, Ruan J, Shu S P, et al. Detection of fried oil in edible oil based on three-dimensional fluorescence spetroscopy[J]. Chinese Journal of Lasers, 2016, 43(1): 0115001.

[7] 孔德明, 张春祥, 崔耀耀, 等. 基于交替惩罚三线性分解的混合油液油种成分的检测[J]. 光学学报, 2018, 38(11): 1130005.

    Kong D M, Zhang C X, Cui Y Y, et al. Detection of oil species in mixed oil based on alternating penalty trilinear decomposition[J]. Acta Optica Sinica, 2018, 38(11): 1130005.

[8] Bro R. PARAFAC. Tutorial and applications[J]. Chemometrics and Intelligent Laboratory Systems, 1997, 38(2): 149-171.

[9] Wu H L, Shibukawa M, Oguma K. An alternating trilinear decomposition algorithm with application to calibration of HPLC-DAD for simultaneous determination of overlapped chlorinated aromatic hydrocarbons[J]. Journal of Chemometrics, 1998, 12(1): 1-26.

[10] 王玉田, 刘凌妃, 王书涛, 等. 基于交替三线性分解的芳烃类化合物荧光光谱[J]. 激光与光电子学进展, 2018, 55(9): 093001.

    Wang Y T, Liu L F, Wang S T, et al. Fluorescence spectra of aromatic hydrocarbons based on alternating trilinear decomposition[J]. Laser & Optoelectronics Progress, 2018, 55(9): 093001.

[11] Chen Z P, Wu H L, Yu R Q. On the self-weighted alternating trilinear decomposition algorithm-the property of being insensitive to excess factors used in calculation[J]. Journal of Chemometrics, 2001, 15(5): 439-453.

[12] 于永杰. 化学计量学二阶校正理论及应用基础研究与实用软件开发[D]. 长沙: 湖南大学, 2012.

    Yu YJ. Researches on theory and application of second-order calibration method and its development of application software[D]. Changsha: Hunan University, 2012.

[13] Bro R. Kiers H A L. A new efficient method for determining the number of components in PARAFAC models[J]. Journal of Chemometrics, 2003, 17(5): 274-286.

[14] Maggio R M, Olivieri A C. Unfolded partial least-squares with residual quadrilinearization: a new multivariate algorithm for processing five-way data achieving the second-order advantage. Application to fourth-order excitation-emission-kinetic-pH fluorescence analytical data[J]. Chemometrics and Intelligent Laboratory Systems, 2011, 109(2): 178-185.

[15] 杜文. 多元校正及模型转移中的缺损数据重构和交替残差多线性方法研究[D]. 长沙: 湖南大学, 2016.

    DuW. Missing data recovery and alternating residual trilinearization applied to multivariate calibration and calibration transfer[D]. Changsha: Hunan University, 2016.

陈至坤, 黄微, 程朋飞, 沈小伟, 王福斌. 基于组合算法的油类污染物三维荧光光谱分析[J]. 激光与光电子学进展, 2019, 56(3): 033002. Zhikun Chen, Wei Huang, Pengfei Cheng, Xiaowei Shen, Fubin Wang. Three-Dimensional Fluorescence Spectra Analysis of Oil Contaminants Based on Algorithm Combination Methodology[J]. Laser & Optoelectronics Progress, 2019, 56(3): 033002.

引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!