基于组合算法的油类污染物三维荧光光谱分析 下载: 949次
1 引言
二阶校正算法可在未知干扰存在的情况下分辨和测量出目标分析物,并保证其具有较高的精度,从而实现“二阶优势”,因此广泛应用于三维荧光光谱数据的分析中[1-7]。目前,研究人员已开发了许多分析性能出色的二阶校正算法。Bro[8]提出的平行因子分析(PARAFAC)算法基于严格意义上的最小二乘原则,具有抗噪声强、模型稳定、微小预期误差等优点,可以实现三维数据阵列的最佳拟合,应用范围较广。但该算法收敛速度较慢,对组分数敏感。基于此,Wu等[9]提出交替三线性分解(ATLD)算法。而通过提取对角主元和切尾奇异值求解广义逆,极大提高了收敛速度并降低了对组分数的敏感度,从而实现三线性分解[10]。然而,在取对角元时ATLD方法对噪声敏感,分析结果的准确性降低。Chen等[11]在ATLD的基础上提出了自加权交替三线性分解(SWATLD)算法。即通过创造性的增加额外权重项,达到了平衡各目标函数的目的,该算法既继承了对组分数不敏感、收敛速度快等优点,又降低了噪声水平的影响。但是在抗共线程度方面,SWATLD算法仍有待提高。
基于三线性分解算法迭代过程中损失函数的变化,本文将迭代过程进行划分,提出了三线性迭代法的组合算法(ACM),即将ATLD、SWATLD与PARAFAC算法有机组合在一起,充分发挥每种算法的优势,实现二阶校正算法的优势互补[12]。采用ACM对三组分矿物油样品的三维荧光光谱数据进行解析,验证了ACM用于光谱重叠的混合油类物质检测的有效性。
2 基本原理
2.1 算法组合策略
三线性模型表达式为
式中
依据损失函数
比较ATLD,SWATLD和PARAFAC算法的性能与迭代过程的划分,不难发现3种算法更侧重于优化迭代过程的不同。因此,为了更好地利用各算法的优势,可以采用以下方式对以上三种算法进行组合:1) 采用ATLD算法来对随机初始值进行优化;2) 采用SWATLD算法对ATLD算法收敛结果进行进一步优化;3) 将SWATLD算法所得结果用PARAFAC算法进行优化,这样便可以实现对数据的三线性分解。这一算法被称为组合算法ACM。
当数据结构简单时,每种算法得到的结果无显著差异。因此,为了使算法在处理数据时更高效,可以进一步优化ACM。在SWATLD算法过程中,当数据结构相对简单时,其损失函数单调下降直至收敛,将这种现象整合到ACM中,如果SWATLD算法的损失函数单调收敛,则所得结果无需采用PARAFAC算法优化,否则,需要引入PARAFAC算法。ACM整个流程如
2.2 核一致诊断法
核一致诊断法(CORCONDIA)是由Bro等[13]提出的用于估计三线性模型组分数的方法,通过比较模型中两个相关矩阵(最小二乘拟合阵
式中
当模型选取的因子数
2.3 残差分析法
在复杂体系中,核一致值并不一定随因子数增加而单调递减。可以结合另一种确定因子数的有效方法即残差分析法确定最优组分数,依据模型残差平方和(RSS)的变化为
若因子数
3 实验分析
3.1 仪器与试剂
实验采用Hitachi F-7000型荧光光谱仪。选择三种成品油(0#柴油、95#汽油、普通煤油)作为油类污染物的代表,四氯化碳作为溶剂。实验中,四氯化碳的拉曼线和激发光的波长是十分接近的,因此对荧光光谱干扰极其微弱。
3.2 实验方法
分别称量各1 g的0#柴油、95#汽油和普通煤油并置于100 mL容量瓶中,加入四氯化碳溶解稀释后得到三种油的100 mg/L标准溶液;分别量取不同体积的上述溶液并于16支50 mL的容量瓶中混合。加入四氯化碳溶剂,定容配制成不同质量浓度的样品,并对其进行编号:1#~10#为校正样品,11#~16#为预测样品。各样品中矿物油的质量浓度如
表 1. 样品中油类物质的质量浓度
Table 1. Concentration of oil in the samplemg/L
|
实验参数设置:激发波长为250~430 nm,步长为5 nm,狭缝宽度为10 nm;发射波长为310~520 nm,步长为5 nm,狭缝宽度为10 nm;扫描速率为12000 nm/min。标准条件下测量3次,取平均值。
4 结果与讨论
采用ACM进行荧光分析的基本步骤如
4.1 数据预处理
以柴油、汽油、煤油的标准溶液为例,如
图 4. 标准溶液未校正的三维荧光光谱和预处理后的三维荧光光谱。(a)(d) 0#柴油;(b)(e) 95#汽油;(c)(f) 普通煤油
Fig. 4. Three-dimensional fluorescence spectra of uncorrected standard solution and after pretreatment. (a) (d) 0# Diesel; (b)(e) 95# gasoline; (c)(f) ordinary kerosene
4.2 ACM算法分辨柴油、汽油和煤油混合溶液
扫描校正样品1#~10#和预测样品11#~16#,经过数据预处理去除散射,并构造16×37×43的三维数矩阵
假设体系中含5个因子,发现其核一致性总是接近100%。而3因子分析的残差平方和显著低于2因子分析的,其与4因子分析的差别较小,表明因子数为3或4时可能较为合理。已知样本是由柴油、汽油和煤油3种物质混合而成,若依照样本配制实际情况选择因子数为3,则ATLD解析所得激发、发射光谱如
图 5. X1的核一致诊断结果及残差平方和分析结果
Fig. 5. X1 nuclear consensus diagnosis results and residual square sum analysis results
选取因子数4来考察各算法对组分数的敏感性,
图 6. 柴油、汽油和煤油的(a)(b) ATLD解析光谱与(c)(d) ACM解析光谱
Fig. 6. (a)(b) ATLD analytical spectra and (c)(d) ACM analytical spectra of diesel, gasoline and kerosene
表 2. 不同组分数下各算法解析柴油所得结果
Table 2. Results obtained by each algorithm for analyzing diesel under different component numbers
|
表 3. 不同组分数下各算法解析汽油所得结果
Table 3. Results obtained by each algorithm for analyzing gasoline under different component numbers
|
表 4. 不同组分数下各算法解析煤油所得结果
Table 4. Results obtained by each algorithm for analyzing kerosene under different component numbers
|
ACM算法用于分离光谱重叠的油类混合物溶液体现了以下优势:1) 光谱解析结果精度高,分析目标组分更加可靠;2) 消除较高噪声水平影响,并保证共线性和组分数的不敏感性;3) 基于数据结构自行判断是否收敛于ATLD、SWATLD或PARAFAC,使解析过程更加高效;4) 集合ATLD、SWATLD和PARAFAC算法优势,具有更高的普适性。
5 结论
将0#柴油、95#汽油、普通煤油视为环境石油类污染物,以四氯化碳为溶剂配制不同质量浓度的混合溶液,并对其进行光谱测量。由于每种石油产品的化学组分存在一定的相似性,使其光谱有一定的重叠区域甚至极其相似,给混合溶液光谱的区分带来了困难。结合ATLD、SWATLD和PARAFAC算法各自的优点,提出了一种算法组合策略,通过核一致诊断和残差平方和方法确定因子个数,利用组合算法ACM结合三维荧光光谱实现油种识别和质量分数测量。结果表明,ACM可以达到预期设计的目的,并且可以在存在未知干扰的情况下实现对目标分析物的准确定性与定量分析。
[2] 王娟, 张飞, 王小平, 等. 平行因子法结合自组织映射神经网络的三维荧光特征及其与水质的关系[J]. 光学学报, 2017, 37(7): 0730003.
[3] 王玉田, 刘婷婷, 刘凌妃, 等. 基于三维荧光光谱结合小波压缩与APTLD对水中多环芳烃测定[J]. 光谱学与光谱分析, 2018, 38(4): 1171-1177.
[4] 徐布一, 叶懿, 阮若云, 等. 三维荧光光谱结合二阶校正算法用于尿液中常见毒品的检测[J]. 高等学校化学学报, 2015, 36(9): 1667-1673.
[5] 吴海龙, 李勇, 康超, 等. 三维荧光化学多维校正方法研究新进展[J]. 分析化学, 2015, 43(11): 1629-1637.
[6] 陶春先, 阮俊, 舒顺朋, 等. 三维荧光光谱对食用植物油中煎炸油的检测[J]. 中国激光, 2016, 43(1): 0115001.
[7] 孔德明, 张春祥, 崔耀耀, 等. 基于交替惩罚三线性分解的混合油液油种成分的检测[J]. 光学学报, 2018, 38(11): 1130005.
[8] Bro R. PARAFAC. Tutorial and applications[J]. Chemometrics and Intelligent Laboratory Systems, 1997, 38(2): 149-171.
[10] 王玉田, 刘凌妃, 王书涛, 等. 基于交替三线性分解的芳烃类化合物荧光光谱[J]. 激光与光电子学进展, 2018, 55(9): 093001.
[12] 于永杰. 化学计量学二阶校正理论及应用基础研究与实用软件开发[D]. 长沙: 湖南大学, 2012.
Yu YJ. Researches on theory and application of second-order calibration method and its development of application software[D]. Changsha: Hunan University, 2012.
[15] 杜文. 多元校正及模型转移中的缺损数据重构和交替残差多线性方法研究[D]. 长沙: 湖南大学, 2016.
DuW. Missing data recovery and alternating residual trilinearization applied to multivariate calibration and calibration transfer[D]. Changsha: Hunan University, 2016.
Article Outline
陈至坤, 黄微, 程朋飞, 沈小伟, 王福斌. 基于组合算法的油类污染物三维荧光光谱分析[J]. 激光与光电子学进展, 2019, 56(3): 033002. Zhikun Chen, Wei Huang, Pengfei Cheng, Xiaowei Shen, Fubin Wang. Three-Dimensional Fluorescence Spectra Analysis of Oil Contaminants Based on Algorithm Combination Methodology[J]. Laser & Optoelectronics Progress, 2019, 56(3): 033002.