中国激光, 2023, 50 (7): 0708007, 网络出版: 2023-04-14   

基于卷积神经网络和光丝诱导荧光光谱的NaCl气溶胶定量分析

Quantitative Analysis of NaCl Aerosols Based on Convolutional Neural Network and Filament‐Induced Fluorescence Spectroscopy
作者单位
1 南开大学软件学院,天津 300350
2 南开大学现代光学研究所,天津 300350
摘要
盐气溶胶是大气污染监测的重要对象。使用基于高功率超快激光的光丝诱导荧光光谱(FIFS)技术可以实现大气气溶胶的远距离快速定量分析,该技术有望成为下一代激光雷达的核心技术。用NaCl气溶胶模拟大气气溶胶污染物,针对自吸收效应导致光强与物质质量浓度偏离线性关系的问题,提出基于一维卷积神经网络的NaCl气溶胶质量浓度预测模型,并将其与多元线性回归模型、偏最小二乘回归模型、BP传播神经网络模型和定标曲线模型进行了对比实验。在各质量浓度(0.33~6.61 mg/m3)NaCl气溶胶全波段光谱数据集和特征波段光谱数据集上的实验结果表明:所提一维卷积神经网络模型在特征波段光谱数据集上的预测准确率为1,在泛化预测实验中的准确率为0.87,优于其在全波段光谱数据集上的结果,同时也优于其他模型。该模型对自吸收效应下的非线性定量分析具有良好的准确性和鲁棒性,为FIFS技术应用于大气气溶胶质量浓度预测分析提供了可靠的定量分析技术。
Abstract
Objective

Quantitatively analyzing aerosol composition is key to monitoring air pollution. In this study, filament-induced fluorescence spectroscopy (FIFS) technology is used to detect NaCl aerosols remotely based on intense femtosecond laser pulses that excite materials and induce their fingerprint fluorescence. However, the fluorescence intensity does not vary linearly with the different mass concentrations of NaCl aerosols because of the self-absorption effect. Thus, a one-dimensional convolutional neural network (1D-CNN) is proposed for predicting the mass concentration of NaCl aerosols with FIFS spectra because deep neural networks can well fit non-linear relationships. In the future, FIFS technology with deep neural networks might be key for the development of next-generation laser lidar for remote air pollution detection systems.

Methods

An FIFS system with ultra-short, ultra-intense laser pulses that generate high-intensity filaments is first built. The method based on the use of a filament focused by a combined lens in air can be employed for the multi-component, remote, and rapid quantitative analysis of atmospheric aerosols. Next, a spectrum collection system based on FIFS is designed (Fig. 1) to acquire aerosol fluorescence spectra. The system uses a Coherent commercial Ti∶sapphire femtosecond laser amplifier (Legend Elite) with a pulse wavelength of 800 nm, a pulse energy of 6 mJ, and a frequency of 500 Hz. Using the telescope focusing system, the filamentation position of the femtosecond laser is fixed in the cloud chamber at 30 m. Moreover, a NaCl aerosol is chosen as the experimental sample to simulate aerosols in the air. Specifically, an aerosol generator is used to generate the NaCl aerosol in the cloud chamber, where the femtosecond laser excites it and induces thin filaments. Fluorescent signals are collected using a spectrometer. Finally, a 1D-CNN model (Fig. 5) is designed to collect the FIFS spectra and predict mass concentration of the NaCl aerosol. To construct distinguishable features of the spectra, the 1D-CNN is set up with two convolution and two pooling layers, and the constructed features are inserted into the full connection layer to obtain the predicted value. To prevent gradient explosion, ReLU is selected as the activation function of the 1D-CNN.

Results and Discussions

A 10-fold cross-validation comparison experiment was conducted with traditional quantitative models, back propagation neural network (BPNN), and 1D-CNN on the full and characteristic spectral data. Generalized prediction experiments were performed for each model to further verify the reliability of the proposed model. According to the results of the 10-fold cross-validation experiments on NaCl spectral data (Tables 1 and 2), the 1D-CNN outperforms the other models in all prediction performance measures on the full spectrum dataset. It can achieve a root mean square error (RMSE), mean absolute error (MAE), coefficient of determination (R2), relative percentage deviation (RPD), and accuracy (ACC) of 0.110, 0.073, 0.997, 18.478, and 0.99, respectively. Its performance is further improved when executed on the characteristic spectrum dataset. This result indicates that the 1D-CNN can fit a non-linear relationship. When comparing the results on the full and characteristic spectra, most of the models perform better on the characteristic spectrum than on the full spectrum (Fig. 6). In the generalization experiments (Tab. 5), the 1D-CNN performs poorly only on the lowest concentration (0.33 mg/m3) but performs well when predicting higher mass concentrations. The RMSE, MAE, and ACC of the 1D-CNN on the characteristic spectrum dataset are 0.34, 0.31, and 0.87, respectively, in the generalization experiments. The 1D-CNN outperforms the other models when predicting mass concentrations that have not appeared in the training data (Tables 3 and 4). The results indicate that the 1D-CNN model can be generalized to NaCl aerosols with unknown mass concentrations.

Conclusions

An experimental system is built to collect the FIFS spectra of NaCl aerosols and predict its mass concentration based on the proposed 1D-CNN. Compared with baseline models, the convolution and pooling layers of the 1D-CNN can generate spectral characteristics to improve prediction accuracy. The results of 10-fold cross-validation experiments show that the 1D-CNN and BPNN models have unique advantages over CR, MLR, and PLSR. In addition, the 1D-CNN performs significantly better than the other models in the generalization experiments. This indicates that FIFS technology and 1D-CNNs are suitable for the quantitative analysis of FIFS spectra of NaCl aerosols. Hence, they can be the core technology of next-generation laser lidar for monitoring air pollution.

1 引言

气溶胶是大气中存在的各种固态和液态颗粒状物质构成的集合体,是导致大气污染的重要因素,也是大气污染监测的重要对象之一1-2。检测气溶胶的成分及其浓度可为污染来源分析提供科学依据。传统的激光雷达测量方法主要通过反演光学厚度等物理参数来估算气溶胶浓度,但其识别多组分污染物成分的能力有限3

传统的激光诱导技术4在采集光谱时会产生较强的噪声辐射,同时光谱仪在信号处理过程中会产生附加噪声,这些因素均会影响激光诱导技术对样品元素的分析。基于高功率超快激光的光丝诱导荧光光谱(FIFS)技术5-6是近几年发展起来的一种远程、多组分、快速大气污染监测技术。当具有高峰值功率的飞秒激光脉冲在介质中传输时,由于自聚焦效应,激光光束的能量不仅不会发散,还会克服自然衍射并在经过一定的传输距离之后会聚。在高强度的激光照射下,任何分子或原子都会发生电离,电离后的分子或原子会发射与物质化学成分所对应的指纹荧光谱,进而可以实现对气溶胶、浮尘、金属等大气污染源成分和浓度的预测。

近年来,研究人员对光谱定量分析方法进行了不断探索,如:郭旺林等7利用激光诱导击穿光谱技术研究了大气气溶胶中金属元素的光谱,通过建立重金属元素的定标曲线检测气溶胶样品中的重金属含量,效果良好;颜凡等8提出一种基于拉曼光谱谱峰强度和最小二乘拟合法的已知混合物组分直接定量分析方法,实现了三种成分混合物的快速、准确、直接定量分析;陈雨娟等9将激光诱导击穿光谱技术与BP神经网络相结合,对30个烧结矿样品进行快速分析,实现了烧结矿中硅元素含量的快速检测;Li等10将神经网络应用于共振谱分解,实现了多组分物质的识别与定量分析;张林11将卷积神经网络技术与近红外光谱检测方法相结合,对水中持久性污染物的含量进行了检测,取得了较好的检测效果;程钊等12利用多任务卷积神经网络实现了浮游藻类群落的识别与定量分析。

卷积神经网络(CNN)是近年来被广泛关注的预测模型,它通过卷积层和池化抽样层对输入数据进行各种特征组合和筛选,并通过训练数据得到特征权重,在多种应用场合取得了突破性成果12-14。张强等15使用深度神经网络对8种易挥发有机物进行了浓度反演,反演精度远超非线性偏最小二乘法和人工神经网络方法;Zhang等16将卷积神经网络回归模型用于煤灰含量的快速预测,结果显示,该模型优于传统的线性方法和BP神经网络模型。可见,将卷积神经网络模型引入大气气溶胶污染物定量分析,可以更好地拟合气溶胶光丝诱导荧光光谱中特征波段的光强与气溶胶浓度之间的非线性关系,为基于光丝诱导荧光光谱技术的远程多组分大气气溶胶定量分析提供可靠工具。

笔者用云室模拟大气中的气溶胶环境,配制质量浓度不同的NaCl气溶胶样品,用于模拟大气中的无机盐气溶胶;采用高功率超快激光激发出光丝,以获取NaCl气溶胶的光丝诱导荧光光谱数据。将卷积神经网络方法应用于NaCl气溶胶污染物的质量浓度预测,并将预测结果与定标曲线模型(CR)、多元线性回归模型(MLR)、偏最小二乘回归模型(PLSR)、BP神经网络模型(BPNN)的预测结果进行比较,以验证卷积神经网络预测模型在大气气溶胶质量浓度预测上的可用性与鲁棒性。

2 实验部分

2.1 光谱采集与实验设备

光丝激发与光谱采集实验装置如图1所示。飞秒激光脉冲经过由凹透镜L1(f=-10 cm)、凸透镜L2(f=50 cm)和800 nm介质膜反射镜M1组成的望远镜聚焦系统,通过控制L1和L2之间的相对距离可以将飞秒激光的成丝位置精确地控制在指定范围内。该系统装置巧妙地将发射系统与荧光信号采集系统结合起来,用于会聚成丝的凸透镜L2还可以收集成丝处产生的光丝诱导背向荧光信号(荧光信号经凸透镜L2会聚后透射过800 nm介质膜反射镜M1)。信号采集装置主要由光纤束(纤芯直径为0.3 mm)、光谱仪、Istar-sCMOS相机(Istar-sCMOS-18H-13)、计算机等组成。

图 1. 光丝诱导荧光光谱采集装置示意图

Fig. 1. Schematic of filament-induced fluorescence spectrum (FIFS) collection device

下载图片 查看所有图片

实验中采用Coherent商用钛宝石飞秒激光器,脉冲激光的波长为800 nm,脉冲能量为6 mJ,脉冲宽度为50 fs,工作频率为500 Hz。光谱仪的波长范围为180~920 nm,光谱分辨率为0.1 nm,采集的荧光信号的波长范围为236~833 nm。

飞秒激光在30 m处聚焦,与NaCl气溶胶相互作用产生飞秒光丝,效果如图2所示。液体气溶胶发生器(HRH-WAG3)生成粒径范围在0.3~10 μm的气溶胶并将其散布至云室,云室由直径为3 cm的玻璃管构成,云室置于楼内走廊且其两端与大气相连,以模拟大气环境。激光会聚于云室内的气溶胶后形成光丝,电离NaCl气溶胶,产生荧光信号。

图 2. 飞秒激光激发NaCl气溶胶形成光丝

Fig. 2. Filament induced by femtosecond laser in NaCl aerosol

下载图片 查看所有图片

2.2 实验样品与数据

实验中用于生成气溶胶的NaCl溶液由纯度为99%的NaCl固体与蒸馏水配制而成,NaCl溶液经过气溶胶发生器后可生成质量浓度分别为0.33、0.66、1.32、1.98、2.64、3.30、3.96、4.62、5.28、6.61 mg/m3的NaCl气溶胶。对每种质量浓度的NaCl气溶胶测试30次,共得到30条光丝诱导荧光光谱数据。

为充分利用实验测得的数据并获取更为稳定的实验结果,采用10折交叉验证法对质量浓度预测模型进行实验验证。具体地,将数据集均分为10份,轮流将其中的9份作为训练数据,剩下的1份作为测试数据。

在理想状况下,气溶胶质量浓度与特征谱线处的光强应为线性关系,但随着质量浓度增加,谱线会逐渐出现自吸收现象,导致其检测强度低于实际强度17图3是不同质量浓度NaCl气溶胶在特征波长处的实测光丝诱导荧光光谱,其中0.33、0.66、1.32 mg/m3 NaCl气溶胶谱线强度与质量浓度的倍数关系较为明显,而2.64、6.61 mg/m3 NaCl气溶胶谱线强度与质量浓度并未呈现明显的倍数关系。图4为NaCl气溶胶质量浓度与光丝诱导荧光光谱特征谱线光强的对应关系,当NaCl气溶胶的质量浓度处于0.33~1.98 mg/m3之间时,质量浓度与谱线强度的倍数关系较为明显,R2达到0.99,但由于噪声和自吸收效应的影响,从2.64 mg/m3开始,较高质量浓度的NaCl气溶胶光谱在特征波长处的光强与质量浓度之间呈现出了一定的非线性关系。如果以此建立一条定标曲线,则数据点与曲线的拟合效果会不理想,如图4中的虚线所示。卷积神经网络能够很好地拟合非线性关系,因此笔者拟用卷积神经网络来构建NaCl气溶胶定量分析模型。

图 3. 5种质量浓度NaCl气溶胶在589 nm附近的光丝诱导荧光光谱

Fig. 3. Filament-induced fluorescence spectra of NaCl aerosol with five mass concentrations near 589 nm

下载图片 查看所有图片

图 4. NaCl气溶胶光丝诱导荧光光谱的定标曲线

Fig. 4. Calibration regression curve of NaCl aerosol’s filament-induced fluorescence spectra

下载图片 查看所有图片

2.3 基于卷积神经网络的NaCl气溶胶质量浓度预测模型

质量浓度预测模型的任务是完成对光谱数据和气溶胶质量浓度的回归拟合,并对未知气溶胶样品光谱进行质量浓度预测。

本文面向NaCl气溶胶的光丝诱导荧光光谱数据,提出了基于一维卷积神经网络(1D-CNN)的NaCl气溶胶质量浓度预测模型。具体地,模型的输入为待测样品的光丝诱导荧光光谱数据,输出为NaCl气溶胶的质量浓度(单位为mg/m3),取值范围为0.33~6.61 mg/m3。与BP神经网络相比,一维卷积神经网络主要增加了用于特征组合和筛选的两组一维卷积层和池化抽样层。本文模型中的两组一维卷积层分别包含16个和32个一维卷积核,考虑到光丝诱导荧光光谱数据谱峰宽度较窄以及噪声可能产生的影响,将卷积核的窗口大小均设置为5。这样做一方面是为了更好地提取与谱线相关的信息,另一方面是为了降低噪声造成的影响。实际上,卷积核可以自动从原始光谱中发现抽象特征,减小特征分析中对先验知识和人力的依赖18。此外,为解决BP神经网络出现的梯度消失或爆炸问题,卷积层的激活函数都设置为ReLU函数。为了突出光谱特征峰,在两层池化层中采用MaxPooling,池化抽样范围为2。通过共享卷积核、减少特征规模的池化抽样层和模型学习算法,一维卷积神经网络能够自动组合筛取出有利于回归的光谱特征。

光谱特征构建之后,质量浓度预测模型采用全连接层进行回归预测,即:卷积层与池化层提取的特征经过展平后被输入至全连接层,全连接层对构建后的特征与真实质量浓度之间的映射关系进行拟合。在本文中,全连接层中各层神经元个数依次设置为64、32、1,激活函数选用ReLU函数。得益于卷积层和池化层的特征提取以及全连接层对权重的调整,一维卷积网络能有效地筛除基线漂移、噪声干扰等现象产生的干扰信息。实际上,BP神经网络在不断增加神经元层数和隐含层神经元的数量后也能不断提高预测正确率,但是在深度和广度被大幅提升后,BP神经网络常常会面临收敛速度极慢、陷入局部极小值和梯度消失等问题,而卷积层和池化层能很好地解决这些问题。本文所提基于一维卷积神经网络的NaCl气溶胶质量浓度预测模型的结构如图5所示。

图 5. 基于一维卷积神经网络的NaCl气溶胶质量浓度预测模型结构示意图

Fig. 5. Architecture of one-dimensional CNN for predicting mass concentration of NaCl aerosol

下载图片 查看所有图片

一维卷积神经网络模型采用预测质量浓度值与真实质量浓度值之间的均方误差作为代价函数,采用Adam优化器19进行优化,当模型代价函数收敛或达到最大迭代次数时,质量浓度预测模型训练完成。

2.4 评价指标

NaCl气溶胶质量浓度预测模型采用决定系数(R2)、均方根误差(RMSE,在公式中用fRMSE表示)、相对分析误差(RPD,在公式中用fRPD表示)、平均绝对误差(MAE,在公式中用fMAE表示)和预测准确率(ACC,在公式中用fACC表示)作为质量浓度预测性能的评价指标20

决定系数R2用于评估模型对光谱光强与质量浓度映射关系的拟合程度,其值越接近1,说明模型的拟合程度越高。R2的计算公式为

R2=1-i=1nyi-y^i2i=1ny^i-y¯2

式中:yiy^i分别为光谱样本的真实质量浓度与预测质量浓度值;y¯为真实质量浓度值的平均值;n为样本数量。

均方根误差是回归分析中最常用的分析指标,它表示预测值与真实值之间的偏差,其值越小,表明模型预测值越接近真实值。均方根误差的计算公式为

fRMSE=i=1nyi-y^i2n

相对分析误差是基于决定系数的一种分析指标。当fRPD<1.4时,模型被认为不可靠;当fRPD>1.4时,模型被认为相对可靠;当fRPD>2时,模型被认为具有较高的可靠性。其计算公式为

fRPD=11-R2

平均绝对误差是质量浓度真实值与预测值绝对误差的平均值。通过绝对值解决误差相互抵消的问题,能更好地反映预测误差的真实情况。平均绝对误差值越小表明预测效果越好,其计算公式为

fMAE=i=1n|yi-y^i|n

预测准确率表示的是质量浓度预测正确的样本数量占预测样本总数的比例,该指标可以反映模型的预测性能。若预测值与真实值的误差在真实值的20%以内,则被认为预测正确。其计算公式为

fACC=num|yi-y^i|<0.2yin

式中:num()表示满足条件的样本个数。

3 结果与讨论

3.1 对比模型

1)定标曲线模型

定标曲线模型是一种常用的定量分析方法。在一定条件下,目标元素特征波长处的光强与目标元素的含量成正比。定标曲线模型利用多个目标元素含量不同的标准样品的光谱数据,建立一条该元素含量与特征谱线光强之间对应的拟合曲线。根据NIST LIBS数据库,本实验中Na元素的特征谱线选在波长589.03571 nm 处,此处具有最高的发射强度和灵敏度。该方法只能用于特征波段光谱数据实验中。

2)多元线性回归模型

多元线性回归模型是一种包含两个或两个以上自变量的线性回归方法,能够以多个自变量解释因变量的线性趋势。该方法根据各波长处的光强值与对应质量浓度值建立线性回归模型,然后根据待测光谱信息进行预测。该方法可用于全波段光谱数据的对比实验中。

3)偏最小二乘回归

偏最小二乘回归模型是一种基于因子分析的多变量校正方法,其利用训练样品光谱的自变量矩阵和因变量(样品含量)训练模型,根据待测样品的光谱进行预测。

4)BP神经网络

BP神经网络是基于反向传播算法的传统神经网络,常被用于拟合各类非线性函数。本文选用三层结构;根据调参实验结果,设置隐含层和输出层神经元个数分别为128和1。代价函数使用均方误差函数,激活函数选用ReLU函数,优化算法使用Adam算法。

3.2 质量浓度预测模型的性能对比

将基于一维卷积神经网络的NaCl气溶胶质量浓度预测模型同定标曲线模型、多元线性回归模型、偏最小二乘回归模型、BP神经网络模型进行对比。使用的NaCl气溶胶光丝诱导荧光光谱数据包括全波段光谱(236.6~833.1 nm)和特征谱(589.036 nm±2 nm)两种不同的输入格式。其中,定标曲线模型使用的是特征波段光谱数据,多元线性回归模型使用的是全波段光谱数据。10折交叉验证后的预测结果如表1表2所示。

表 1. 全波段光谱数据的质量浓度预测结果

Table 1. Mass concentration prediction results for full spectral data

Mass concentration prediction modelR2RMSERPDMAEACC
MLR0.9910.18510.5810.1440.93
PLSR0.9680.3266.0180.2590.82
BPNN0.9850.2308.5720.1670.91
1D-CNN0.9970.11018.4780.0730.99

查看所有表

表 2. 特征波段光谱数据的质量浓度预测结果

Table 2. Mass concentration prediction results for characteristic spectral data

Mass concentration prediction modelR2RMSERPDMAEACC
CR0.8180.7682.5460.6820.40
PLSR0.9900.19810.0580.1540.90
BPNN0.9930.15912.8230.1041
1D-CNN0.9970.11018.7020.0711

查看所有表

在NaCl气溶胶的全波段光丝诱导荧光光谱数据集上,一维卷积神经网络质量浓度预测模型的预测性能显著优于其他模型,预测准确率为0.99,决定系数R2、均方根误差RMSE、相对分析误差RPD、平均绝对误差MAE也均优于其他模型;同时,多元线性回归模型与BP神经网络也取得了较高的预测准确率。

在特征波段光谱数据集上,相比于定标曲线模型,其他三种模型都表现出了对非线性关系较好的预测性能,表明定标曲线模型对质量浓度变化范围广、质量浓度与特征谱线强度没有良好线性关系的质量浓度预测效果不理想。此外,在采用特征波段光谱数据集时,偏最小二乘回归模型、BP神经网络预测模型的各项性能指标均有所提升,且性能方差更小。这说明对于大多数方法来说,使用特征波段光谱数据进行预测优于直接使用全波段光谱数据。这一点可在图6(e)~(h)与图6(a)~(d)的比较中体现出来。图6中,预测质量浓度与真实质量浓度的点越聚集于图中直线,说明模型的预测结果与样本的真实质量浓度越接近。

图 6. 各模型在全波段光谱和特征波段光谱上的预测结果对比。(a)~(d)全波段光谱;(e)~(h)特征波段光谱

Fig. 6. Prediction comparison of each model in full and characteristic spectra. (a)-(d) Full spectrum; (e)-(h) characteristic spectrum

下载图片 查看所有图片

从上面两组10折交叉验证实验结果可知一维卷积神经网络优于其他对比模型,而使用特征波段光谱则优于使用全波段光谱。

3.3 质量浓度预测模型的泛化能力

为进一步测试模型预测未出现在训练数据中的质量浓度数据的性能,将数据集中的每一个质量浓度数据轮流抽取出作为测试集,将剩余的质量浓度数据作为训练集对预测模型进行训练。这样可使某质量浓度的光谱数据不会出现在模型训练中,从而检验模型的泛化预测能力。因为笔者测得了10个不同质量浓度下的数据,因此将训练集和测试集按9∶1进行划分。此外,根据决定系数和相对分析误差的计算公式可知这两个指标不适用于对泛化预测实验结果进行评估,故使用均方根误差、平均绝对误差和预测准确率作为泛化能力的评价指标。具体的实验结果是10轮泛化预测实验的平均值,在表3中列出。

表 3. 全波段光谱数据的泛化预测实验结果

Table 3. Generalized prediction experimental results for full spectral data

Mass concentration prediction modelRMSEMAEACC
MLR1.1751.1750.43
PLSR1.1021.0890.18
BPNN0.6140.6060.64
1D-CNN0.6870.6760.42

查看所有表

表3所示的全波段光谱泛化实验结果可以看出,BP神经网络模型的各项指标皆优于其他模型,一维卷积神经网络模型虽然在全波段光谱上的预测准确率表现不佳,但其均方根误差、平均绝对误差与BP神经网络模型的结果较为接近。特征波段光谱的泛化实验结果如表4所示,一维卷积神经网络模型的均方根误差、平均绝对误差和预测准确率均优于其他模型,其预测准确率达到了0.87。这一结果说明一维卷积神经网络模型具有较强的泛化能力。此外,BP神经网络模型在特征波段光谱的泛化能力实验上也表现不错,优于定标曲线模型和偏最小二乘回归模型,但其准确率(0.69)低于一维卷积神经网络的准确率(0.87)。因此,在NaCl气溶胶质量浓度预测上,宜采用一维卷积神经网络模型和特征波段光谱数据。

表 4. 特征波段光谱数据的泛化预测实验结果

Table 4. Generalized prediction experimental results for characteristic spectral data

Mass concentration prediction modelRMSEMAEACC
CR0.7760.8780.32
PLSR3.1003.0840.42
BPNN0.6690.6010.69
1D-CNN0.3290.3110.87

查看所有表

表5为一维卷积神经网络模型在特征波段光谱上的预测结果。该模型对0.33 mg/m3气溶胶质量浓度的预测准确率为0,但均方根误差和平均绝对误差与各质量浓度下总体的平均值接近,说明虽然预测结果没有在0.33 mg/m3的正负20%以内,但相距不远。该模型对其他质量浓度气溶胶的预测准确率很高,展现出一维卷积神经网络较强的泛化预测能力。

表 5. 一维卷积神经网络在特征波段光谱上的泛化预测实验结果

Table 5. Generalized prediction experimental results of 1D-CNN in characteristic spectral data

Actual mass concentration /(mg·m-3RMSEMAEACC
Average0.340.310.87
0.330.310.310
0.660.100.100.97
1.320.240.240.97
1.980.370.340.83
2.640.240.210.97
3.300.310.291
3.960.500.440.93
4.620.290.261
5.280.340.311
6.610.600.571

查看所有表

综上可得:一维卷积神经网络在多种数据集上的预测性能优于对比模型,而大部分模型在特征光谱上的预测性能优于全波段光谱;基于一维卷积神经网络和NaCl气溶胶光丝诱导荧光光谱特征波段的质量浓度预测算法,在0.33~6.61 mg/m3质量浓度范围内能够很好地拟合由自吸收效应带来的非线性映射关系,适合作为大气污染物中盐气溶胶质量浓度的定量分析算法。

4 结论

盐气溶胶是大气污染物中的主要成分之一。笔者以NaCl气溶胶为例,采用光丝诱导荧光光谱技术采集其光谱,并进行了定量分析。针对光丝诱导荧光光谱数据的特点,采用对应的一维卷积核和相应的网络结构,构建各波段处光强与气溶胶质量浓度之间关系的非线性回归模型——基于一维卷积神经网络的NaCl气溶胶质量浓度预测模型。之后将所提模型与定标曲线模型、多元线性回归模型、偏最小二乘回归模型和BP神经网络模型在多种质量浓度NaCl气溶胶全波段光谱及特征波段光谱数据上进行对比实验,并对该模型的泛化预测能力进行了研究。结果表明,基于一维卷积神经网络的预测模型具有较高的准确率和稳定性,为进一步开展基于光丝诱导荧光光谱技术的多组分大气气溶胶污染物定量分析提供了算法基础。

参考文献

[1] 钟玉婷, 刘新春, 范子昂, 等. 2009年塔里木盆地总悬浮颗粒物时空分布及无机离子浓度特征分析[J]. 中国沙漠, 2012, 32(4): 1053-1061.

    Zhong Y T, Liu X C, Fan Z A, et al. Spatiotemporal distribution and inorganic ion concentration of total suspended particles in Tarim Basin in 2009[J]. Journal of Desert Research, 2012, 32(4): 1053-1061.

[2] 冯小姣, 耿红, 彭妍, 等. 太原市灰霾期间黑碳气溶胶形貌与成分分析[J]. 地球化学, 2021, 50(1): 75-87.

    Feng X J, Geng H, Peng Y, et al. Morphology and chemical composition characterization of atmospheric black carbon aerosols during haze events in urban Taiyuan, China[J]. Geochimica, 2021, 50(1): 75-87.

[3] Fougnie B, Chimot J, Vázquez-Navarro M, et al. Aerosol retrieval from space–how does geometry of acquisition impact our ability to characterize aerosol properties[J]. Journal of Quantitative Spectroscopy and Radiative Transfer, 2020, 256: 107304.

[4] 孙晨薇, 步扬, 王远航, 等. 激光诱导等离子体光谱空间分布特性[J]. 光学学报, 2021, 41(21): 2130001.

    Sun C W, Bu Y, Wang Y H, et al. Spatial characteristics of spectral intensity of laser induced plasma[J]. Acta Optica Sinica, 2021, 41(21): 2130001.

[5] Tan D Z, Wang Z, Xu B B, et al. Photonic circuits written by femtosecond laser in glass: improved fabrication and recent progress in photonic devices[J]. Advanced Photonics, 2021, 3(2): 024002.

[6] 曾庆伟, 刘磊, 胡帅, 等. 强飞秒激光在云雾环境中的非线性传输[J]. 光学学报, 2020, 40(15): 1519001.

    Zeng Q W, Liu L, Hu S, et al. Nonlinear propagation of intense femtosecond laser pulses in a foggy and cloudy environment[J]. Acta Optica Sinica, 2020, 40(15): 1519001.

[7] 郭旺林, 邱荣, 王昶沣, 等. 激光诱导击穿光谱技术用于大气气溶胶中Cr元素的检测[J]. 量子电子学报, 2020, 37(6): 745-751.

    Guo W L, Qiu R, Wang C F, et al. Detection of chromium in atmospheric aerosol by laser induced breakdown spectroscopy[J]. Chinese Journal of Quantum Electronics, 2020, 37(6): 745-751.

[8] 颜凡, 朱启兵, 黄敏, 等. 基于拉曼光谱的已知混合物组分定量分析方法[J]. 光谱学与光谱分析, 2020, 40(11): 3599-3605.

    Yan F, Zhu Q B, Huang M, et al. Quantitative analysis method for mixture with known components based on Raman spectroscopy[J]. Spectroscopy and Spectral Analysis, 2020, 40(11): 3599-3605.

[9] 陈雨娟, 丁宇, 朱绍农, 等. 神经网络与激光诱导击穿光谱技术结合的烧结矿中硅元素定量分析方法探究[J]. 冶金分析, 2021, 41(1): 24-29.

    Chen Y J, Ding Y, Zhu S N, et al. Study on quantitative analysis method of silicon in sinter based on neural network and laser-induced breakdown spectroscopy[J]. Metallurgical Analysis, 2021, 41(1): 24-29.

[10] Li Z Y, Zhang H, Nguyen B T T, et al. Smart ring resonator-based sensor for multicomponent chemical analysis via machine learning[J]. Photonics Research, 2021, 9(2): B38-B44.

[11] 张林. 基于卷积神经网络近红外光谱法测定水体污染物[J]. 化学分析计量, 2021, 30(8): 24-27.

    Zhang L. Determination of water pollutant content by near infrared spectroscopy based on convolution neural network[J]. Chemical Analysis and Meterage, 2021, 30(8): 24-27.

[12] 程钊, 赵南京, 殷高方, 等. 基于多任务卷积神经网络的浮游藻类群落识别方法[J]. 光学学报, 2022, 42(5): 0530002.

    Cheng Z, Zhao N J, Yin G F, et al. Identification method of planktonic algae community based on multi-task convolutional neural network[J]. Acta Optica Sinica, 2022, 42(5): 0530002.

[13] 李智唯, 曹慧, 杨锋, 等. 基于卷积神经网络的脑肿瘤分割的研究进展[J]. 激光与光电子学进展, 2021, 58(24): 2400003.

    Li Z W, Cao H, Yang F, et al. Research progress of brain tumor segmentation based on convolutional neural network[J]. Laser & Optoelectronics Progress, 2021, 58(24): 2400003.

[14] 杨红云, 万颖, 王映龙, 等. 基于批归一化与AlexNet网络的水稻病害识别[J]. 激光与光电子学进展, 2021, 58(6): 0610007.

    Yang H Y, Wan Y, Wang Y L, et al. Identification of rice diseases based on batch normalization and AlexNet network[J]. Laser & Optoelectronics Progress, 2021, 58(6): 0610007.

[15] 张强, 魏儒义, 严强强, 等. 深度神经网络在红外光谱定量分析VOCs中的应用[J]. 光谱学与光谱分析, 2020, 40(4): 1099-1106.

    Zhang Q, Wei R Y, Yan Q Q, et al. Application of deep neural network in quantitative analysis of VOCs by infrared spectroscopy[J]. Spectroscopy and Spectral Analysis, 2020, 40(4): 1099-1106.

[16] Zhang K H, Wang W D, Lv Z Q, et al. A CNN-based regression framework for estimating coal ash content on microscopic images[J]. Measurement, 2022, 189: 110589.

[17] 杜振辉, 孟繁莉, 李金义, 等. 激光诱导击穿光谱定量分析中的分析线自动选择方法[J]. 光谱学与光谱分析, 2012, 32(4): 876-880.

    Du Z H, Meng F L, Li J Y, et al. Research on the analytical line auto-selection for quantitative analysis of materials with laser-induced breakdown spectroscopy[J]. Spectroscopy and Spectral Analysis, 2012, 32(4): 876-880.

[18] Zhang X L, Lin T, Xu J F, et al. DeepSpectra: an end-to-end deep learning approach for quantitative spectral analysis[J]. Analytica Chimica Acta, 2019, 1058: 48-57.

[19] KingmaD P, BaJ. Adam: a method for stochastic optimization[EB/OL]. (2014-12-22)[2022-10-09]. https://arxiv.org/abs/1412.6980.

[20] 刘燕德, 林晓东, 高海根, 等. 基于荧光光谱的鲜茶叶片叶绿素含量定量分析[J]. 激光与光电子学进展, 2021, 58(8): 0830001.

    Liu Y D, Lin X D, Gao H G, et al. Quantitative analysis of chlorophyll content in tea leaves by fluorescence spectroscopy[J]. Laser & Optoelectronics Progress, 2021, 58(8): 0830001.

刘明铭, 孔德晟, 向钰言, 赵凤园, 张静, 张瑞鹏, 高亚敏, 职辰好, 刘月, 谢茂强, 张智, 孙陆, 赵星, 张楠, 刘伟伟. 基于卷积神经网络和光丝诱导荧光光谱的NaCl气溶胶定量分析[J]. 中国激光, 2023, 50(7): 0708007. Mingming Liu, Desheng Kong, Yuyan Xiang, Fengyuan Zhao, Jing Zhang, Ruipeng Zhang, Yamin Gao, Chenhao Zhi, Yue Liu, Maoqiang Xie, Zhi Zhang, Lu Sun, Xing Zhao, Nan Zhang, Weiwei Liu. Quantitative Analysis of NaCl Aerosols Based on Convolutional Neural Network and Filament‐Induced Fluorescence Spectroscopy[J]. Chinese Journal of Lasers, 2023, 50(7): 0708007.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!