基于红外光谱构建土壤苯乙烯污染预测模型 下载: 916次
1 引言
苯乙烯是一种重要的化工原材料,主要用于生产合成橡胶、聚醚树脂、增塑剂和塑料等。石油化工和聚合物加工行业每年都会生产并使用大量化合物苯乙烯,但苯乙烯会严重危害水体、土壤和大气[1],且会对人类健康造成严重的负面影响。突发的苯乙烯泄漏事件导致大量的苯乙烯以液态和气态形式释放到环境中[2]。因此,需要探明污染土壤的苯乙烯含量,以便开展后续处理。
近年来,国内外学者针对不同类型的土壤污染选用不同方法进行识别鉴定。通过热解GC-MS法分析土壤提取物的液相色谱,对受污染的“棕地”土壤进行快速鉴定[3];基于热重分析法(TGA)构造了土壤通用模型(SUMM)以定量分析土壤中微塑料含量[4];通过静态顶空气相色谱-质谱法(HS-GCMS)测定土壤中BTEXS(苯,甲苯,乙苯,二甲苯和苯乙烯)含量[5-6];基于快速、高效的红外光谱技术监测土壤中的石油烃含量等[7-9]。关于利用红外光谱技术监测土壤中苯乙烯含量的研究鲜有报道。
本文先通过多功能红外光谱辐射仪(VSR)红外光谱仪获得不同土壤中的苯乙烯红外光谱数据,结合包络线去除法和小波变化法进行数据初处理。再利用光谱形式变化和相关性分析找出苯乙烯在土壤中的特征波段,利用反射率特征波段数据选定预测模型自变量。最后,结合多元线性回归(SMLR)、偏最小二乘回归(PLSR)和支持向量机(SVMR)建模方法,构建不同土壤中的苯乙烯含量反演模型,以预测不同土壤中苯乙烯含量。
2 实验材料及方法
2.1 实验材料
实验所用化学品购置于上海阿拉丁生化科技股份有限公司,其主要成分为体积分数为99%的苯乙烯。苯乙烯试剂有高折光性,受热或暴露空气中易聚合成稠厚或透明固体。
供试土壤样品采自中国三个不同地区的表层0~20 cm处未受污染的土壤。土壤置于室温下自然风干,除去杂质,研磨,并用2 mm土壤筛筛选备用。混合均匀后制备每种土壤样本24份,随机拿出4份用于土壤理化性质分析,其余部分为2组,一组10份作为建模样本,另一组10份作为预测验证样本。土壤的采集地点及相关理化性质如
表 1. 供试土壤的理化性质
Table 1. Physical and chemical properties of tested soils
|
以砖红土为例:利用第一组土样确定三种选用化学品污染土壤的饱和量。秤取30 g的砖红土放入深1.5 cm、直径为10 cm的玻璃器皿中,移液枪逐次吸取0.5 mL苯乙烯加入土样,反复实验后确定最佳的苯乙烯注入方法。起初加入0.5 mL,之后逐次加入0.5 mL直至4 mL变化点,考虑挥发性,之后每次加入1 mL直至土样饱和并析出苯乙烯液体。每次注入苯乙烯后迅速搅拌均匀并静置,使得苯乙烯在土样中得以均匀分布。苯乙烯在三种土壤中的饱和含量以及样本数如
表 2. 土壤与化学品的组合样本数以及饱和时的含量
Table 2. Sample number and saturation content of soil and hydrocarbons
|
2.2 实验仪器
实验中使用加拿大LR tech公司生产的Versatile Spectro Radiometer光谱仪,选用远红外A通道(660~2000 cm-1) MCT传感器和中红外B通道(1750~5000 cm-1) InSb传感器在暗室内对土样进行检测,光谱分辨率选用8 cm-1,测量视场角为25 mrad,探测器制冷方式采用电制冷。每次连续测量10次,然后取平均值。为了方便后续数据分析,测得的光谱数据由波数转换为波长数据并作为横坐标数值。
2.3 光谱数据采集
2.3.1 光谱噪音处理
通过仪器获得的光谱数据不仅会有光谱信息,还包含由土壤属性、实验环境属性及仪器属性引起的噪音信号。为了后续有效判断光谱特征和提取特征信息,需要对光谱曲线进行平滑去噪处理。本文采用Savitzky-Golay卷积滤波法(SG)对比小波变换法,发现经小波分解、重构后光谱曲线光滑性得到有效提高,但处理过程中高频系数被阀值量化,导致图像保留信息能力稍逊于SG 。故本文采用SG 平滑处理光谱曲线,选取多项式次数为2,平滑窗口为21即左右各21个样点。此过程借助Matlab软件进行处理。
2.3.2 光谱数据转换
由于测量时环境、仪器等的影响无法避免,经去噪平滑处理后数据光谱特征并不显著。为了扩大样品光谱曲线之间的区别,更好地研究浓度与光谱反射率之间的定量关系,本文采用微分处理法与光谱数据转换法对光谱数据进行综合分析。
经过低阶微分处理后的光谱不易受噪声影响,微分处理法能在一定程度上减少背景噪声的干扰,还能增强吸收峰、谷特征,有利于获得与研究组分含量相关性高的波段[10]。
采用光谱数据转换法对光谱反射率进行转换:反射率的倒数1/R、反射率倒数的对数ln(1/R)、反射率对数的倒数1/ln R、反射率的一阶微分R'、反射率倒数的一阶微分(1/R)'、反射率倒数对数的一阶微分ln(1/R)'和反射率对数倒数的一阶微分(1/ln R)'。
2.3.3 光谱特征提取
样品的光谱特征峰较弱,导致难以区分污染物苯乙烯。本文采用包络线去除法,将反射率归一化到0~1,在移除吸收特征无关物质的同时,放大光谱曲线的吸收和反射特征,以便于提取和比较特征吸收波段[11]。相较于将整个近红外光谱波段作为研究对象,选取特征吸收波段进行建模分析,可以省时省力。具体公式为
式中:Rcr(λ)是连续统去除后的反射率;Rc(λ)是连续统去除前的总反射率;R(λ)是原始反射率;λ为波长。此过程可通过遥感软件ENVI,利用Command Removed功能完成。
2.4 模型构建与验证
线性模型和非线性模型是光谱建模分析中常用的两种模型,其中偏最小二乘回归、多元线性回归和主成分分析是线性模型的典型代表,支持向量机、神经网络和随机森林是非线性模型的代表。本文采用多元线性回归(SMLR)、偏最小二乘回归(PLSR)和支持向量机(SVMR)对不同土壤中的苯乙烯含量进行预测并建模,比较三者预测性能的差异。此过程可通过数据分析软件unscrambler进行。
模型的性能一般通过稳定性和预测精度进行评价。常用决定系数(
3 结果与分析
3.1 光谱曲线特征分析及特征波段获取
不同苯乙烯污染土壤的光谱曲线如
由
图 1. 不同苯乙烯污染土壤的光谱曲线。(a)砖红土;(b)黑土;(c)紫土;(d) 未污染的土壤
Fig. 1. Spectral curves of different styrene contaminated soils. (a) Brick laterite; (b) black soil; (c) purple soil; (d) uncontaminated soil
对光谱曲线进行SG平滑滤波和包络线去除处理,以确定吸收特征的具体位置,并作为土壤中苯乙烯的特征识别依据,效果如
图 2. 经包络线去除法处理后不同苯乙烯污染土壤的光谱曲线。(a1)(b1)(c1)特征波段位于1800 nm处; (a2)(b2)(c2)特征波段位于2200 nm和2400 nm处
Fig. 2. Spectral curves of different styrene contaminated soils after continuum removal processing. (a1)(b1)(c1) Feature band is located at 1800 nm; (a2)(b2)(c2) feature band is located at 2200 nm and 2400 nm
3.2 特征波段相关性分析
为扩大样本间光谱特征的差异,针对不同土壤的特征波段,对光谱数据进行形式转换和相关性分析,变非线性关系为线性关系,以寻找与苯乙烯含量相关性高的光谱变量。基于上文得出的特征波段,以其作为研究对象,对平滑后的光谱反射率进行7种转换,以比较不同的变换形式对相关性的影响。计算公式为
式中:cov(·)为协方差值;X为特征波段处的光谱变量值;Y为土壤样品的苯乙烯含量;D(·)为方差值;γ为相关系数;n为样本个数;xi为第i个土壤样本在某诊断特征波段处的光谱变量的值;
由
表 3. 在砖红土光谱反射率不同变换形式下苯乙烯在各特征波段的相关系数
Table 3. Correlation coefficients of styrene in each characteristic band under different transformation forms of spectral reflectance of brick laterite
|
3.3 模型构建与模型评估
3.3.1 选取反射率特征波段建模
由
征只在苯乙烯-砖红土中出现,是苯乙烯与砖红土中原有其他物质反应生成的,故不考虑该波段。综上,选取1809,2119,2173,2348,2464 nm波段处的反射率倒数值为自变量,实测值为因变量进行模型构建。
式中:Y为苯乙烯含量预测值;X1809、X2119、X2173、X2348、X2464分别为1809,2119,2173,2348,2464 nm波段处反射率的倒数值。
按相同分析方法处理苯乙烯-黑土光谱曲线特征波段数据,选取1798,2116,2171,2348,2469 nm波段处的反射率倒数值为自变量,实测值为因变量进行模型构建。
式中:X1798、X2116、X2171、X2469分别为1798,2116,2171,2469 nm波段处反射率的倒数值。
按相同分析方法处理苯乙烯-紫土光谱曲线特征波段数据,选取1816,2119,2169,2346,2469 nm波段处的反射率倒数值为自变量,实测值为因变量进行模型构建。
式中:X1816、X2119、X2169、X2346分别为1816,2119,2169,2346 nm波段处反射率的倒数值。
3.3.2 模型评估分析
针对不同土壤苯乙烯含量,对苯乙烯特征波段数据进行建模与验证,模型评价指标数据如
表 4. 不同模型精度对比与预测验证
Table 4. Accuracy comparison and prediction verification among different models
|
图 3. 三种土壤中不同模型对苯乙烯含量预测效果。(a) 苯乙烯-砖红土;(b) 苯乙烯-黑土;(c) 苯乙烯-紫土
Fig. 3. Styrene contents in three soils predicted by different models. (a) Styrene-brick laterite; (b) styrene-black soil; (c) styrene-purple soil
4 结论
在室内条件下开展了苯乙烯污染土壤的红外光谱特征实验,提取了苯乙烯在土壤中的光谱诊断特征波段,并筛选出与苯乙烯含量最敏感的光谱变量,最后采用不同模型进行建模预测并验证。苯乙烯在三种土壤中的特征波段类似且具有普遍性,位于1800,2200,2400 nm附近,可作为土壤中苯乙烯识别及其含量预测的依据。其中,苯乙烯-砖红土的诊断波段为1809,2119,2173,2348,2464 nm;苯乙烯-黑土的诊断波段为1798,2116,2171,2348,2469 nm;苯乙烯-紫土的诊断波段为1816,2119,2169,2346,2469 nm。随苯乙烯含量的增加,受污染土壤光谱反射率的降速先增大后减小,直到苯乙烯在土壤中饱和,反射率变化波动不大;土壤自身理化性质导致不同的苯乙烯反射率变化速率,土壤饱和含量越低,土壤反射率的降速越大。三种模型皆可预测苯乙烯污染土壤的含量,PLSR模型总体效果最优,SMLR模型效果次之,SVMR模型效果相对较差。
[1] Kwon B G, Moon K R. Physicochemical properties of styrene oligomers in the environment[J]. Science of the Total Environment, 2019, 683: 216-220.
[3] Lara-Gonzalo A, Kruge M A, Lores I, et al. Pyrolysis GC-MS for the rapid environmental forensic screening of contaminated brownfield soil[J]. Organic Geochemistry, 2015, 87: 9-20.
[4] David J, Weissmannová H D, Steinmetz Z, et al. Introducing a soil universal model method (SUMM) and its application for qualitative and quantitative determination of poly(ethylene), poly(styrene), poly(vinyl chloride) and poly(ethylene terephthalate) microplastics in a model soil[J]. Chemosphere, 2019, 225: 810-819.
[5] 鲁炳闻, 韩春媚, 周友亚, 等. 土壤中苯系物的顶空气相色谱-质谱联用测定方法研究[J]. 农业环境科学学报, 2010, 29(4): 812-816.
Lu B W, Han C M, Zhou Y Y, et al. Determination of benzene and its analogues in soil with headspace GC-MS[J]. Journal of Agro-Environment Science, 2010, 29(4): 812-816.
[6] Xu C Y, Lin X M, Yin S S, et al. Spatio-vertical characterization of the BTEXS group of VOCs in Chinese agricultural soils[J]. Science of The Total Environment, 2019, 694: 133631.
[8] Douglas R K, Nawar S, Alamar M C, et al. Almost 25 years of chromatographic and spectroscopic analytical method development for petroleum hydrocarbons analysis in soil and sediment: state-of-the-art, progress and trends[J]. Critical Reviews in Environmental Science and Technology, 2017, 47(16): 1497-1527.
[9] Ng W, Malone B P, Minasny B. Rapid assessment of petroleum-contaminated soils with infrared spectroscopy[J]. Geoderma, 2017, 289: 150-160.
[10] Cloutis E A. Review Article Hyperspectral geological remote sensing: evaluation of analytical techniques[J]. International Journal of Remote Sensing, 1996, 17(12): 2215-2242.
[11] Roger N C, Ted L R. Reflectance spectroscopy: quantitative analysis techniques for remote sensing applications[J]. Journal of Geophysical Research Solid Earth, 1984, 89(B7): 6329-6340.
[12] Demattê J A M, Sousa A A, Alves M C, et al. Determining soil water status and other soil characteristics by spectral proximal sensing[J]. Geoderma, 2006, 135: 179-195.
[13] Wang J. Viscarra R R A, Zhang S. Accounting for the effects of water and the environment on proximally sensed vis-NIR soil spectra and their calibrations[J]. European Journal of Soil Science, 2015, 66(3): 555-565.
[14] Cloutis E A. Spectral reflectance properties of hydrocarbons: remote-sensing implications[J]. Science, 1989, 245(4914): 165-168.
[15] Klavarioti M, Kostarelos K, Pourjabbar A, et al. In situ sensing of subsurface contamination: part I: near-infrared spectral characterization of alkanes, aromatics, and chlorinated hydrocarbons[J]. Environmental Science and Pollution Research International, 2014, 21(9): 5849-5860.
Article Outline
胡天佑, 陈志莉, 唐瑾, 王皓文, 宁甲练. 基于红外光谱构建土壤苯乙烯污染预测模型[J]. 光学学报, 2020, 40(8): 0830001. Tianyou Hu, Zhili Chen, Jin Tang, Haowen Wang, Jialian Ning. Model Construction for Soil Styrene Pollution Prediction Based on Infrared Spectroscopy[J]. Acta Optica Sinica, 2020, 40(8): 0830001.