大气与环境光学学报, 2024, 19 (1): 73, 网络出版: 2024-03-19  

基于紫外-可见光谱法的工业废水CNN-GRU分类模型研究

Research on CNN-GRU industrial wastewater classification model based on UV-Vis spectroscopy
作者单位
1 重庆理工大学电气与电子工程学院, 重庆 400054
2 重庆市铜梁区生态环境监测站, 重庆 402560
摘要
工业废水分类是水污染防治和水资源管理的前提和基础,相较于生活污水,工业废水的分类研究相对滞后。水体化学需氧量 (COD) 是衡量水体质量的核心指标,针对现有工业废水COD分类算法中预测精度较低的问题,提出基于门控循环单元 (GRU) 的卷积神经网络 (CNN) 混合模型。该模型首先将紫外-可见光谱法测得的工业废水COD数据进行高斯滤波去噪,然后把去噪后的光谱数据输入CNN模型进行特征提取,最后通过GRU神经网络实现工业废水COD分类。实验结果显示,CNN-GRU分类模型经过200次训练后达到收敛, 分类精度达到99.5%,与长短期记忆方法、GRU方法、CNN-LSTM方法相比,该混合模型的分类精度具有显著优势。
Abstract
The classification of industrial wastewater is a prerequisite and foundation for water pollution prevention and water resources management. However, compared to domestic sewage, research on industrial wastewater classification is relatively lagging behind. Chemical Oxygen Demand (COD) of water is a core indicator for measuring water quality. To address the problem of low prediction accuracy in existing industrial wastewater COD classification algorithms, a convolutional neural network (CNN) hybrid model based on gated recurrent units (GRU) is proposed. According to the hybrid model, the COD data of industrial wastewater measured by UV-Vis spectroscopy is subjected to Gaussian filtering and denoising at the first, then the denoised spectral data is input into the CNN model for feature extraction, and finally, COD classification of industrial wastewater is achieved using GRU neural network. The experimental results show that the CNN-GRU classification model converges after 200 times of training, with a classification accuracy of 99.5%. Compared with the long short-term memory method, the GRU method, and the CNN-LSTM method, the classification accuracy of CNN-GRU method has a significant advantage.

0 引 言

随着我国工业化率和城镇化率的不断提升,水体环境遭到严重破坏,水质检测、监测及实时预警的需求变得尤为迫切12。我国一直重视工业废水治理技术的研发与应用,根据《中国环境统计年鉴》统计,2020年我国工业化学需氧量排放总量为49.7万吨,相较于2019年下降了27.5万吨3。工业废水水质种类繁多,检测技术要求高,因此亟待一种切实可靠的工业废水分类方法辅助国家监管部门监控工业废水的排放情况。

化学需氧量 (COD) 被定义为由强氧化剂 (如重铬酸盐、高锰酸盐) 氧化水体中还原性物质所消耗的氧的当量,可代表大多数污水排放的总有机污染程度45。其数值越大,意味着污水的有机物污染情况越严重。利用紫外-可见 (UV-Vis) 光谱法构建模型对水质COD进行分析,在水质检测领域得到广泛应用,具有实时、在线、原位检测、无二次污染等优点。Li 等6提出了一种浊度补偿方法,有效地矫正了光谱吸收特性,显著提高了UV-Vis光谱测量COD的准确性。Li 等7针对COD的UV-Vis光谱测量提出了一种改进的Bagging算法,经过基于集成经验模态分解的算法去噪和稳定性竞争自适应重加权采样算法降维,降低检测模型的方差和偏差。改进的Bagging模型达到了最佳的预测性能。Chen 等8采用乘法散射校正来补偿混合溶液的吸收光谱的浊度,利用光谱差法对浊度补偿后的光谱进行COD补偿,通过偏最小二乘法 (PLS) 算法计算混合溶液中的硝酸盐、COD和浊度。

随着机器学习和人工智能技术的飞速发展,已有许多神经网络模型应用于水质预测或水体评价中910。卷积神经网络是一种应用广泛的多层感知机。Jia 等11提出了一种基于增强型卷积神经网络 (CNNs) 的回归模型用于预测COD,预测精度高,与回归曲线拟合良好。但是普通的模型已经无法应对日益复杂的水质变化,急需一种更快速、更精准的COD分类方法。

污水数据随时间、季节、气象条件等变化具有一定的周期性,但是并非呈现线性趋势,因此实时地对水质情况进行分类有一定的难度,使用门控循环网络 (GRU) 模型可能会引入与污水质量数据毫无关系的噪声,还会受到时间序列数据中较大值和较小值的影响,且模型训练时间过长。而卷积神经网络 (CNN) 模型在深层网络中,采用误差反向传播 (BP) 时靠近输入层的参数改动较慢,且池化层会丢失大量有价值信息,失去整体与局部的关联。特征提取的封装为网络性能的改进罩了一层黑盒,虽然能够针对每一段时间序列进行卷积运算,较好地提取水质信息中的局部特征,但由于CNN对时间顺序并不敏感,且采用梯度下降算法很容易使训练结果收敛于局部最小值而非全局最小值,单独完成污水分类的效果并不理想。因此,将CNN与GRU结合使用,充分利用CNN的特征信息提取能力和GRU对时间序列数据的敏感性,提高对污水分类的准确率12

为解决工业废水中的COD快速预测分类问题,提出了一种基于CNN的水体COD紫外可见光谱法检测方法。该模型将光谱数据输入CNN网络中,再经过GRU网络进行COD预测。通过与CNN神经网络、GRU神经网络、长短期记忆 (LSTM) 网络、CNN-LSTM网络相比,在预测精度与预测效率方面都取得了更好的效果,实现了工业废水的水质精准分类。

1 研究基础

1.1 基于UV-Vis光谱水质COD数据采集

依据《水质 化学需氧量的测定 重铬酸盐法》(HJ 828-2017)13配置浓度为100、150、500 mg/L的邻苯二甲酸氢钾标准溶液。根据《污水综合排放标准》(GB 8978-1996)14将100、150、500 mg/L的标准溶液根据浓度分为500份,并利用纯水稀释至0~100、100~150、150~500 mg/L浓度范围,如表1所示。

表 1. 工业废水COD分类标准

Table 1. Industrial wastewater COD classification standard

Industrial wastewater classificationConcentration/(mg·L-1)
Ⅰ类0-100
Ⅱ类100-150
Ⅲ类150-500

查看所有表

实验使用海洋光学生产的光谱仪,COD水质检测系统主要有氘卤灯光源 (DHLLS)、光衰减器 (OA)、支架 (CH)、比色皿 (CE)、遮光罩 (LH)、Maya2000 pro光谱仪 (MPSM) 以及电脑 (CP) 组成,实验平台结构如图1所示。

图 1. 基于UV-Vis光谱法的实验平台结构图

Fig. 1. Structure diagram of experimental platform based on ultraviolet-visible spectroscopy

下载图片 查看所有图片

为避免光照对数据采集的干扰,保证采集环境一致性,实验过程中都使用特制的样品支架进行遮光处理。根据多次调试结果,设置光谱仪采集的积分时间为80 ms,平均扫描次数为10次。根据朗伯-比尔定律检测邻苯二甲酸氢钾溶液的吸光度A,即

A=lgIinIout ,

式中Iin为光源垂直照射物体的入射光强度,Iout为光源垂直照射物体后的出射光强度。

实验时,为去除水中的散射影响,检测纯水出射光作为样品的入射光,然后采集样品出射光,利用式 (1) 计算出吸光度。图2为0~500 mg/L COD溶液在210~400nm波段的光谱数据。

图 2. 0~500 mg/L COD溶液的UV-Vis光谱数据

Fig. 2. UV-Vis spectral data of 0-500 mg/L COD solution

下载图片 查看所有图片

1.2 卷积神经网络算法

CNN模型是神经网络中的一种,一般由五个部分构成,分别是输入层、卷积层、池化层、全连接层、激活函数层。CNN通过充分利用局部相关性和权值共享的思想,很大程度上减少了网络参数量,从而提高训练效率,得以实现超大规模的深层网络。通过卷积函数提取数据特征,随着网络逐渐加深,输入的每个神经元与前一层局部感受野链接在一起。池化层也称为下采样,可以有效减少网络中的参数,防止过拟合发生。全连接层在整个 CNN 中充当分类器,将学习到的特征映射到样本标记空间。激活函数层的功能是对提取的特征进行非线性变换,激活提取的特征。

1.3 门控循环单元

循环神经网络 (RNN) 是一种用于处理序列数据的神经网络。在RNN中,在训练过程中容易出现梯度消失和梯度爆炸,从而导致RNN在实际应用中的效果不尽如人意。Hochreiter 和 Schmidhuber15提出了具有记忆功能的 LSTM。它由三部分组成:输入门、遗忘门和输出门。根据算法判断输入数据,需要则被保留,否则就会被丢弃。LSTM在大部分序列任务上都取得了比基础RNN模型更好的性能和表现,但是LSTM结构相对复杂,计算代价较高,模型参数量较大。研究发现,只有遗忘门的简化版网络在多个基准数据集上面优于标准LSTM网络。Cho等16根据LSTM网络提出了GRU网络,其结构如图3所示,GRU网络由两部分组成:复位门和更新门。

图 3. 门控循环单元结构

Fig. 3. Gated recurrent unit structure

下载图片 查看所有图片

复位门根据门控向量控制进入GRU网络的输入状态,更新门根据上一时刻状态和新输入控制当前状态。GRU的表达式为

rt=σ(Wr[ht-1,xt]+br) ,h˜t=tanh(Wh[rtht-1,xt]+bh) ,zt=σ(Wz[ht-1,xt]+bz) ,ht=(1-zt)ht-1+zth˜t ,

式中rtzt分别位复位门和更新门的门控向量;h˜ht分别是t-1时刻的状态和t时刻的状态;σ为激活函数,一般为Sigmoid函数;Wb代表t时刻的权重矩阵和偏置;xt表示t时刻的输入;tanh为双曲正切函数。

Cho等16提出的GRU神经网络相较于LSTM具有更简单的结构,且对工业废水的预测具有良好的性能,可以更好地作为污水处理的算法支持。Miao等17的研究说明GRU神经网络的城市污水COD预测结果优于传统RNN,具有架构更简单、学习效率快等优点。

2 实验与结果分析

2.1 基于CNN和GRU的深度学习网络模型

基于CNN和GRU的深度学习网络模型流程图如图4所示。将原始数据经过数据预处理后,通过CNN网络提取输入特征,构建时序性的特征向量,并将结果输入到GRU中进行训练,再通过优化算法对网络中的参数进行更新优化。CNN可以进行特征提取,通过提取低维深层次特征18,降低GRU需要的时间开销的同时,提升了整个模型的精确度。

图 4. CNN-GRU网络模型流程图

Fig. 4. Flow chart of CNN-GRU network model

下载图片 查看所有图片

为了更好地完成分类任务参考VGG16模型,卷积层采用的卷积核尺寸均为3,可通过适当加深神经网络深度增强模型的预测能力。本研究中使用2个GRU层,优化器采用Adama,学习率设置为0.0012,损失函数采用categorical_crossentropy。CNN-GRU网络各层输出维度如表2所示。

表 2. CNN-GRU网络各层输出维度

Table 2. Output dimension of each layer of CNN-GRU network

LayerNetworkOutput shape
1Conv1D(2067, 1)
2Conv1D(2065, 1)
3MaxPooling1D(688, 1)
4Conv1D(686, 1)
5Conv1D(684, 1)
6MaxPooling1D(228, 1)
7Conv1D(226, 1)
8Conv1D(224, 1)
9MaxPooling1D(74, 1)
10GRU(64)
11GRU(64)
12Flatten(4736)
13Dence(3)

查看所有表

2.2 数据预处理

实测水体的UV-Vis光谱数据中常含有高频噪声,主要由实验器械引起。图5中可以明显看到原始数据存在噪声,且噪声集中于210~250 nm段。采用小波去噪、Savitzky-Golay平滑滤波和高斯滤波算法分别对原始数据进行去噪处理,去除高频噪声。根据中心极限定理,光谱噪声服从高斯分布。为验证去噪算法的有效性,在250~600 nm处的光谱数据中加入50、40、30、20 dB的高斯白噪声,模拟在210~250 nm数据中存在的噪声,如图6所示。

图 5. 原始光谱数据

Fig. 5. Raw spectral data

下载图片 查看所有图片

图 6. 加噪光谱数据。(a) 50 dB; (b) 40 dB; (c) 30 dB; (d) 20 dB

Fig. 6. Noised spectral data. (a) 50 dB; (b) 40 dB; (c) 30 dB; (d) 20 dB

下载图片 查看所有图片

原始数据存在的噪声近似为30~40 dB的高斯高噪声。采用信噪比RSN和均方根误差RSME评价去噪效果,信噪比表示的是信号中含有噪声的多少,其值越大,信号中噪声含量越少;均方根误差表示测量样本的可靠性,其值越小,测量的可靠性越高。RSNRSME的计算公式分别为

RSN=10lgPsPn ,RSME=1Nt=1N(xobs.t-xpre.t)2 ,

式中Ps表示信号的功率,Pn表示噪声的功率,xobs.t为去噪前的数据,xpre.t为去噪后的数据。

通过对比小波去噪、Savitzky-Golay平滑滤波和高斯滤波去噪算法去噪效果,如表3所示。由表可知,当噪声为20 dB时,Savitzky-Golay平滑滤波去噪的信噪比最高,高斯滤波去噪效果次之;Savitzky-Golay平滑滤波和高斯滤波去噪均方根误差相同,小波去噪效果较差。当噪声为30 dB及以上时,高斯滤波算法相比于Savitzky-Golay平滑算法和小波去噪信噪比更高,且均方根误差更小。图7为添加30 dB的高斯白噪声,经高斯滤波算法处理后有较好的去噪效果。图8为原始数据经过高斯滤波算法处理结果。

表 3. 光谱去噪结果

Table 3. The result of spectral denosing

Denoising methodRSNRSME
20 dB30 dB40 dB50 dB20 dB30 dB40 dB50 dB
Savitzky-Golay17.9619.0919.1919.220.060.050.050.05
Wavelet17.2518.2718.3818.400.070.060.060.06
Gauss17.9321.9622.7822.910.060.040.040.04

查看所有表

图 7. 加入30 dB噪声的高斯滤波去噪

Fig. 7. Gaussian filter denoising with 30 dB noise added

下载图片 查看所有图片

图 8. 原始数据高斯滤波去噪

Fig. 8. Gaussian filter denoising of raw data

下载图片 查看所有图片

2.3 预测结果与分析

将数据按照6:2:1分为训练集、验证集和测试集,使用CNN-GRU混合神经网络在数据集上进行训练,将预测结果于相同条件下LSTM网络19-21、GRU网络22、CNN网络23、CNN-LSTM网络24-26的预测精度进行比较27,可以得知本模型在保持高效训练的同时具有较好的预测精度。

训练过程如图9所示。由图可以看出,经过30次迭代以后,精度很快收敛到较高水平,在200次迭代后趋于稳定,此时认为训练完毕,得到的COD分类模型精度高达99.5%。

图 9. CNN-GRU模型 COD分类训练结果图

Fig. 9. CNN-GRU model COD classification training result diagram

下载图片 查看所有图片

为了横向比较CNN-GRU算法COD预测精度,将所提出算法与CNN、LSTM、GRU、CNN-LSTM模型进行对比,其中CNN网络与CNN-GRU模型中的CNN设定相同;LSTM网络模型由2层LSTM单元与一层全连接层组成;GRU网络由2层GRU单元与一层全连接层组成,且与CNN-GRU网络中GRU网络结构相同;CNN-LSTM网络结构与本文中CNN-GRU网络结构设置相同。将所有网络模型对所测得的COD UV-Vis光谱数据进行预测分类,得到各个模型的准确率与预测效率如表4所示。由表可知,GRU网络与LSTM网络相似,但是GRU网络计算效率更高,其分类精度与LSTM网络相同,都为97.5%。GRU网络与LSTM网络相对CNN网络分类精度更高,GRU网络和LSTM网络与CNN网络混合模型的分类精度都得到了提高。CNN-GRU模型与LSTM神经网络、GRU网络模型、CNN神经网络、CNN-LSTM神经网络相比预测精度分别提升了2%、2%、3.5%、1.5%。因此CNN-GRU模型在工业废水COD分类有显著优势。

表 4. 模型预测结果比较

Table 4. Model prediction results comparison

Predictive modelPrediction accuracy/%
CNN Model96.0
LSTM Model97.5
GRU Model97.5
CNN-LSTM Model98.0
CNN-GRU Model99.5

查看所有表

3 结 论

针对工业废水快速预测分类的问题,提出了一种基于CNN与GRU相结合的工业废水COD预测模型。该模型克服了在深层网络中输入层参数改动较慢,而采用梯度下降时会形成局部收敛的问题。通过高斯滤波去噪去除高频波段噪声。利用CNN提取光谱数据特征,接着输入GRU单元中,实现UV-Vis光谱COD数据精准分类。CNN-GRU模型的预测精度与预测效率具有显著优势。

参考文献

[1] Koppanen M, Kesti T, Kokko M, et al. An online flow-imaging particle counter and conventional water quality sensors detect drinking water contamination in the presence of normal water quality fluctuations[J]. Water Research, 2022, 213: 118149-118161.

[2] Sun Y, Chen Z, Wu G X, et al. Characteristics of water quality of municipal wastewater treatment plants in China: Implications for resources utilization and management[J]. Journal of Cleaner Production, 2016, 131: 1-9.

[3] 胡汉舟, 孙守亮. 中国环境统计年鉴 [M]. 北京: 中国统计出版社, 2021: 20-23.

    HuH Z, SunS L. China Statistical Yearbook on Environment [M]. Beijing: China Statistics Press, 2021: 20-23.

[4] 汤 斌, 魏 彪, 吴德操, 等. 一种紫外-可见光谱法检测水质COD的浊度影响实验研究[J]. 光谱学与光谱分析, 2014, 34(11): 3020-3024.

    Tang B, Wei B, Wu D C, et al. Experimental research of turbidity influence on water quality monitoring of COD in UV-visible spectroscopy[J]. Spectroscopy and Spectral Analysis, 2014, 34(11): 3020-3024.

[5] Nezamzadeh-Ejhieh A, Shirzadi A. Enhancement of the photocatalytic activity of ferrous oxide by doping onto the nano-clinoptilolite particles towards photodegradation of tetracycline[J]. Chemosphere, 2014, 107: 136-144.

[6] Li J W, Tong Y F, Guan L, et al. A turbidity compensation method for COD measurements by UV-vis spectroscopy[J]. Optik, 2019, 186: 129-136.

[7] Li J W, Pan S S, Bian J, et al. An improved-bagging model for water chemical oxygen demand measurements using UV-vis spectroscopy[J]. IEEE Access, 2021, 9: 161834-161845.

[8] Chen X W, Yin G F, Zhao N J, et al. Simultaneous determination of nitrate, chemical oxygen demand and turbidity in water based on UV-Vis absorption spectrometry combined with interval analysis[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2021, 244: 118827-118833.

[9] 秦 岭, 张崇泰, 郭 瑛, 等. 基于Elman神经网络的可见光室内定位算法研究[J]. 光学学报, 2022, 42(5): 16-23.

    Qin L, Zhang C T, Guo Y, et al. Research on visible light indoor location algorithm based on Elman neural network[J]. Acta Optica Sinica, 2022, 42(5): 16-23.

[10] Cai J N, Meng L, Liu H L, et al. Estimating chemical oxygen demand in estuarine urban rivers using unmanned aerial vehicle hyperspectral images[J]. Ecological Indicators, 2022, 139: 108936.

[11] Jia W S, Zhang H Z, Ma J, et al. Study on the predication modeling of COD for water based on UV-VIS spectroscopy and CNN algorithm of deep learning[J]. Spectroscopy and Spectral Analysis, 2020, 40(9): 2981-2988.

[12] 赵明富, 唐 平, 汤 斌, 等. 主成分分析联合Fisher判别在紫外-可见光谱法水质检测中的应用[J]. 大气与环境光学学报, 2018, 13(6): 436-446.

    Zhao M F, Tang P, Tang B, et al. Application of principal component analysis combined fisher discrimination in water quality detection by UV-vis spectroscopy[J]. Journal of Atmospheric and Environmental Optics, 2018, 13(6): 436-446.

[13] 生态环境部. 水质 化学需氧量的测定 重铬酸盐法: HJ 828―2017 [S]. 北京: 中国标准出版社, 2017.

    Ministry of Ecology and Environment. Water quality-Determination of the chemical oxygen demand-Dichromate method: HJ 828―2017 [S]. Beijing: China Standard Press, 2017.

[14] Ministry of Ecology and Environment. Intigrated wastewater discharge standard: GB 8978―1996 [S]. Beijing: China Standard Press, 1996.

    生态环境部. 污染综合排放标准: GB 8978―1996 [S]. 北京: 中国标准出版社, 1996.

[15] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.

[16] ChoK, van MerriënboerB, GulcehreC, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation [C]. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha, Qatar. Stroudsburg, PA, USA: Association for Computational Linguistics, 2014: 1724-1734.

[17] Miao S, Zhou C L, AlQahtani S A, et al. Applying machine learning in intelligent sewage treatment: A case study of chemical plant in sustainable cities[J]. Sustainable Cities and Society, 2021, 72: 103009-103017.

[18] 周飞燕, 金林鹏, 董 军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251.

    Zhou F Y, Jin L P, Dong J. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1251.

[19] Jiang Y Q, Li C L, Sun L, et al. A deep learning algorithm for multi-source data fusion to predict water quality of urban sewer networks[J]. Journal of Cleaner Production, 2021, 318: 128533-128543.

[20] Hu C S, Cheng F J, Ma L, et al. State of charge estimation for lithium-ion batteries based on TCN-LSTM neural networks[J]. Journal of the Electrochemical Society, 2022, 169(3): 030544.

[21] Sagheer A, Kotb M. Time series forecasting of petroleum production using deep LSTM recurrent networks[J]. Neurocomputing, 2019, 323: 203-213.

[22] Ma Y, Li H G. A GRU network-based approach for steam drum water level predictions[J]. Journal of Chemical Engineering of Japan, 2020, 53(5): 198-205.

[23] Jourabloo A, Liu X M. Pose-invariant face alignment via CNN-based dense 3D model fitting[J]. International Journal of Computer Vision, 2017, 124(2): 187-203.

[24] Kortli Y, Gabsi S, Voon L F C L Y, et al. Deep embedded hybrid CNN-LSTM network for lane detection on NVIDIA Jetson Xavier NX[J]. Knowledge-Based Systems, 2022, 240: 107941.

[25] Vidal A, Kristjanpoller W. Gold volatility prediction using a CNN-LSTM approach[J]. Expert Systems with Applications, 2020, 157: 113481-113490.

[26] Wang Z F, Man Y, Hu Y S, et al. A deep learning based dynamic COD prediction model for urban sewage[J]. Environmental Science: Water Research & Technology, 2019, 5(12): 2210-2218.

[27] Zhou X H, Wang J P, Cao X K, et al. Simulation of future dissolved oxygen distribution in pond culture based on sliding window-temporal convolutional network and trend surface analysis[J]. Aquacultural Engineering, 2021, 95: 102200.

缪俊锋, 汤斌, 陈庆, 龙邹荣, 叶彬强, 周彦, 张金富, 赵明富, 周密. 基于紫外-可见光谱法的工业废水CNN-GRU分类模型研究[J]. 大气与环境光学学报, 2024, 19(1): 73. Junfeng MIAO, Bin TANG, Qing CHEN, Zourong LONG, Binqiang YE, Yan ZHOU, Jinfu ZHANG, Mingfu ZHAO, Mi ZHOU. Research on CNN-GRU industrial wastewater classification model based on UV-Vis spectroscopy[J]. Journal of Atmospheric and Environmental Optics, 2024, 19(1): 73.

引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!