基于卷积神经网络的城墙多光谱成像病害检测方法
1 引言
西安城墙是中国现存规模最大、最完整的城墙之一,在我国历史文化发展中占有重要位置[1]。由于年代久远和环境因素等影响,城墙受到了不同程度破坏,产生了墙体剥落、生物病害、裂隙、盐析风化等病害[2],这些病害是衡量墙体健康状况的重要依据。因此,对城墙等建筑物的病害检测已成为文物保护工作必不可少的环节[3]。传统城墙病害检测大都采用现场勘测方法[4-6],通过分析病害物理性质、化学成分及微观结构特征,并计算相关参数来对病害类别进行分析。但城墙病害数据采集工作量较大,需消耗大量的人力、物力,且病害分析易受到主观因素影响。因此,需要一种快速无损的检测方法实现对城墙病害的客观评价[7]。多光谱成像技术是一种集数字成像与光谱测量技术于一体,记录光学信息的无损分析技术[8],与传统目标检测方法相比,其能快速大量获取城墙多光谱数据,有效提高城墙病害检测效率。
与传统基于统计学原理的分析方法[9]相比,机器学习具有自动学习[10]并能够提取深层特征的特性,已在光谱分类方面形成优势,成为光谱数据分类的常用方法[11]。以支持向量机(SVM)算法[12]、K-最近邻(KNN)算法[13]和随机森林(RF)算法[14]为代表的传统机器学习算法在图像分类领域都有着良好效果。Guo等[15]利用SVM算法对高光谱图像进行了识别分类,结果显示,对二分类目标而言,SVM算法可以达到不错的分类效果,但针对光谱数据中数据特征较多的情况,其分类效果有所欠缺。Xie等[16]利用KNN算法对健康番茄和灰霉病番茄叶片高光谱图像进行分类,并取得了较好的分类效果,但算法中的K值难以确认,耗费了大量时间。曹赤鹏等[17]利用RF算法对石窟表面风化程度进行了智能评估,RF算法具有对样本需求量少、分类精度高等优点,但模型内部参数和随机种子很难找到最优解,导致分类效果有所欠缺。
相比传统机器学习方法,近些年,以卷积神经网络(CNN)[18]为代表的深度学习方法在图像分类领域取得了重大成果[19]。CNN通过共享卷积核来模拟人脑活动机制,将多维矩阵直接输入网络从而避免了手动提取特征过程中复杂的数据重建过程[20-21]。通过训练适当权重,使得特征数据能够达到理想分类效果。目前,使用深度学习方法对城墙病害检测问题的研究极其缺乏。根据城墙多光谱数据特点,本文提出一种基于CNN的城墙多光谱成像病害检测方法。首先,利用最小噪声分离方法对城墙病害多光谱数据进行预处理,降低数据维度的同时,保留了原始数据特征;其次,利用卷积操作对城墙多光谱数据进行特征提取,保留最重要特征并去除无关特征,稀疏网络模型;然后,通过全连接层对其进行整合梳理和分类;最后,加入两次dropout来抑制过拟合问题。使用训练后具有感知能力的CNN分类模型对城墙病害进行像素级分类检测,并将预测结果进行可视化展示,实现对城墙病害的无损智能检测。
2 相关原理
2.1 城墙多光谱数据预处理
2.1.1 黑白板校正
为了消除光照不均与暗电流对多光谱数据的影响,在采集城墙多光谱成像数据之前,采集暗电流与标准白板信息,通过下式对多光谱图像进行校正。
式中:
2.1.2 多光谱图像配准
在多光谱成像数据采集过程中,需要更换滤光片来调整通道参数,但在调整过程中由于摄像位置、拍摄角度等存在细小偏差,需要对采集到的多光谱数据进行配准,即将同一像素点在不同波段下的图像由不同坐标系变换到同一坐标系。相关公式为
式中:
2.1.3 城墙多光谱成像数据最小噪声分离
对城墙多光谱成像数据进行降维,可以去除数据冗余和噪声,加快运算速率,提高分类准确率。
常用的多光谱数据降维方法有主成分分析(PCA)方法和最小噪声分离(MNF)方法。PCA方法通过一种线性投影,将高维数据映射到低维空间,减少了总数据量。但PCA方法对噪声比较敏感,信息量大的特征分量噪声不一定低。对城墙表面多光谱数据进行特征提取时,需要将处理后的图像进行融合,以便进行之后的分类工作。但PCA方法融合多光谱图像并不是为了减少噪声,而是通过该变换,使得多光谱图像各个特征分量间保持相对独立性。MNF方法是两次叠加的PCA方法,第一次用于分离原始数据中的噪声并对其进行重新调节;第二次是对第一次调整后的噪声白化数据进行标准主成分变换。这样就达到了对融合后的多光谱图像去噪的目的。基于此,使用MNF方法对城墙多光谱数据进行降维。MNF方法具体分为
式中:
其中,
式中:
式中:城墙多光谱成像数据
通过以上2次变换得到矩阵
2.2 基于CNN的城墙多光谱成像病害检测方法
城墙病害多光谱成像样本为像素级,能够实现对城墙病害的精细化检测。但另一方面,由于年代久远及环境因素等影响,城墙不同病害类型的像素复杂多样,在模型训练制作标签时,难免存在错误标签,当错误标签的影响较大导致正确标签的梯度下降增益无法将其抵消时,机器学习便倾向于在二者之间随机学习,导致分类准确率下降。在CNN中,卷积操作能够对输入的图像进行特征选择,保留特征图中最重要的特征并去除无关特征,从而减小特征图维数,起到稀疏模型作用,提高了模型的泛化能力,使得神经网络能够保持较高的准确率。
CNN通过局部区域连接来实现权值共享,每个神经元通过权值共享可以影响一部分周围神经元,这样就减少了权值数目,降低了模型复杂度,城墙多光谱成像病害检测CNN基本结构如
图 1. 城墙多光谱成像病害检测CNN基本结构
Fig. 1. Basic structure of CNN for city wall multispectral imaging disease detection
城墙多光谱成像病害检测CNN的基本结构由卷积层、激活层和全连接层组成。输入层输入的16个通道的城墙多光谱成像数据经过卷积操作,卷积层通过使用指定的过滤器卷积输入图像。卷积的基本过程如
式中:
式中:
全连接层在CNN中起到“分类”的作用,通过将其他层的输入进行整合梳理,最后以类的形式进行输出。
采用数据集是城墙病害多光谱成像数据,与其他图像如高光谱遥感图像相比,其病害类别以及通道数均较少,基于此设计了一种适用于城墙病害多光谱成像数据分类的CNN模型。提出的CNN模型结构,如
表 1. CNN模型结构
Table 1. CNN model structure
|
同时,在整个卷积网络中加入了2次参数为0.25和0.5的dropout。加入dropout的目的是避免模型训练过程中出现过拟合问题,有效提高模型的泛化能力[22]。
城墙病害检测主要是通过将经过黑白板校正和配准后的城墙多光谱数据通过最小噪声分离方法进行降维去噪,将降维去噪后的低维图像进行融合并送入搭好的CNN模型进行训练和测试,再将处理后的待检测城墙多光谱数据送入模型进行预测,最终输出检测结果并进行可视化展示。城墙病害检测流程图如
3 实验与分析
3.1 实验环境
实验平台为Windows10(64位)操作系统,实验设备为基于Intel(R)Core(TM)i-7-8700CPU@3.20 GHz处理器和Nvidia GeForce RTX 2070的GPU、Anaconda3、PyCharm编辑器,深度学习网络框架为TensorFlow 1.9,采用Python 3.6编程语言,实现对城墙多光谱成像病害的检测工作。
3.2 数据采集
利用海洋光学公司的SpectroCamVIS型多光谱成像系统采集西安城墙(永宁门到朱雀门之间)多光谱成像数据,采集图像分辨率为1292 pixel×855 pixel,共采集16个波段,采集波长范围为400
图 5. 城墙多光谱成像数据。(a)城墙采样立方体数据;(b)每个通道多光谱成像数据
Fig. 5. City wall multispectral imaging data. (a) City wall sampling cube data; (b) multispectral imaging data for each channel
3.3 数据处理
3.3.1 基于最小噪声分离的城墙多光谱数据降维
利用最小噪声分离方法对城墙多光谱数据进行降维去噪处理。
表 2. MNF各特征分量特征值及累计贡献率
Table 2. Eigenvalue and cumulative contribution rate of each component of MNF
|
特征值数量N反映了图像所含信息量的多少,目标图像所含信息量越多,目标检测识别效果越好。由
3.3.2 样本划分
物质成分的改变是导致城墙表面反射光谱产生差异的决定性因素。由于多年的风吹日晒、酸雨侵蚀等原因,城墙表面生成了大面积的生物病害;同时,大气环境中的有害离子(Na+、
图 7. 城墙表面病害RGB图像。(a)生物病害;(b)强盐析病害;(c)弱盐析病害;(d)基准砖石
Fig. 7. RGB images of city wall surface disease. (a) Biological disease; (b) strong salting out disease; (c) weak salting out disease; (d) basal brick
根据物质不同、光谱反射率不同,城墙病害类别就不同,将采集的城墙多光谱成像数据分为4类,分别为生物病害、严重盐析病害、轻度盐析病害以及基准砖石。选取感兴趣区域,对这4类物质进行标记,如
图 9. 城墙表面目标区域图像。(a)目标区域的RGB图像;(b)目标区域740 nm处多光谱图像;(c)目标区域标记情况
Fig. 9. Images of target area on wall surface. (a) RGB image of the target area; (b) multispectral image of the target region at 740 nm;(c) target area marking condition
如
表 3. 每类样本训练集、测试集数量
Table 3. Number of training sets and test sets for each sample
|
3.4 实验结果与分析
为了验证所提算法对多光谱成像的城墙病害的检测分类优势,将所提算法与RF算法、SVM算法以及KNN算法对城墙病害检测分类结果对比,并对预测结果进行可视化展示。
表 4. 4种算法对城墙病害纯净区域的检测结果
Table 4. Detection results of four algorithms for the pure area of city wall disease
|
为了定量评价各分类模型对城墙病害分类情况,使用Kappa系数与总体精度对以上算法的分类情况进行评价。Kappa系数是基于混淆矩阵的准确度评价指标,取值在-1到1之间。总体精度表示分类正确的样本个数占所有样本个数的比例,越接近100%说明分类效果越好。相关公式可表示为
式中:
为了验证最小噪声分离方法对实验结果的影响,将原始16通道与最小噪声分离后前5特征分量的城墙多光谱成像数据输入CNN,
表 5. 最小噪声分离方法前后在卷积网络中的指标对比
Table 5. Index comparison before and after minimum noise fraction method in convolutional network
|
由
表 6. 不同算法对城墙病害的分类结果
Table 6. Classification results of wall diseases by different algorithms
|
在城墙多光谱数据中,待检测区域的总像素点个数为1104660个,以城墙多光谱数据反射率幅值为分类依据,4种算法对城墙病害分类情况进行预测,并将结果进行可视化展示,与城墙病害真实分布情况对比,结果如
图 10. 城墙表面病害可视化展示。(a)目标区域伪彩色图像;(b)本文算法预测结果;(c)RF算法预测结果;(d)SVM算法预测结果;(e)KNN算法预测结果
Fig. 10. Visual display of wall surface diseases. (a) False-color image of the target area; (b) prediction results of the proposed algorithm; (c) prediction results of RF algorithm; (d) prediction results of SVM algorithm; (e) prediction results of KNN algorithm
4 结论
针对传统城墙病害检测效率低下且易受到人工因素干扰的问题,提出了一种基于CNN的城墙多光谱成像病害检测方法,可以实现对城墙病害的像素级分类检测。首先,采用最小噪声分离方法对采集到的城墙病害多光谱数据进行预处理,降低数据维度的同时减少了数据噪声;其次,利用卷积操作对城墙病害多光谱数据进行特征提取,保留最重要特征并去除无关特征,稀疏网络模型、提高模型泛化能力,解决了城墙不同病害类型的像素混杂多样造成分类准确率较低的问题;然后,通过全连接层对卷积层提取到的特征进行整合梳理和分类;最后,加入2次dropout防止过拟合问题的出现。使用训练后具有感知能力的CNN分类模型对城墙病害实现像素级分类检测,并将检测结果进行可视化展示。实验结果表明,所提算法检测城墙多光谱成像病害的总体精度和Kappa系数均高于其他对比算法。与传统现场勘测的方法相比,所提方法能够实现对城墙病害的快速无损检测,对城墙病害的修复工作提供了参考。
[1] 张宁宁. 中国古城墙的文化价值及云展览现状探析[J]. 大众标准化, 2021(2): 131-133.
Zhang N N. On the cultural value of China ancient city wall and the present situation of cloud exhibition[J]. Popular Standardization, 2021(2): 131-133.
[2] 白禹, 张中俭, 刘鹏辉, 等. 古城墙古砖的病害分类[J]. 山西建筑, 2020, 46(1): 30-32.
Bai Y, Zhang Z J, Liu P H, et al. Disease classification of the ancient brick in ancient city wall[J]. Shanxi Architecture, 2020, 46(1): 30-32.
[3] 朱才辉, 周远强. 某在役明城墙病害调研及评估方法[J]. 自然灾害学报, 2019, 28(2): 60-73.
Zhu C H, Zhou Y Q. Pathologies investigation and assessment method of an ancient City Wall in Ming Dynasty[J]. Journal of Natural Disasters, 2019, 28(2): 60-73.
[4] Chen G Q, Li L, Li G M, et al. Failure modes classification and failure mechanism research of ancient city wall[J]. Environmental Earth Sciences, 2017, 76(23): 810.
[5] Feng B, Hu Y, Hou M. A method for monitoring bulge of ancient city wall after repair[J]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2021, 46: 221-224.
[6] 周伟. 探地雷达法在古城墙内部病害检测上的应用[J]. 智能城市, 2018, 4(11): 25-26.
Zhou W. Application of ground penetrating radar method in detection of diseases in ancient city walls[J]. Intelligent City, 2018, 4(11): 25-26.
[7] 凌雪, 吴萌蕾, 廖原, 等. 文物研究与保护中的无损分析技术[J]. 光谱学与光谱分析, 2018, 38(7): 2026-2031.
[8] 王雪培, 赵虹霞, 李青会, 等. 多光谱成像技术分析彩色艺术品的相关基础研究[J]. 光学学报, 2015, 35(10): 1030003.
[9] NurielO, BenaimS, WolfL. Permuted AdaIN: reducing the bias towards global statistics in image classification[C]∥2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), June 20-25, 2021, Nashville, TN, USA. New York: IEEE Press, 2021: 9477-9486.
[10] 朱孙泳, 金莹, 吴泉英, 等. 基于混合卷积的有限角度发射光谱层析重建[J]. 光学学报, 2022, 42(13): 1315002.
[11] 李云鹏, 代雪晶, 王猛, 等. 隐性字迹的快速光谱显现与高光谱分类技术研究[J]. 光谱学与光谱分析, 2021, 41(11): 3524-3531.
[12] Chandra M A, Bedi S S. Survey on SVM and their application in image[J]. International Journal of Information Technology, 2021, 13(5): 1-11.
[13] Guo Y H, Cao H, Han S M, et al. Spectral-spatial hyperspectral image classification with K-nearest neighbor and guided filter[J]. IEEE Access, 2018, 6: 18582-18591.
[14] Cao X H, Li R J, Ge Y M, et al. Densely connected deep random forest for hyperspectral imagery classification[J]. International Journal of Remote Sensing, 2019, 40(9): 3606-3622.
[15] Guo Y H, Yin X J, Zhao X C, et al. Hyperspectral image classification with SVM and guided filter[J]. EURASIP Journal on Wireless Communications and Networking, 2019(1): 1-9.
[16] Xie C Q, Yang C, He Y. Hyperspectral imaging for classification of healthy and gray mold diseased tomato leaves with different infection severities[J]. Computers and Electronics in Agriculture, 2017, 135: 154-162.
[17] 曹赤鹏, 王慧琴, 王可, 等. 基于多光谱成像和随机森林算法的石窟表面风化智能评估方法[J]. 光学学报, 2020, 40(22): 2230001.
[18] Cao X Y, Yao J, Xu Z B, et al. Hyperspectral image classification with convolutional neural network and active learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 58(7): 4604-4616.
[19] Rehman A, Naz S, Razzak M I, et al. Automatic visual features for writer identification: a deep learning approach[J]. IEEE Access, 2019, 7: 17149-17157.
[20] 万颖, 杨红云, 王映龙, 等. 基于图像分割与卷积神经网络的水稻病害识别[J]. 西北农业学报, 2022, 31(2): 246-256.
Wan Y, Yang H Y, Wang Y L, et al. Recognition of rice disease based on image segmentation and convolution neural network[J]. Acta Agriculturae Boreali-Occidentalis Sinica, 2022, 31(2): 246-256.
[21] 许慧青, 陈斌, 王敬飞, 等. 基于卷积神经网络的细长路面病害检测方法[J]. 计算机应用, 2022, 42(1): 265-272.
Xu H Q, Chen B, Wang J F, et al. Elongated pavement distress detection method based on convolutional neural network[J]. Journal of Computer Applications, 2022, 42(1): 265-272.
[22] Ghazi M M, Yanikoglu B, Aptoula E. Plant identification using deep neural networks via optimization of transfer learning parameters[J]. Neurocomputing, 2017, 235: 228-235.
[23] 张悦, 金普军, 王肃, 等. 西安城墙古砖表面风化病害及腐蚀机理研究[J]. 文博, 2019(4): 106-112.
Zhang Y, Jin P J, Wang S, et al. Studies on the mechanisms of the surface weathering disease and erosion of the bricks of the Xi'an city wall[J]. Relics and Museolgy, 2019(4): 106-112.
Article Outline
李敏, 王慧琴, 王可, 王展, 李源. 基于卷积神经网络的城墙多光谱成像病害检测方法[J]. 激光与光电子学进展, 2024, 61(4): 0437006. Min Li, Huiqin Wang, Ke Wang, Zhan Wang, Yuan Li. City Wall Multispectral Imaging Disease Detection Method Based on Convolutional Neural Networks[J]. Laser & Optoelectronics Progress, 2024, 61(4): 0437006.