激光与光电子学进展, 2020, 57 (1): 013001, 网络出版: 2020-01-03   

基于特征波段-Fisher-K近邻的木器漆拉曼光谱的快速无损鉴别 下载: 1057次

Rapid Nondestructive Identification of Wood Lacquer Using Raman Spectroscopy Based on Characteristic-Band-Fisher-K Nearest Neighbor
作者单位
中国人民公安大学刑事科学技术学院, 北京 100038
摘要
为了实现木器漆的快速无损检测以及精确识别与分类,采集并获取了晨阳等3种品牌木器漆样本的拉曼光谱,并考察了基线校正、Savitzky-Golay九点平滑法、一阶导数和二阶导数等不同预处理方法的处理效果,建立了特征波段比值、Fisher判别、K近邻(KNN)模型。结果表明:特征波段比值法能以1358 cm -1/1239 cm -1表征3种木器漆的特征;基于Fisher判别的基线校正、平滑和二阶导数处理的拉曼光谱模型的分类准确率最高,能实现100%区分;在相同的预处理下,KNN判别模型的准确率仅为88.5%。基于二阶导数的拉曼光谱结合特征波段-Fisher-KNN法能为不同品牌木器漆的准确检测提供一种新的快速无损分析手段,具有普适性和一定的借鉴意义。
Abstract
In this study, the Raman spectra of three brands of wood lacquer samples, such as Chenyang brand, are examined to realize the rapid nondestructive detection as well as the accurate identification and classification of wood lacquer. Subsequently, the processing effects of different preprocessing methods, such as the baseline correction, Savitzky-Golay nine-point smoothing, first derivative, and second derivative, are investigated. Three models of characteristic-band ratio, Fisher discriminant, and K nearest neighbor (KNN) are also established. The experimental results indicate that the characteristic-band ratio method is capable of characterizing the features of the three wood lacquer samples with 1358 cm -1/1239 cm -1; further, the Raman spectral model combined with Fisher discriminant based preprocessing methods of baseline correction, smoothing, and second derivative exhibits an optimal classification accuracy of 100%. However, the accuracy of the KNN discriminant model is limited to 88.5% under the same preprocessing. Therefore, the second-derivative based Raman spectroscopy combined with the characteristic-band-Fisher-KNN method can provide a new rapid nondestructive analysis method for the accurate detection of different brands of wood lacquer, exhibiting universality and certain reference significance.

1 引言

木器漆作为微量物证常出现于室内现场,如作案工具上残留的木器漆附着物、碎尸包裹物上粘附的木器漆碎片等,通过对现场采集的木器漆物证进行同一性鉴定,能够认定或者排除作案工具,为侦查提供线索,并为揭露和证实犯罪提供科学依据。木器漆分为水性木器漆和油性木器漆两种,油性木器漆因其溶剂中含有大量挥发性有害物质(VOCs)而逐渐被弃用[1]。目前,市售木器漆多为水性木器漆,水性漆是以水作为稀释剂,以丙烯酸树脂乳液(有纯丙、苯丙等各种类型)为主要成分,以成膜助剂、消泡剂和润湿剂为辅助成分[2]。目前,针对木器漆的研究多针对在其制作工艺和性能改良方面,而在微量物证检验领域,相关的研究报道很少,如何对其开展快速、准确、无损检验,已成为物证鉴定工作者关注的重点之一。

拉曼光谱分析技术属于非弹性光散射技术,它可以实现快速、高效的样品测量,具有操作简便、测量时间短、无损分析等特点,已被广泛应用于食品安全、化工生物、医学、珠宝鉴定、环境保护等领域[3-5]。与红外光谱法相比,拉曼光谱法在油漆鉴定方面更具优势,在鉴别车辆涂漆、墙漆等方面的应用已成熟[6-7],但在木器漆领域尚无报道。

本文以拉曼图谱数据为基础,借助数学算法,建立了基于特征波段比值法、Fisher判别、K近邻(KNN)的原始图谱、基线校正(BL)和平滑图谱、一阶导数图谱和二阶导数图谱的分类模型,实现了对木器漆的准确分类,期望能快速准确地对木器漆进行鉴别。

2 实验

2.1 实验样本

采集了3个不同品牌、不同生产厂家的木器漆作为实验样本,其中晨阳(CY)样本54个,华彩士(HC)样本60个,雀尚(QS)样本50个,总计164个。其中6个样本的部分信息如表1所示,采样时采取“井”字格取样法。

表 1. 6个样本的基本信息

Table 1. Basic information of six samples of wood lacquer

NumberBrandCategoryManufacturer
CY003CYSOWater-basedmultifunctional paintCYSO
CY008CYSOWater-basedmultifunctional paintCYSO
HC004HUACAIWater-basedpaintChaomeiyaqi
HC013HUACAIWater-basedpaintChaomeiyaqi
QS001TRYKONWaterbornefurniture finishChangfeng
QS010TRYKONWaterbornefurniture finishChangfeng

查看所有表

2.2 仪器参数与设置

实验仪器为美国Thermo Fisher Scientific公司的Nicolet Almega XR显微激光拉曼光谱仪。将涂有木器漆样本的载玻片置于载物台中央,调整位置使激光束通过待测样品中心,于50倍镜头下进行拉曼光谱的测定。光谱测定时的仪器参数如下:测试条件为室温,相对湿度为34%,拉曼光谱波长设定为780nm,采用1800 line/mm光栅分光,波长能量为2.0 mW,扫描时间为8 s,曝光次数4,电荷耦合器件(CCD)探测器接收拉曼信号,针孔直径为300 μm,测量范围为300~3000 cm-1。在显微镜下累计采集3次,通过比较分析排除来自其他杂质的信号。

2.3 光谱预处理

拉曼光谱仪的信号会受到如下因素的干扰:CCD的发射噪声、暗电流噪声及读出噪声,激发激光的波动,样品的荧光背景、样品及其周围环境的黑体辐射[8]等。这些干扰会导致基线漂移,给后续分析造成了影响,进而影响到校正模型的建立和待测样品的预测效果。因此,对光谱采用BL、Savitzky-Golay九点平滑法(Smoothing)以及导数法(一阶导数、二阶导数)进行预处理,以达到消除噪声和其他背景干扰的目的。

2.4 判别分析模型

模式识别中的判别分析方法可以通过光谱数据对不同的样本按照某些共同的特征进行分类识别,从而发现被测样本之间的内在联系,获得决策性信息[9]。因此,判别方法是将光谱数据转化为解决实际问题所需信息的一种重要方法[10]。本文选用Fisher和KNN模型。

2.4.1 Fisher判别分析

Fisher线性判别也称线性判别式分析,是基于样本类别进行整体特征提取的一种有效方法。Fisher判别分析的思想是:将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能地放开,然后再选择合适的判别规则,将新的样品进行分类判别[11]

设共有c个类别, xji为第i类中的第j个样本特征向量,样本的类内离散度矩阵Sw可以表示为

Sw=1Ni=1ci=1Nixji-xixji-xiT,(1)

式中:x(i)为第i类样本特征向量的均值;Ni为第i类样本的样本数;N为样本总数,即 N=i=1cNi该样本的离散程度矩阵Sb

Sb=1Ni=1cNixi-x-xi-x-T,(2)

式中: x-为所有样本特征向量均值。

Fisher线性判别的准则函数定义为

J(W)=|WTSbW|WTSbW(3)

式中:W为所求投影变换后的解向量。使函数J(W)达到最大值的W即为最佳向量W*,由此可以确定线性判别函数。

2.4.2 K近邻算法

K近邻(KNN)算法采用测量不同特征值之间距离的方法进行分类,即假设已知样本集中各特征值及其类别,在输入没有类别标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,计算两数据点之间的欧几里得距离,选择前K个距离最小(特征最相似)的数据所对应的分类标签,即出现次数最多的分类,作为新数据的分类[12]。具体描述如下:以训练集X为样本的特征向量集,Y为样本的类别,T为一个特征空间,根据给定的距离度量,在训练集X的特征空间T中找出与x最邻近的K个点,将包含这K个点的x的邻域记作NK(x),在NK(x)中根据分类决策规则(如多数表决)决定x的类别y,其表达式为

y=argmaxxiNK(x)I(yi=cj),i=1,2,3,,N, j=1,2,3,K,(4)

式中:xi为实例的特征向量;yiY{c1,c2,…,ck}为实例的类别;I(·)为指示函数,即当yi=cj时,I为1,否则I为0。

2.5 特征波段比值模型

特征波段比值法就是在已预处理过的光谱中提取反映各样本特征信息的波段,通过其相互比值来反映各样本的差异,并以特征波段的比值为类间距离作图分类[13],具有简单、易操作等优点。

3 结果与讨论

3.1 数据预处理

虽然拉曼光谱的扫描范围比较广,包含的信息量多,但光谱中存在较严重的噪声,因此,全谱范围建模方法在避免信息丢失的同时,也将不可避免地受到其他因素和噪声的干扰[14]。选择合适的光谱区域进行后续分析,可以提高模型的效果和稳定性。对木器漆拉曼光谱进行综合分析后可知,木器漆的信息主要集中出现在500~1700 cm-1,因此本研究选择500~1700 cm-1波段谱图进行木器漆信息的考察。

为了消除噪声和基线干扰因素,对样品数据分别进行BL、九点平滑法、一阶导数以及二阶倒数处理后再进行建模分析,考察预处理方法对模型预测准确率的影响。CY003样品的拉曼谱图如图1所示,其中,图1(a)为自动BL后的图谱,图1(b)为九点平滑图谱,图1(c)为一阶导数图谱,图1(d)为二阶导数图谱。

图 1. CY003样品拉曼光谱图的预处理结果。(a) BL;(b)九点平滑法;(c)一阶导数;(d)二阶导数

Fig. 1. Preprocessing results of Raman spectra of CY003 samples. (a) BL; (b) nine-point smoothing; (c) first derivative; (d) second derivative

下载图片 查看所有图片

3.2 特征值分析

图1(a)可知:该样品在997,1160,1239 cm-1等7个峰处出现了较明显的特征吸收,其中1160,1283,1358 cm-1这3个特征峰均与聚酯C=O双键相关。取BL图谱中特征拉曼位移频率为1160,1283,1358 cm-1的3个特征峰值的强度作为鉴别不同种类木器漆的依据,以1239 cm-1处的特征峰值强度为基准,分别用另外3组特征峰值强度与其相除得到3列新数据:1160 cm-1/1239 cm-1、1283 cm-1/1239 cm-1、1358 cm-1/1239 cm-1。然后,以1358 cm-1/1239 cm-1为纵轴,以1283 cm-1/1239 cm-1为横轴作二维散点图,得到木器漆品牌的分类图,如图2所示。

图2可知:晨阳品牌木器漆样品的分布均高于Y=1.44;而华彩士、雀尚两品牌木器漆均分布在B<1.45的范围内;晨阳品牌与华彩士、雀尚两品牌区分显著,但华彩士、雀尚两品牌木器漆有样本混杂,区分效果一般。

此外,分别以A=1283 cm-1/1239 cm-1B=1358 cm-1/1239 cm-1C=1160 cm-1/1239 cm-1作为坐标轴作出三维散点图,但区分度与二维图类似,木器漆样品的聚集分类情况主要取决于1358 cm-1/1239 cm-1的大小。木器漆为混合物,其拉曼光谱的主要差异是由丙烯酸树脂聚合物的不同导致的,B=1358 cm-1/1239 cm-1表示的是C=O相对不饱和度的大小,因此,利用拉曼光谱提取木器漆的信息来鉴别不同品牌木器漆是可行的。

图 2. 根据特征波段比值法获得的3个木器漆品牌样本分类图

Fig. 2. Classification of three brands of woodlacquer samples obtained by characteristic-band ratio method

下载图片 查看所有图片

3.3 Fisher判别分析

采用主成分分析法对拉曼数据降维后,再借助Fisher判别构建模型,比较了基础处理(九点平滑法和BL)、导数处理以及不同处理方法组合对模型判别率的影响,得到了各模型的分类结果,如表2所示。

表 2. 不同预处理方法的判别结果

Table 2. Discriminant results of different preprocessing methods

IndexOriginal spectrumBL+SmoothingBL+Smoothing+1st derivativeBL+Smoothing+2nd derivative
Overall accuracy /%68.079.896.0100
Number of errors553570
Cross validation rate /%65.169.494.1100

查看所有表

表2可知:直接对原始谱图进行判别,正确率仅为68.0%,交叉验证率仅为65.1%,这是因为原始光谱受到了噪声的干扰,噪声掩盖了原始信息;与原始光谱相比,经过预处理的光谱判别率均有显著提升,采用BL结合九点平滑法处理后,正确率达到79.8%,交叉验证率为69.4%,表明这种预处理方法能较好地降低噪声,提高信噪比。对光谱求导能消除基线漂移和其他背景的干扰,强化特征谱带,克服谱带重叠[15]。采用Fisher判别模型结合BL、九点平滑法以及一阶导数方法的预处理可以实现96.0%的正确率,交叉验证率也达到了94.1%;而将BL、平滑以及二阶导数方法相结合的预处理后的正确率能达到100%,误判数为0。相比于一阶光谱,二阶导数光谱能呈现出许多原始谱图中被掩盖的谱峰的斜率变化特征,将样本谱图间的差异更为明显地表示出来。综上所述,BL、平滑以及二阶导数方法预处理分类效果最为理想,对其进行进一步分析,可以得到判别函数摘要表,如表3所示。

表 3. Fisher函数判别摘要表

Table 3. Summary of Fisher-function discriminant

FunctionEigen valueCumulative varianceRegular correlationTest functionWilks’ LambdaSignificance
1113.87190.10.9961 and 20.0010
212.4551000.96210.0740.041

查看所有表

相关性表明了不同分组与各个函数之间的相关性。表3中函数1与函数2的相关性均大于0.9,这表明不同的分组在两函数上的相关性极强。两函数的累计方差贡献率达了100%,很好地解释了样本的基本信息。Wilks' Lambda是组内平方和与总平方和之比。显著性值越小,说明某个量对模型的影响越显著。分别选择函数1和函数2作为判别函数,构建判别分类模型,得到了3个品牌木器漆样本的判别分布图,如图3所示。

图 3. 3个品牌木器漆样本在函数1和函数2上建立的判别分布图

Fig. 3. Discriminant distribution of three brands of woodlacquer samples obtained by functions 1 and 2

下载图片 查看所有图片

图3可知,3种类型的样本均实现了较为明显的区分,其中,晨阳木器漆样本与雀尚木器漆样本在函数1判别轴上区分明显,华彩士木器漆样本与雀尚木器漆样本在函数2判别轴上实现了理想区分。

3.4 KNN判别分析

根据欧几里得距离,选取K值为1,建立分类模型(训练集与保持集中样本数量之比为3∶1),以Fisher判别效果较好的基础预处理结合一阶导数或二阶导数预处理后的光谱数据为基础,建立KNN模型对各样本进行分类,得到了KNN模型下各样本的分类结果与Fisher判别对比表,如表4所示。

表 4. 两组模型下各样本的分类结果

Table 4. Classification results of samples for two models

Spectral typeOverall accuracy /%Cross validationrate /%
FisherKNN
BL+Smoothing+1st derivative9679.2100
BL+Smoothing+2nd derivative10088.5100

查看所有表

表4可知:采用基础加二阶导数预处理光谱构建的判别模型的准确率最高,这是因为二阶导数光谱能呈现出许多原始谱图中被掩盖的谱峰的斜率变化特征[16],将样本谱图间的差异更明显地表示了出来;相比较Fisher模型,KNN模型的分类准确率均较低,这可能是因为样本不均,当样本不平衡时大容量样本会影响系统归类,从而导致误判。实验中,华彩士木器漆样本最多,有60个,而雀尚木器漆样本只有50个,这使得其误判概率增大。

综上所述,在木器漆拉曼光谱的分析中,特征波段比值法可以有效地将晨阳与其他品牌木器漆区分开来,但华彩士与雀尚品牌木器漆的区分效果不理想。为了更有效地对木器漆进行分类,需建立判别模型,分别采用BL、九点平滑法以及导数预处理光谱,结果表明,采用BL、平滑加二阶导数的预处理方法,可在最大程度减小噪声及基线信息等的干扰;对该预处理组合同样建立KNN模型,模型精度稍低于Fisher模型,能实现初步区分。可见, 基础预处理加二阶导数对拉曼图谱进行预处理,然后结合Fisher判别,可以实现对木器漆油漆的快速、准确鉴别。

4 结论

利用拉曼原始图谱及其BL和九点平滑法、一阶导数、二阶导数光谱预处理与特征波段比值法、Fisher判别和KNN分析对木器漆进行了识别与分类。拉曼特征波段比值法能在一定程度上区分木器漆,但若要实现精准分类就需建立判别模型。实测光谱中存在大量不相关的信息和噪声,采用BL、九点平滑法加二阶导数的预处理方法可以最大限度地弱化噪声区间和干扰区间的权重,构建的模型的分类效果更好,结合Fisher判别分析的准确率可达100%,可有效开展对木器漆的区分鉴别。另外,KNN的分类模型具有无法映射出个别样本在某些特征空间中差异性的不足之处,数据样本不均衡会直接影响分类效果。在本实验中,不同种类的样本在数量上未达到均衡,导致KNN分类效果稍逊于Fisher判别。本实验方法可以为其他微量物证的分类鉴定提供一种新思路,借助判别分析法可以避免传统鉴定方法中主观判断的干扰臆断,从而实现准确无误的鉴别。

参考文献

[1] 胡隆, 苏佳琦, 林兴, 等. 蓖麻油基UV/空气双重固化水性聚氨酯木器漆的制备及性能研究[J]. 表面技术, 2019, 48(3): 219-227.

    Hu L, Su J Q, Lin X, et al. Synthesis and properties of castor oil-based waterborne polyurethane wood coating cured through UV/air dual process[J]. Surface Technology, 2019, 48(3): 219-227.

[2] 黄丽, 梁卫辉, 秦孟昊. 温度对木器漆甲醛与可挥发性有机化合物(VOCs)散发的影响[J]. 建筑科学, 2018, 34(8): 71-76, 88.

    Huang L, Liang W H, Qin M H. Effect of temperature on formaldehyde and volatile organic compound emissions from a wood lacquer[J]. Building Science, 2018, 34(8): 71-76, 88.

[3] 朱磊磊, 冯爱明, 金尚忠, 等. 拉曼光谱检测中荧光抑制方法及其应用分析[J]. 激光与光电子学进展, 2018, 55(9): 090005.

    Zhu L L, Feng A M, Jin S Z, et al. Fluorescence suppression methods in Raman spectroscopy detection and their application analysis[J]. Laser & Optoelectronics Progress, 2018, 55(9): 090005.

[4] 郑家文, 杨唐文. 基于拉曼光谱特征的生物组织识别方法[J]. 激光与光电子学进展, 2017, 54(5): 053001.

    Zheng J W, Yang T W. Classification method of biological tissues based on Raman spectrum features[J]. Laser & Optoelectronics Progress, 2017, 54(5): 053001.

[5] Gao F, Xu L Z, Zhang Y J, et al. Analytical Raman spectroscopic study for discriminant analysis of different animal-derived feedstuff: understanding the high correlation between Raman spectroscopy and lipid characteristics[J]. Food Chemistry, 2018, 240: 989-996.

[6] 余静, 王琳琦, 王继芬, 等. 拉曼光谱技术在涂料鉴定中的应用进展[J]. 现代仪器, 2012, 18(3): 21-23.

    Yu J, Wang L Q, Wang J F, et al. The research and applications of Raman spectroscopy in the identification of paints[J]. Modern Instruments, 2012, 18(3): 21-23.

[7] 许中石, 陈东杰, 吕弘儒, 等. 拉曼光谱在微量物证鉴定中的应用[J]. 山东化工, 2016, 45(9): 70-72.

    Xu Z S, Chen D J, Lü H R, et al. Raman spectra: recent developments to revolutionize trace evidence[J]. Shandong Chemical Industry, 2016, 45(9): 70-72.

[8] Saito R, Tatsumi Y, Huang S, et al. Raman spectroscopy of transition metal dichalcogenides[J]. Journal of Physics: Condensed Matter, 2016, 28(35): 353002.

[9] Li H D, Xu Q S, Liang Y Z. LibPLS: an integrated library for partial least squares regression and linear discriminant analysis[J]. Chemometrics and Intelligent Laboratory Systems, 2018, 176: 34-43.

[10] 李夏, 黄梅珍, 宋彪, 等. 拉曼光谱结合多变量统计方法在无损区分寿山石和老挝石中的应用[J]. 光学学报, 2016, 36(12): 1230001.

    Li X, Huang M Z, Song B, et al. Nondestructive discrimination of Shoushan Stone and Laos Stone based on Raman spectroscopy and multivariate methods[J]. Acta Optica Sinica, 2016, 36(12): 1230001.

[11] Li F, Wang J X, Chyu M K, et al. Weak fault diagnosis of rotating machinery based on feature reduction with supervised orthogonal local fisher discriminant analysis[J]. Neurocomputing, 2015, 168: 505-519.

[12] Deng Z Y, Zhu X S, Cheng D B, et al. Efficient kNN classification algorithm for big data[J]. Neurocomputing, 2016, 195: 143-148.

[13] 黎远鹏. 基于拉曼光谱法的食用油定性鉴别与掺伪含量检测研究[D]. 广州: 暨南大学, 2016.

    Li YP. Identification of edible oil and detection of its adulteration via Raman spectroscopy[D]. Guangzhou: Jinan University, 2016.

[14] 李志刚, 彭思龙, 杨妮, 等. 基于导数光谱融合建模的红外光谱定量分析方法[J]. 分析化学, 2016, 44(3): 437-443.

    Li Z G, Peng S L, Yang N, et al. Quantitative analysis method of infrared spectra based on derivative spectra fusion modeling[J]. Chinese Journal of Analytical Chemistry, 2016, 44(3): 437-443.

[15] Liu X B, Zhang Z M, Liang Y Z, et al. Baseline correction of high resolution spectral profile data based on exponential smoothing[J]. Chemometrics and Intelligent Laboratory Systems, 2014, 139: 97-108.

[16] 王静敏, 张景超, 张尊举. 二阶导数光谱法快速测定硝酸盐氮和亚硝酸盐氮[J]. 光谱学与光谱分析, 2019, 39(1): 161-165.

    Wang J M, Zhang J C, Zhang Z J. Rapid determination of nitrate nitrogen and nitrite nitrogen by second derivative spectrophotometry[J]. Spectroscopy and Spectral Analysis, 2019, 39(1): 161-165.

何亚, 王继芬. 基于特征波段-Fisher-K近邻的木器漆拉曼光谱的快速无损鉴别[J]. 激光与光电子学进展, 2020, 57(1): 013001. Ya He, Jifen Wang. Rapid Nondestructive Identification of Wood Lacquer Using Raman Spectroscopy Based on Characteristic-Band-Fisher-K Nearest Neighbor[J]. Laser & Optoelectronics Progress, 2020, 57(1): 013001.

本文已被 11 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!