光学学报, 2020, 40 (3): 0330002, 网络出版: 2020-02-10   

基于光谱相似性分析的水体致病菌种类识别方法 下载: 1008次

Recognition of Waterborne Pathogens Based on Spectral Similarity Analysis
作者单位
1 中国科学院安徽光学精密机械研究所中国科学院环境光学与技术重点实验室, 安徽 合肥 230031
2 中国科学技术大学, 安徽 合肥 230026
3 安徽大学, 安徽 合肥 230601
4 合肥学院, 安徽 合肥 230601
摘要
水体致病菌的快速识别和检测对于水质安全预警具有重要意义。以大肠埃希菌、肺炎克雷伯氏菌、金黄色葡萄球菌和鼠伤寒沙门氏菌为研究对象,对其多波长透射光谱进行测量,提出了一种基于相似学原理、余弦相似度、皮尔逊相关系数和联合相似度算法的水体细菌种类识别方法。结果表明:不同的相似度算法对不同细菌的光谱差异性的敏感度不同,相似学原理对肺炎克雷伯氏菌的识别率最高,可达98.2%;余弦相似度和皮尔逊相关系数对金黄色葡萄球菌的识别率均为100%;联合相似度算法可实现不同算法的优势互补,有效提高识别结果的可靠性与稳定性,对低浓度肺炎克雷伯氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌和大肠埃希菌的识别率分别为98.2%、100%、94.1%和91.4%,对较高浓度的上述4种细菌的识别率分别为100%、100%、100%和96%。
Abstract
Rapid recognition and detection of waterborne pathogens is of considerable significance for determining water quality and ensuring its safety. In this study, the multiwavelength transmission spectra of Escherichia coli, Klebsiella pneumoniae, Staphylococcus aureus, and Salmonella typhimurium are measured. Further, a recognition method of bacterial species in water bodies is proposed based on the principle of similarity, cosine similarity, Pearson's correlation coefficient, and joint similarity algorithm. It is found that different similarity algorithms have different sensitivities to the spectral difference of different bacteria. The principle of similarity shows the highest recognition rate for Klebsiella pneumoniae, reaching 98.2%; remarkably, the recognition rate of cosine similarity and Pearson's correlation coefficient for Staphylococcus aureus are 100%. Joint similarity algorithm can realize the complementary advantages of different algorithms and effectively improve the reliability and stability of the recognition results. The recognition rates of joint similarity algorithm for low concentrations of Klebsiella pneumoniae, Staphylococcus aureus, Salmonella typhimurium, and Escherichia coli are 98.2%, 100%, 94.1%, and 91.4%, respectively, whereas the recognition rates for higher concentrations are 100%, 100%, 100%, and 96%, respectively.

1 引言

水体微生物污染易引起大规模的传染病爆发,快速识别水体致病菌对于水质安全防控预警和饮用水安全保障来说至关重要。传统的识别方法,如菌体形态学观察法、聚合酶链式反应法、蛋白芯片法等,虽然具有非常高的灵敏度和特异性,但难以满足快速、实时、在线监测的需求。

光谱技术具有简便、快速、非接触、无需试剂、抗干扰和无污染等特点,已成为细菌种类识别检测的新趋势[1-3]。多波长透射光谱包含了光与物质相互作用产生的反映物质化学特征信息的吸收光谱,以及反映物质结构、大小和形状等光学特征信息的散射光谱,能为研究人员提供一组独立的、互补的,以及可用于识别、表征和量化的样本数据。多波长透射光谱技术以其测量简单、无需试剂的特点而在快速检测水体致病菌方面具有很大的发展潜力[4]。文献[ 5-7]研究了红细胞和细菌的多波长透射光谱,并将其用于估计细胞的数量及化学成分;Alupoaei等[8-10]构建了紫外-可见(UV-Vis)光谱解析模型,根据该模型获得了细菌的宏观结构和内部结构尺寸以及化学组分信息,尤其是核酸和显色氨基酸的浓度信息;胡玉霞等[11-12]对大肠埃希菌的多波长透射光谱进行了解析,获得了其在不同生长阶段的结构特征和化学组分特征信息的动态变化;甘婷婷等[13]利用光谱去卷积的方法分析了不同细菌的散射光谱和吸收光谱的差异。现阶段,国内外关于细菌多波长透射光谱的研究主要集中于解析细菌的结构大小和化学组分上,仅有Smith等[4,14]根据初始训练集的光谱创建了识别模型,结合多元统计技术对特征谱带差异较为明显的几种细菌(临床分离的金黄色葡萄球菌、大肠埃希菌、肺炎链球菌、铜绿假单胞菌等)进行了识别,灵敏度为87.7%~94.6%;王久悦等[15]将支持向量机的多向量分析方法与多波长透射光谱相结合,研究了细菌的快速分类鉴别。这些研究以光谱解析[16]、获取细菌的各参数信息为主,而关于不同细菌的识别研究还有待完善。

本文在获取4种常见水体致病菌的多波长透射光谱的基础上,采用3种度量光谱相似性的相似度算法对不同细菌的光谱进行了识别,结果表明,联合相似度算法比单一相似度算法的准确度和稳定性更高,可以有效识别、鉴定不同细菌的光谱,为水体致病菌的快速检测提供了一种简单可靠的方法。

2 材料与方法

2.1 材料

供试的4种水体常见致病性细菌菌种为肺炎克雷伯氏菌(Klebsiella pneumoniae)、大肠埃希菌(Escherichia coli)、鼠伤寒沙门氏菌(Salmonella typhimurium)和金黄色葡萄球菌(Staphylococcus aureus),均购于中国工业微生物菌种保藏管理中心(CICC);培养基由牛肉膏、氯化钠、蛋白胨和去离子水配制而成,其中牛肉膏、氯化钠和蛋白胨的质量分数分别为0.3%、0.5%和0.5%,各组成分购于国药集团化学试剂有限公司。其他试剂包括氢氧化钠(用于调节pH值)、去离子水、无水乙醇。

2.2 仪器

实验所用仪器如下:UV2550型紫外可见分光光度计,采样间隔为1 nm,光谱测量范围为200~900 nm,分辨率为0.1 nm,采样速度为中速(5 nm/s),样品池长度为10 mm;H-1650R型高速冷冻离心机,设置转速为12000 r/min,离心处理时间为5 min;YX-280D型压力蒸汽灭菌锅;SW-CJ-ID型超净工作台;MQP-B3G型组合式光照振荡培养箱。

2.3 样品制备与光谱测量

以下操作均在无菌环境中进行。

细菌扩大培养:用接种环挑取斜面固体培养基中的一个菌落,将其接种到装有50 mL牛肉膏蛋白胨液体培养基的250 mL锥形瓶中扩增培养,贴上标签,注明时间、细菌种类;将锥形瓶放入恒温振荡培养箱中培养,振荡速度为120 r/min。大肠埃希菌和金黄色葡萄球菌的培养温度均为37 ℃;肺炎克雷伯氏菌和鼠伤寒沙门氏菌的培养温度均为31 ℃。培养时间为12~18 h。在细菌生长繁殖的对数期,细菌的大小、形态、生理活性等都较为典型,适合对不同的细菌进行分析与鉴定。

细菌悬浮液的制备:吸取5 mL细菌培养液于离心管中,在12000 r/min转速下离心处理5 min,倒出上清液,向离心管中加入10 mL去离子水进行洗涤,再次以12000 r/min的速度离心处理5 min,倒出上清液,用此方法对细菌洗涤3遍,目的是消除培养基对细菌多波长透射光谱测量的影响。最后一次清洗后,加入10 mL去离子水制成细菌悬浮液。通过稀释,得到一系列浓度的细菌悬浮液,用于光谱测量。

光谱测量:以去离子水为参比,将制备的细菌悬浮液放入紫外可见分光光度计中进行光谱的测定。实验参数如下:光谱测量波段为200~900 nm,采样间隔为1 nm,扫描速度为中速(5 nm/s)。

2.4 光谱相似性分析方法

相似学原理[17]:两变量间的相似性由变量中各个要素的作用叠加而成。与余弦相似度、皮尔逊相关系数不同,相似学原理考虑了向量中每一个变量对整个向量的影响。假设两条光谱曲线在某个取样点λi处对应的光密度值分别为xiyi,那么在λi处的相似值可以表示为

g(i)=1-xi-yixi+yi(1)

光密度值是各有效组分在各个取样点对光的吸收和散射作用的叠加。为简化问题,假设每个取样点对整个光谱曲线的作用加权因子都相等,设有n个取样点,加权因子为1/n,则两条光谱的相似度指数可表示为

S1=1ni=1ng(i)=1-1ni=1nxi-yixi+yi(2)

S1的值越接近1,说明两条光谱越相似,越接近0,说明两条光谱差异越大。

余弦相似度:通过计算两条光谱的光密度值向量的夹角余弦值来量化不同细菌之间的光谱的相似性。这种相似学算法的优越性在于对向量进行了归一化处理,避免了向量个体间因度量标准不统一而产生的计算偏差。参考光谱和待测光谱的光密度值分别为

x=(x1,x2,x3,,xi),(3)y=(y1,y2,y3,,yi),(4)

式中:下标代表第i个波长点的位置。余弦相似度可表示为

S2=cosθ=xiyi|xi|yi|=x1y1+x2y2++xiyix12+x22++xi2y12+y22++yi2(5)

S2值越接近1,说明两条光谱的相似性越大,越接近0,说明两条光谱的相似性越小。

皮尔逊相关系数(S3):用于度量两个变量之间的相关程度,其值为-1~1,用来量化两条光谱之间的相关程度。皮尔逊相关系数的优势在于对变量进行了均值化处理,减少了变量个体的数值差异对变量间相似度的影响。皮尔逊相关系数定义为两个变量的协方差和标准差的商,可表示为

S3=ρx,y=cov(x,y)σxσy=i=1n(xi-x-)(yi-y-)i=1n(xi-x-)2i=1n(yi-y-)2,(6)

式中:ρx,y为两条光谱的皮尔逊相关系数;cov(x,y)为两光谱见的协方差;σx为光谱x的标准差;σy为光谱y的标准差; x-为光谱x的平均值; y-为光谱y的平均值。

S3的值为0,说明两个变量之间没有关系,S3的值越接近1,说明两个变量成正相关,即两条光谱越相似。

根据不同细菌属种间的光谱差异性可以对细菌进行识别。选取4种细菌的典型光谱作为参考光谱,准备4种细菌的随机样本光谱若干,逐一计算样品光谱与参考光谱的3种相似度指数,形成相似度矩阵Sij(i=1,2,3;j=1,2,…,M,M为参考光谱数)。为避免误判,Sij必须大于0.9;选取3个最大的相似度指数Sijmax进行细菌种类匹配,当至少2个相似度指数指向同一种细菌时,判定识别为此种细菌。同时,记录每种相似度算法对不同细菌的识别率。

3 分析与讨论

3.1 光谱数据的预处理

对于同一种细菌来说,其浓度越大,对光的吸收越强,即对应的光密度值越大。为了降低细菌浓度对光谱识别分析的影响,对光谱数据进行总和归一化处理[18],公式为

τ=τii=200i=900τi,(7)

式中:τi为原光谱数据中第i个波长点对应的光密度值;τ为经总和归一化后的光谱数据。

不同浓度下4种细菌的多波长透射光谱,以及经过总和归一化之后的光谱如图1~4所示。

图1~4可以看出:由于细菌在宏观上的结构、大小和化学成分类似,归一化处理后4种细菌的多波长透射光谱总体较为相似,但在微观上仍有差别,如杆状菌、球状菌的形状差异,以及不同细菌的核酸和蛋白含量的差异等,体现在光谱的截距、不同波段光谱的倾斜程度,以及波峰位置的差异等方面。

图 1. 不同浓度大肠埃希菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图

Fig. 1. Spectra of Escherichia coli with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum

下载图片 查看所有图片

图 2. 不同浓度肺炎克雷伯氏菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图

Fig. 2. Spectra of of Klebsiella pneumoniae with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum

下载图片 查看所有图片

图 3. 不同浓度金黄色葡萄球菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图

Fig. 3. Spectra of Staphylococcus aureus with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum

下载图片 查看所有图片

图 4. 不同浓度鼠伤寒沙门氏菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图

Fig. 4. Spectra of Salmonella typhimurium with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum

下载图片 查看所有图片

特征波段的光谱差异性为不同细菌的识别提供了可能。针对肺炎克雷伯氏菌、大肠埃希菌、鼠伤寒沙门氏菌和金黄色葡萄球菌,本研究中选取它们的归一化光谱作为识别参考光谱。

3.2 不同相似性方法的识别结果

实验中培养了大肠埃希菌、肺炎克雷伯氏菌、金黄色葡萄球菌和鼠伤寒沙门氏菌,并得到多个随机样本,将200 nm处光密度值小于1.5 arb. units的样本作为低浓度样本,光密度值为1.5~3.5 arb. units的样本作为高浓度样本。所有样本均采用盲分析法,3种相似度算法的识别结果如表1表2所示。

表 1. 4种致病菌在200~900 nm波段的相似度识别结果(低浓度)

Table 1. Results of similarity recognition of four pathogenic bacteria in band of 200-900 nm (low concentration)

BacteriaSample quantityS1 /%S2 /%S3 /%
Klebsiella pneumoniae5598.294.593.6
Staphylococcus aureus10493.3100100
Salmonella typhimurium5178.494.194.1
Escherichia coli7091.490.092.9

查看所有表

表 2. 4种致病菌在200~900 nm波段的相似度识别结果(高浓度)

Table 2. Results of similarity recognition of four pathogenic bacteria in band of 200-900 nm (high concentration)

BacteriaSample quantityS1 /%S2 /%S3 /%
Klebsiella pneumoniae2910096.693.1
Staphylococcus aureus35100100100
Salmonella typhimurium2476100100
Escherichia coli257696.096.0

查看所有表

表1中可以看出:低浓度肺炎克雷伯氏菌的3种相似度指数(S1S2S3)的识别率分别为98.2%、94.5%和93.6%,S1对肺炎克雷伯氏菌光谱间的差异更敏感,识别率最高;低浓度金黄色葡萄球菌的3种相似度指数(S1S2S3)的识别率分别为93.3%、100% 和100%,S2S3对金黄色葡萄球菌光谱间的差异更敏感,识别率均为100%;低浓度鼠伤寒沙门氏菌的3种相似度指数(S1S2S3)的识别率分别为78.4%、94.1%和94.1%,S2S3对鼠伤寒沙门氏菌光谱间的差异更敏感,识别率达到100%;低浓度大肠埃希菌的3种相似度指数(S1S2S3)的识别率分别为91.4%、90.0%和92.9%,S3对大肠埃希菌光谱间的差异更敏感,识别率最高。结果表明,不同相似度算法对不同细菌光谱的敏感性不同,如果仅采取某种相似度算法进行识别,结果将会产生较大误差。

3.3 联合相似度方法的识别结果

联合3种相似度指数对不同的细菌进行识别,当至少两种相似度指数的最大值指向同一种细菌时,则判定识别为此种细菌,否则认为识别无效。4种菌株的联合相似度总体识别率S,以及3种相似度指数各自识别率与总体识别率之差(敏感度s1s2s3)如表3表4所示。

表 3. 联合相似度与单一相似度的识别结果对比(低浓度)

Table 3. Comparison of recognition results of joint similarity and single similarity (low concentration)%

BacteriaSs1s2s3
Klebsiella pneumoniae98.20-3.7-4.6
Staphylococcus aureus100-6.300
Salmonella typhimurium94.1-15.700
Escherichia coli91.40-1.41.5

查看所有表

表 4. 联合相似度与单一相似度的识别结果对比(高浓度)

Table 4. Comparison of recognition results of joint similarity and single similarity (high concentration)%

BacteriaSs1s2s3
Klebsiella pneumoniae1000-3.4-6.9
Staphylococcus aureus100000
Salmonella typhimurium100-2400
Escherichia coli96-2000

查看所有表

表3表4可以看出:低浓度肺炎克雷伯氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌和大肠埃希菌的联合相似度总体识别率分别为98.2%、100%、94.1%和91.4%;高浓度肺炎克雷伯氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌和大肠埃希菌的联合相似度识别率分别为100%、100%、100%和96%。正的敏感度代表单一相似度算法比联合相似度算法准确度高,负的敏感度代表单一相似度算法比联合相似度算法的准确度低。可以看出,在对不同细菌进行识别时,相比于单一相似度算法,联合相似度算法可以提高识别结果的稳定性和可靠性。

4 结论

基于多波长透射光谱,利用不同水体致病菌的光谱差异性,结合多种相似度指数,对4种细菌的随机盲样本进行识别。结果表明:不同相似度指数对细菌光谱差异的敏感性不同,联合多种相似度指数对细菌进行识别可以提高结果的稳定性和可靠性。该方法对低浓度肺炎克雷伯氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌和大肠埃希菌的总体识别率分别为98.2%、100%、94.1%和91.4%,当细菌浓度较高时,即光密度值为1.5~3.5 arb. units,识别率分别达到100%、100%、100%和96%。本研究揭示了不同细菌的光谱相似性分析在细菌光谱识别方面的潜力,研究结果为快速识别、实时监测水体致病菌提供了参考。

参考文献

[1] 龚正君. 水体中有害细菌快速检测的表面增强红外光谱方法研究[J]. 学术动态, 2014( 2): 9- 12.

    Gong ZJ. Study on rapid detection of harmful bacteria in water by surface enhanced infrared spectroscopy[J]. Academic Trends, 2014( 2): 9- 12.

[2] Mattley Y D. Garcia-Rubio L H. Multiwavelength spectroscopy for the detection, identification, and quantification cells[J]. Proceedings of SPIE, 2001, 4206: 64-71.

[3] Mourant J R, Canpolat M, Brocker C, et al. Light scattering from cells: the contribution of the nucleus and the effects of proliferative status[J]. Journal of Biomedical Optics, 2000, 5(2): 131-137.

[4] Smith J M, Huffman D E, Acosta D, et al. Reagent-free bacterial identification using multivariate analysis of transmission spectra[J]. Journal of Biomedical Optics, 2012, 17(10): 107002.

[5] Mattley Y, Leparc G, Potter R, et al. Light scattering and absorption model for the quantitative interpretation of human blood platelet spectral data[J]. Photochemistry and Photobiology, 2007, 71(5): 610-619.

[6] Serebrennikova Y M, Roth A, Huffman D E, et al. Multiwavelength transmission spectroscopy revisited for the characterization of the protein and polystyrene nanoparticle interactions[J]. Applied Spectroscopy, 2013, 67(1): 86-92.

[7] Serebrennikova Y M, Huffman D E. Garcia-Rubio L H. Characterization of red blood cells with multiwavelength transmission spectroscopy[J]. BioMed Research International, 2015, 2015: 382641.

[8] Alupoaei C E. García-Rubio L H. An interpretation model for the UV-VIS spectra of microorganisms[J]. Chemical Engineering Communications, 2005, 192(2): 198-218.

[9] Alupoaei C E, Olivares J A. García-Rubio L H. Quantitative spectroscopy analysis of prokaryotic cells: vegetative cells and spores[J]. Biosensors and Bioelectronics, 2004, 19(8): 893-903.

[10] Alupoaei C E. García-Rubio L H. Growth behavior of microorganisms using UV-vis spectroscopy: Escherichia coli[J]. Biotechnology and Bioengineering, 2004, 86(2): 163-167.

[11] 胡玉霞, 赵南京, 甘婷婷, 等. 基于多波长透射光谱的水体细菌生长阶段特征参数反演研究[J]. 中国激光, 2018, 45(2): 0207023.

    Hu Y X, Zhao N J, Gan T T, et al. Growth stages characteristic parameters of bacteria in water based on multi-wavelength transmission spectra[J]. Chinese Journal of Lasers, 2018, 45(2): 0207023.

[12] Hu Y X, Zhao N J, Gan T T, et al. Analytic method on characteristic parameters of bacteria in water by multiwavelength transmission spectroscopy[J]. Journal of Spectroscopy, 2017, 2017: 4039048.

[13] 甘婷婷, 赵南京, 胡玉霞, 等. 水体细菌微生物多波长透射光谱特征分析研究[J]. 光谱学与光谱分析, 2018, 38(5): 1610-1619.

    Gan T T, Zhao N J, Hu Y X, et al. Spectral features analysis of multi-wavelength transmission spectra of pathogenic bacterial microbes in water[J]. Spectroscopy and Spectral Analysis, 2018, 38(5): 1610-1619.

[14] Huffman D E, Serebrennikova Y M, Smith J M, et al. Reagentless bacterial identification using a combination of multiwavelength transmission and angular scattering spectroscopy[J]. Journal of Spectroscopy, 2016, 2016: 5436821.

[15] 王久悦, 赵南京, 段静波, 等. 水体细菌微生物种类快速鉴别方法研究[J]. 光谱学与光谱分析, 2015, 35(9): 2634-2638.

    Wang J Y, Zhao N J, Duan J B, et al. Study of rapid species identification of bacteria in water[J]. Spectroscopy and Spectral Analysis, 2015, 35(9): 2634-2638.

[16] 胡玉霞, 赵南京, 甘婷婷, 等. 水体细菌微生物多波长透射光谱解析模型[J]. 光学学报, 2017, 37(8): 0830001.

    Hu Y X, Zhao N J, Gan T T, et al. An analytical model for multi-wavelength transmittance spectra of bacteria in water[J]. Acta Optica Sinica, 2017, 37(8): 0830001.

[17] 孟庆华, 王微波, 胡育筑. 紫外光谱相似度及其在中药注射液质量控制中的应用[J]. 中国中药杂志, 2007, 32(3): 206-210.

    Meng Q H, Wang W B, Hu Y Z. Application of UV similarity in quality control of Chinese medical injection[J]. China Journal of Chinese Materia Medica, 2007, 32(3): 206-210.

[18] 胡玉霞, 赵南京, 甘婷婷, 等. 水体细菌微生物多波长透射光谱定量分析归一化方法研究[J]. 光学学报, 2018, 38(4): 0430001.

    Hu Y X, Zhao N J, Gan T T, et al. Normalization of quantitative analysis for bacteria multi-wavelength transmission spectroscopy in water[J]. Acta Optica Sinica, 2018, 38(4): 0430001.

冯春, 赵南京, 殷高方, 甘婷婷, 陈敏, 杨金强, 刘建国, 刘文清. 基于光谱相似性分析的水体致病菌种类识别方法[J]. 光学学报, 2020, 40(3): 0330002. Chun Feng, Nanjing Zhao, Gaofang Yin, Tingting Gan, Min Chen, Jinqiang Yang, Jianguo Liu, Wenqing Liu. Recognition of Waterborne Pathogens Based on Spectral Similarity Analysis[J]. Acta Optica Sinica, 2020, 40(3): 0330002.

本文已被 3 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!