基于光谱相似性分析的水体致病菌种类识别方法 下载: 1008次
1 引言
水体微生物污染易引起大规模的传染病爆发,快速识别水体致病菌对于水质安全防控预警和饮用水安全保障来说至关重要。传统的识别方法,如菌体形态学观察法、聚合酶链式反应法、蛋白芯片法等,虽然具有非常高的灵敏度和特异性,但难以满足快速、实时、在线监测的需求。
光谱技术具有简便、快速、非接触、无需试剂、抗干扰和无污染等特点,已成为细菌种类识别检测的新趋势[1-3]。多波长透射光谱包含了光与物质相互作用产生的反映物质化学特征信息的吸收光谱,以及反映物质结构、大小和形状等光学特征信息的散射光谱,能为研究人员提供一组独立的、互补的,以及可用于识别、表征和量化的样本数据。多波长透射光谱技术以其测量简单、无需试剂的特点而在快速检测水体致病菌方面具有很大的发展潜力[4]。文献[ 5-7]研究了红细胞和细菌的多波长透射光谱,并将其用于估计细胞的数量及化学成分;Alupoaei等[8-10]构建了紫外-可见(UV-Vis)光谱解析模型,根据该模型获得了细菌的宏观结构和内部结构尺寸以及化学组分信息,尤其是核酸和显色氨基酸的浓度信息;胡玉霞等[11-12]对大肠埃希菌的多波长透射光谱进行了解析,获得了其在不同生长阶段的结构特征和化学组分特征信息的动态变化;甘婷婷等[13]利用光谱去卷积的方法分析了不同细菌的散射光谱和吸收光谱的差异。现阶段,国内外关于细菌多波长透射光谱的研究主要集中于解析细菌的结构大小和化学组分上,仅有Smith等[4,14]根据初始训练集的光谱创建了识别模型,结合多元统计技术对特征谱带差异较为明显的几种细菌(临床分离的金黄色葡萄球菌、大肠埃希菌、肺炎链球菌、铜绿假单胞菌等)进行了识别,灵敏度为87.7%~94.6%;王久悦等[15]将支持向量机的多向量分析方法与多波长透射光谱相结合,研究了细菌的快速分类鉴别。这些研究以光谱解析[16]、获取细菌的各参数信息为主,而关于不同细菌的识别研究还有待完善。
本文在获取4种常见水体致病菌的多波长透射光谱的基础上,采用3种度量光谱相似性的相似度算法对不同细菌的光谱进行了识别,结果表明,联合相似度算法比单一相似度算法的准确度和稳定性更高,可以有效识别、鉴定不同细菌的光谱,为水体致病菌的快速检测提供了一种简单可靠的方法。
2 材料与方法
2.1 材料
供试的4种水体常见致病性细菌菌种为肺炎克雷伯氏菌(Klebsiella pneumoniae)、大肠埃希菌(Escherichia coli)、鼠伤寒沙门氏菌(Salmonella typhimurium)和金黄色葡萄球菌(Staphylococcus aureus),均购于中国工业微生物菌种保藏管理中心(CICC);培养基由牛肉膏、氯化钠、蛋白胨和去离子水配制而成,其中牛肉膏、氯化钠和蛋白胨的质量分数分别为0.3%、0.5%和0.5%,各组成分购于国药集团化学试剂有限公司。其他试剂包括氢氧化钠(用于调节pH值)、去离子水、无水乙醇。
2.2 仪器
实验所用仪器如下:UV2550型紫外可见分光光度计,采样间隔为1 nm,光谱测量范围为200~900 nm,分辨率为0.1 nm,采样速度为中速(5 nm/s),样品池长度为10 mm;H-1650R型高速冷冻离心机,设置转速为12000 r/min,离心处理时间为5 min;YX-280D型压力蒸汽灭菌锅;SW-CJ-ID型超净工作台;MQP-B3G型组合式光照振荡培养箱。
2.3 样品制备与光谱测量
以下操作均在无菌环境中进行。
细菌扩大培养:用接种环挑取斜面固体培养基中的一个菌落,将其接种到装有50 mL牛肉膏蛋白胨液体培养基的250 mL锥形瓶中扩增培养,贴上标签,注明时间、细菌种类;将锥形瓶放入恒温振荡培养箱中培养,振荡速度为120 r/min。大肠埃希菌和金黄色葡萄球菌的培养温度均为37 ℃;肺炎克雷伯氏菌和鼠伤寒沙门氏菌的培养温度均为31 ℃。培养时间为12~18 h。在细菌生长繁殖的对数期,细菌的大小、形态、生理活性等都较为典型,适合对不同的细菌进行分析与鉴定。
细菌悬浮液的制备:吸取5 mL细菌培养液于离心管中,在12000 r/min转速下离心处理5 min,倒出上清液,向离心管中加入10 mL去离子水进行洗涤,再次以12000 r/min的速度离心处理5 min,倒出上清液,用此方法对细菌洗涤3遍,目的是消除培养基对细菌多波长透射光谱测量的影响。最后一次清洗后,加入10 mL去离子水制成细菌悬浮液。通过稀释,得到一系列浓度的细菌悬浮液,用于光谱测量。
光谱测量:以去离子水为参比,将制备的细菌悬浮液放入紫外可见分光光度计中进行光谱的测定。实验参数如下:光谱测量波段为200~900 nm,采样间隔为1 nm,扫描速度为中速(5 nm/s)。
2.4 光谱相似性分析方法
相似学原理[17]:两变量间的相似性由变量中各个要素的作用叠加而成。与余弦相似度、皮尔逊相关系数不同,相似学原理考虑了向量中每一个变量对整个向量的影响。假设两条光谱曲线在某个取样点λi处对应的光密度值分别为xi和yi,那么在λi处的相似值可以表示为
光密度值是各有效组分在各个取样点对光的吸收和散射作用的叠加。为简化问题,假设每个取样点对整个光谱曲线的作用加权因子都相等,设有n个取样点,加权因子为1/n,则两条光谱的相似度指数可表示为
S1的值越接近1,说明两条光谱越相似,越接近0,说明两条光谱差异越大。
余弦相似度:通过计算两条光谱的光密度值向量的夹角余弦值来量化不同细菌之间的光谱的相似性。这种相似学算法的优越性在于对向量进行了归一化处理,避免了向量个体间因度量标准不统一而产生的计算偏差。参考光谱和待测光谱的光密度值分别为
式中:下标代表第i个波长点的位置。余弦相似度可表示为
S2值越接近1,说明两条光谱的相似性越大,越接近0,说明两条光谱的相似性越小。
皮尔逊相关系数(S3):用于度量两个变量之间的相关程度,其值为-1~1,用来量化两条光谱之间的相关程度。皮尔逊相关系数的优势在于对变量进行了均值化处理,减少了变量个体的数值差异对变量间相似度的影响。皮尔逊相关系数定义为两个变量的协方差和标准差的商,可表示为
式中:ρx,y为两条光谱的皮尔逊相关系数;cov(x,y)为两光谱见的协方差;σx为光谱x的标准差;σy为光谱y的标准差;
S3的值为0,说明两个变量之间没有关系,S3的值越接近1,说明两个变量成正相关,即两条光谱越相似。
根据不同细菌属种间的光谱差异性可以对细菌进行识别。选取4种细菌的典型光谱作为参考光谱,准备4种细菌的随机样本光谱若干,逐一计算样品光谱与参考光谱的3种相似度指数,形成相似度矩阵Sij(i=1,2,3;j=1,2,…,M,M为参考光谱数)。为避免误判,Sij必须大于0.9;选取3个最大的相似度指数Sijmax进行细菌种类匹配,当至少2个相似度指数指向同一种细菌时,判定识别为此种细菌。同时,记录每种相似度算法对不同细菌的识别率。
3 分析与讨论
3.1 光谱数据的预处理
对于同一种细菌来说,其浓度越大,对光的吸收越强,即对应的光密度值越大。为了降低细菌浓度对光谱识别分析的影响,对光谱数据进行总和归一化处理[18],公式为
式中:τi为原光谱数据中第i个波长点对应的光密度值;τ为经总和归一化后的光谱数据。
不同浓度下4种细菌的多波长透射光谱,以及经过总和归一化之后的光谱如
由
图 1. 不同浓度大肠埃希菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图
Fig. 1. Spectra of Escherichia coli with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum
图 2. 不同浓度肺炎克雷伯氏菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图
Fig. 2. Spectra of of Klebsiella pneumoniae with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum
图 3. 不同浓度金黄色葡萄球菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图
Fig. 3. Spectra of Staphylococcus aureus with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum
图 4. 不同浓度鼠伤寒沙门氏菌的光谱图。(a)多波长透射光谱图;(b)总和归一化图
Fig. 4. Spectra of Salmonella typhimurium with different concentrations. (a) Multiwavelength transmission spectra; (b) sum normalization spectrum
特征波段的光谱差异性为不同细菌的识别提供了可能。针对肺炎克雷伯氏菌、大肠埃希菌、鼠伤寒沙门氏菌和金黄色葡萄球菌,本研究中选取它们的归一化光谱作为识别参考光谱。
3.2 不同相似性方法的识别结果
实验中培养了大肠埃希菌、肺炎克雷伯氏菌、金黄色葡萄球菌和鼠伤寒沙门氏菌,并得到多个随机样本,将200 nm处光密度值小于1.5 arb. units的样本作为低浓度样本,光密度值为1.5~3.5 arb. units的样本作为高浓度样本。所有样本均采用盲分析法,3种相似度算法的识别结果如
表 1. 4种致病菌在200~900 nm波段的相似度识别结果(低浓度)
Table 1. Results of similarity recognition of four pathogenic bacteria in band of 200-900 nm (low concentration)
|
表 2. 4种致病菌在200~900 nm波段的相似度识别结果(高浓度)
Table 2. Results of similarity recognition of four pathogenic bacteria in band of 200-900 nm (high concentration)
|
从
3.3 联合相似度方法的识别结果
联合3种相似度指数对不同的细菌进行识别,当至少两种相似度指数的最大值指向同一种细菌时,则判定识别为此种细菌,否则认为识别无效。4种菌株的联合相似度总体识别率S,以及3种相似度指数各自识别率与总体识别率之差(敏感度s1、s2、s3)如
表 3. 联合相似度与单一相似度的识别结果对比(低浓度)
Table 3. Comparison of recognition results of joint similarity and single similarity (low concentration)%
|
表 4. 联合相似度与单一相似度的识别结果对比(高浓度)
Table 4. Comparison of recognition results of joint similarity and single similarity (high concentration)%
|
从
4 结论
基于多波长透射光谱,利用不同水体致病菌的光谱差异性,结合多种相似度指数,对4种细菌的随机盲样本进行识别。结果表明:不同相似度指数对细菌光谱差异的敏感性不同,联合多种相似度指数对细菌进行识别可以提高结果的稳定性和可靠性。该方法对低浓度肺炎克雷伯氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌和大肠埃希菌的总体识别率分别为98.2%、100%、94.1%和91.4%,当细菌浓度较高时,即光密度值为1.5~3.5 arb. units,识别率分别达到100%、100%、100%和96%。本研究揭示了不同细菌的光谱相似性分析在细菌光谱识别方面的潜力,研究结果为快速识别、实时监测水体致病菌提供了参考。
[1] 龚正君. 水体中有害细菌快速检测的表面增强红外光谱方法研究[J]. 学术动态, 2014( 2): 9- 12.
Gong ZJ. Study on rapid detection of harmful bacteria in water by surface enhanced infrared spectroscopy[J]. Academic Trends, 2014( 2): 9- 12.
[2] Mattley Y D. Garcia-Rubio L H. Multiwavelength spectroscopy for the detection, identification, and quantification cells[J]. Proceedings of SPIE, 2001, 4206: 64-71.
[3] Mourant J R, Canpolat M, Brocker C, et al. Light scattering from cells: the contribution of the nucleus and the effects of proliferative status[J]. Journal of Biomedical Optics, 2000, 5(2): 131-137.
[4] Smith J M, Huffman D E, Acosta D, et al. Reagent-free bacterial identification using multivariate analysis of transmission spectra[J]. Journal of Biomedical Optics, 2012, 17(10): 107002.
[5] Mattley Y, Leparc G, Potter R, et al. Light scattering and absorption model for the quantitative interpretation of human blood platelet spectral data[J]. Photochemistry and Photobiology, 2007, 71(5): 610-619.
[7] Serebrennikova Y M, Huffman D E. Garcia-Rubio L H. Characterization of red blood cells with multiwavelength transmission spectroscopy[J]. BioMed Research International, 2015, 2015: 382641.
[8] Alupoaei C E. García-Rubio L H. An interpretation model for the UV-VIS spectra of microorganisms[J]. Chemical Engineering Communications, 2005, 192(2): 198-218.
[9] Alupoaei C E, Olivares J A. García-Rubio L H. Quantitative spectroscopy analysis of prokaryotic cells: vegetative cells and spores[J]. Biosensors and Bioelectronics, 2004, 19(8): 893-903.
[10] Alupoaei C E. García-Rubio L H. Growth behavior of microorganisms using UV-vis spectroscopy: Escherichia coli[J]. Biotechnology and Bioengineering, 2004, 86(2): 163-167.
[11] 胡玉霞, 赵南京, 甘婷婷, 等. 基于多波长透射光谱的水体细菌生长阶段特征参数反演研究[J]. 中国激光, 2018, 45(2): 0207023.
[12] Hu Y X, Zhao N J, Gan T T, et al. Analytic method on characteristic parameters of bacteria in water by multiwavelength transmission spectroscopy[J]. Journal of Spectroscopy, 2017, 2017: 4039048.
[13] 甘婷婷, 赵南京, 胡玉霞, 等. 水体细菌微生物多波长透射光谱特征分析研究[J]. 光谱学与光谱分析, 2018, 38(5): 1610-1619.
[14] Huffman D E, Serebrennikova Y M, Smith J M, et al. Reagentless bacterial identification using a combination of multiwavelength transmission and angular scattering spectroscopy[J]. Journal of Spectroscopy, 2016, 2016: 5436821.
[15] 王久悦, 赵南京, 段静波, 等. 水体细菌微生物种类快速鉴别方法研究[J]. 光谱学与光谱分析, 2015, 35(9): 2634-2638.
[16] 胡玉霞, 赵南京, 甘婷婷, 等. 水体细菌微生物多波长透射光谱解析模型[J]. 光学学报, 2017, 37(8): 0830001.
[17] 孟庆华, 王微波, 胡育筑. 紫外光谱相似度及其在中药注射液质量控制中的应用[J]. 中国中药杂志, 2007, 32(3): 206-210.
Meng Q H, Wang W B, Hu Y Z. Application of UV similarity in quality control of Chinese medical injection[J]. China Journal of Chinese Materia Medica, 2007, 32(3): 206-210.
[18] 胡玉霞, 赵南京, 甘婷婷, 等. 水体细菌微生物多波长透射光谱定量分析归一化方法研究[J]. 光学学报, 2018, 38(4): 0430001.
Article Outline
冯春, 赵南京, 殷高方, 甘婷婷, 陈敏, 杨金强, 刘建国, 刘文清. 基于光谱相似性分析的水体致病菌种类识别方法[J]. 光学学报, 2020, 40(3): 0330002. Chun Feng, Nanjing Zhao, Gaofang Yin, Tingting Gan, Min Chen, Jinqiang Yang, Jianguo Liu, Wenqing Liu. Recognition of Waterborne Pathogens Based on Spectral Similarity Analysis[J]. Acta Optica Sinica, 2020, 40(3): 0330002.