基于主成分分析和模糊聚类法的细菌后向散射光谱分类方法 下载: 974次
1 引言
尽管世界各国都在采取食品安全措施,但食源性疾病仍严重威胁着人们的身体健康。食源性致病菌是引起食源性疾病的主要原因。世界卫生组织的调查结果显示,全球每年有多达6亿人因食用受到污染的食品而生病[1]。食源性疾病最常见的临床表现为胃肠道症状,可能导致全身多器官衰竭,甚至引发癌症,从而造成极大的残疾和死亡负担。自然界存在的污染源分布广泛,包括受污染的粪便、水源、土壤、野生动物等,运输中的防护措施不当、自然腐坏等诸多因素都可能导致食品受到污染[2]。因此,快速检测与鉴定食源性致病菌是有效控制和预防食品安全问题、降低临床感染率的第一步。
近年来,针对食源性致病菌,出现了很多新的微生物快速检测方法,这些方法大致可分为分子生物学检测技术和免疫学技术两类。其中:生物学检测技术以聚合酶链式反应(PCR)为基础,衍生出了多重PCR技术[3]、实时荧光定量PCR技术[4]、基因芯片技术[5]及依赖PCR技术的DNA指纹图谱技术[6]等;免疫学技术以抗原抗体特异性结合为基础,主要包括酶联免疫吸附[7]、免疫胶体金技术[8]和免疫磁珠技术[9]等。但采用以上方法对不同的细菌进行检测和鉴定时仍存在一定的缺陷,例如:聚合酶链式反应和免疫学方法往往需要几小时甚至几天才能得到结果,不适合现场的快速检测;酶联免疫吸附法往往有较高的假阳性率。ATP(三磷酸腺苷)发光检测技术只能检测食品中所含微生物的总数,不能对目标微生物进行特异性检测。
在食源性致病菌快速检测领域,光学手段同样发挥着重要作用,例如:拉曼光谱由于其快速、灵敏的特性,在食源性致病菌检测领域的应用越来越广泛[10-11];高光谱成像技术在食品安全领域作出了巨大贡献,它可以省去复杂的准备工作而直接在食品上进行测试[12]。光散射是微小粒子与光相互作用的主要形式,散射光的特性与散射粒子的特性直接相关[13]。基于弹性散射光的光学检测方法可以在不引入外部介质的情况下测量和分析自然状态下活细胞内部结构的分布和变化。后向散射光谱携带着细菌细胞内的结构和化学成分等信息。本文以肠炎沙门氏菌、鼠伤寒沙门氏菌这两种高发病率的沙门氏菌以及具有高风险的大肠杆菌为例[14]进行研究。这三种菌在形态上看都是杆状形态,在显微镜下很难用肉眼区分。在无标记的情况下,本课题组利用光纤共聚焦后向散射显微光谱方法对这三种细菌的光谱进行测量和采集,通过对采集到的光谱进行主成分分析和模糊聚类分析,实现了单菌水平的分类和鉴定。
2 材料和方法
2.1 实验设备
如
2.2 细菌样本
本实验所用细菌样本分别为肠炎沙门氏菌(Salmonella enteritidis,ATCC50335)、大肠杆菌(Escherichia coli,ATCC25922)、鼠伤寒沙门氏菌(Salmonella typhimurium,ATCC14028)。所有细菌样本均来自上海理工大学微生物实验室。所有细胞学样品均未沉淀。
细菌按下述方法进行分离:三株菌在营养肉汤中培养16 h,然后用体积分数为1%的甲醇固定;取200 μL细菌悬浮液置于埃普多夫离心管中,在5000 r/min的转速下离心5 min;用1 mL去离子水冲洗沉淀部分,使细菌复苏,这个过程重复三次,最后在500 mL去离子水中使细菌复苏。在酒精灯上烘烤干净无油的载玻片,然后用无菌涂布棒将20 μL细菌悬浮液涂在准备好的载玻片上。
2.3 光谱的采集和预处理
使用在可见光和近红外波段反射率约为30%的硅片作为所有细菌后向散射光谱分析的标准反射器,目的是提高样品后向散射光的相对强度,以准确获得被测样品真实光谱的特征。分别将肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌放置于载玻片上,人工调节载物台使其沿水平方向移动,照射光焦点可在水平方向进行扫描。此时样品的微观信息是在单个细菌水平上测量的。
2.4 多元分析方法
本文所采集的后向散射光谱的特征波段为500~800 nm,是一条连续的曲线,各个波段的光谱数据虽然能为其分析提供大量的信息,但光谱数据的维度过高,且数据之间存在着显著的相关性。为了分析三种细菌后向散射光谱之间的差异,首先要对光谱数据进行降维处理。主成分分析能够将许多相关性很高的变量进行转化,使彼此之间相互独立或不相关。最后可以选出变异的少数几个能够解释数据综合性指标的新变量,即主成分,同时也实现了降维的目的[17]。
聚类分析是一种无监督学习方式,不依赖于预先定义的对象和带符号的训练实例,按照一定的要求和规律将事物进行分类。与K-means聚类分析等把每个待辨识的样本严格划分到某个类中的方法不同,模糊聚类分析(FCA)引入“隶属度”的概念,除了计算聚类中心以外,根据每个样本属于每个类的程度建立隶属度矩阵U[18]。其中,样本隶属度uij的值越接近1,表示编号为i的样本属于第j(j=1,2,3)类的程度越高。
3 实验结果
本实验采用改进的FCBS测定肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的后散射光谱,利用BWSpec软件对这三种食源性致病菌的光谱数据进行采集。
3.1 光谱及主成分提取
本文所使用的三种细菌的光谱数据均为50组,选择的特征波段为500~800 nm,平均光谱曲线如
表 1. 前10个主成分的特征值、贡献率和累计贡献率
Table 1. Characteristic values, contribution rates and cumulative contribution rates of the top 10 principal components
|
通过主成分分析可以求出各主成分的分量,提取每一个样本的前3个主成分分量绘制三维散点图,如
3.2 模糊聚类分析结果
经过上述主成分分析,将各样本的前5个主成分分量作为模糊聚类分析的变量,得到了三种细菌样本的中心坐标值(
表 2. 三类细菌的样本中心
Table 2. Sample centers of three categories of bacteria
|
表 3. 隶属度矩阵
Table 3. Degree matrix of membership
|
对三种细菌的隶属度矩阵进行统计,得到了三种细菌判别分析结果,如
表 4. 三种细菌的判别分析结果
Table 4. Discriminant analysis results of three kinds of bacteria
|
4 讨论
食品安全问题关系到国计民生。传统的细菌鉴定技术耗时长,而且检测灵敏度低。基于分子生物学、免疫学和流式细胞术等的检测方法流程复杂,对操作人员的专业要求较高,而且高昂的仪器和试剂价格使其难以在常规实验室和现场检测中广泛使用[19]。与其他光学及光谱学手段相比[20-22],本文提出的基于共焦显微后向散射的检测方法操作简单,采样涂片后即可进行检测,亦可在线直接进行检测,无需复杂的预处理就能够实现单细胞水平的测量,重复性和准确性良好。由于后向散射光的光强较强,能够有效避免样品和装载容器背景荧光的干扰。采用主成分分析法大大简化了光谱数据的维度,可以更方便地提取其有效信息。因此在样本量较小的情况下,通常可在几分钟至几十分钟内得到完整的分类结果。本文所提方法是一种快速、无标记的检测方法,它可以将细菌细胞的空间信息抽象成光谱信息,进而得到不同细菌的散射特性。通过提取散射光谱的特征,可以对不同的细胞进行分析,具有系统简单、重复性好、光谱信号精度高等优点。
随着对食品微生物的进一步了解,相信更多的食源性致病菌分析方法和检测技术可以应用于实际。其中,光学检测方法是重要的一个分支。光与微小粒子作用的主要表现形式就是散射,散射光的特性与散射粒子的结构密切相关,如细胞散射光强度是由细胞大小、细胞内部结构的复杂程度等参数共同影响的结果[23-25]。然而针对细菌,目前尚未有明确的理论能够定性分析其内部微结构对其后向散射光的影响。虽然本研究对培养的三种形态类似的细菌有较好的区分能力,但由于食品中常见的食源性致病菌种类繁多,作用复杂,混合菌株样本的自动分类及其在临床检测和治疗中的应用也有待进一步研究。针对细菌的鉴别仍有大量的工作要做:一方面,需要收集更多的样本来确认目前的数据,然后将这项技术应用于实际工作中;另一方面,需要研究后向散射显微光谱与细菌形态结构之间的关系,探究生长阶段、生长环境等因素对细菌形态结构的影响。将光学技术与微流控、人工智能识别等技术相结合,有望实现食源性致病菌的准确、快速检测。
5 结论
本文采用改进后的FCBS采集了形态相近的肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的后向散射光谱数据,利用主成分分析与模糊聚类分析相结合的方法,对三种形态相近的食源性致病菌进行了分析和分类。结果表明:主成分分析所得前5个主成分的累计贡献率达到了80.41%,包含了光谱数据的绝大多数信息;根据前5个主成分分量,三种细菌光谱数据组间的差异较大,组内差异较小;对模糊聚类分析所得到的隶属度矩阵进行分析和统计,得到三种细菌在所对应类中的隶属度的值均接近1,判别准确率均达到100%,再次说明了三种细菌光谱数据组间差异较大,组内差异较小。可见,使用改进后的FCBS所得到的肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的后向散射显微光谱数据具有明显的区别。为下一步针对细菌亚种之间的分类奠定了基础。
[1] World HealthOrganization. WHO estimates of the global burden of foodborne diseases[M]. Geneva: WHO, 2013: 3- 12.
[2] Alegbeleye O O, Singleton I. Sant'Ana A S. Sources and contamination routes of microbial pathogens to fresh produce during field cultivation: a review[J]. Food Microbiology, 2018, 73: 177-208.
[3] Liu M, Hu P, Zhang G, et al. Copy number variation analysis by ligation-dependent PCR based on magnetic nanoparticles and chemiluminescence[J]. Theranostics, 2015, 5(1): 71-85.
[5] 祝儒刚, 李拖平, 宋立峰. 应用基因芯片技术检测肉及肉制品中5种致病菌[J]. 食品科学, 2012, 33(14): 211-215.
Zhu R G, Li T P, Song L F. Rapid detection of five pathogens in meat and meat products by DNA microarray[J]. Food Science, 2012, 33(14): 211-215.
[6] 刘霞, 刘社兰, 解奕瑞, 等. 基于16S rRNA基因和细菌基因组间重复序列的DNA指纹图谱技术对肝硬化大鼠肝移植后肠道菌群多样性的研究[J]. 中国微生态学杂志, 2010, 22(3): 193-198.
Liu X, Liu S L, Xie Y R, et al. Dynamics of intestinal bacterial diversity in liver transplant rat with hepatic cirrhosis by PCR-DGGE and rep-PCR[J]. Chinese Journal of Microecology, 2010, 22(3): 193-198.
[7] Zhao Z J, Liu X M. Preparation of monoclonal antibody and development of enzyme-linked immunosorbent assay specific for Escherichia coli O157 in foods[J]. Biomedical and Environmental Sciences, 2005, 18(4): 254-259.
[8] 庞璐, 宋喆, 吴冬雪, 等. PCR-免疫胶体金试纸条方法检测食品中肠出血性大肠杆菌O157∶H7[J]. 食品安全质量检测学报, 2015, 6(2): 447-451.
Pang L, Song Z, Wu D X, et al. Detection of Escherichia coli O157∶H7 in food by PCR-immunogold method[J]. Journal of Food Safety & Quality, 2015, 6(2): 447-451.
[9] Yu L S L, Uknalis J, Tu S-I. Immunomagnetic separation methods for the isolation of Campylobacter jejuni from ground poultry meats[J]. Journal of Immunological Methods, 2001, 256(1/2): 11-18.
[10] Duan N, Chang B Y, Zhang H, et al. Salmonella typhimurium detection using a surface-enhanced Raman scattering-based aptasensor[J]. International Journal of Food Microbiology, 2016, 218: 38-43.
[11] Wang P X, Pang S, Chen J H, et al. Label-free mapping of single bacterial cells using surface-enhanced Raman spectroscopy[J]. The Analyst, 2016, 141(4): 1356-1362.
[13] Richter V, Voit F, Kienle A, et al. Light scattering microscopy with angular resolution and its possible application to apoptosis[J]. Journal of Microscopy, 2015, 257(1): 1-7.
[14] Tack D M, Marder E P, Griffin P M, et al. Preliminary incidence and trends of infections with pathogens transmitted commonly through food—Foodborne Diseases Active Surveillance Network, 10 US sites, 2015—2018[J]. American Journal of Transplantation, 2019, 19(6): 1859-1863.
[15] Wang C, Guo X D, Fang B Y, et al. Study of back-scattering microspectrum for stomach cells at single-cell scale[J]. Journal of Biomedical Optics, 2010, 15(4): 040505.
[16] 王成, 方宝英, 蔡文杰, 等. 单细胞水平的光纤共焦后向散射显微光谱[J]. 中国激光, 2009, 36(10): 2636-2641.
[17] Wold S, Esbensen K, Geladi P. Principal component analysis[J]. Chemometrics and Intelligent Laboratory Systems, 1987, 2(1/2/3): 37-52.
[18] 许海洋, 汪国安, 王万森. 模糊聚类分析在数据挖掘中的应用研究[J]. 计算机工程与应用, 2005, 41(17): 177-179.
Xu H Y, Wang G A, Wang W S. A study of fuzzy clustering analysis in data mining[J]. Computer Engineering and Applications, 2005, 41(17): 177-179.
[19] Sirichayaporn H, Piyatip K, Krit T, et al. Raman spectroscopic analysis of food-borne microorganisms[J]. LWT-Food Science and Technology, 2019, 114: 108419.
[20] He H J, Sun D W. Microbial evaluation of raw and processed food products by visible/infrared, Raman and fluorescence spectroscopy[J]. Trends in Food Science & Technology, 2015, 46(2): 199-210.
[21] 戴艳, 董作人, 刘铭晖, 等. 抑制容器荧光干扰的双轴共焦拉曼检测方法[J]. 中国激光, 2018, 45(7): 0711001.
[22] 姚森, 张霁, 刘鸿高, 等. 红外光谱技术在食用菌研究中的应用[J]. 食品科学, 2018, 39(1): 305-312.
Yao S, Zhang J, Liu H G, et al. A review of the application of infrared spectroscopy in chemical analysis and quality control of edible mushrooms[J]. Food Science, 2018, 39(1): 305-312.
[23] 邓勇, 鲁强, 骆清铭. 用基于方位分辨的漫后向散射光确定粒子尺寸分布及相对折射率[J]. 光学学报, 2006, 26(8): 1214-1219.
[24] 卜敏, 胡双双, 陶兆禾, 等. 白细胞对偏振光的散射特性及散射特性与细胞结构的关系[J]. 中国激光, 2017, 44(10): 1007001.
[25] 陶兆禾, 郑慧茹, 秦柳燕, 等. 前后向散射特征分析下的白细胞亚型分类识别仿真研究[J]. 红外与激光工程, 2019, 48(5): 0533001.
Article Outline
王成, 焦彤, 陆雨菲, 徐康, 李森, 刘箐, 张大伟. 基于主成分分析和模糊聚类法的细菌后向散射光谱分类方法[J]. 中国激光, 2020, 47(2): 0207030. Wang Cheng, Jiao Tong, Lu Yufei, Xu Kang, Li Sen, Liu Jing, Zhang Dawei. A Method of Backscattering Micro-Spectrum Classification Based on Principal Component Analysis and Fuzzy Cluster Analysis[J]. Chinese Journal of Lasers, 2020, 47(2): 0207030.