中国激光, 2020, 47 (2): 0207030, 网络出版: 2020-02-21   

基于主成分分析和模糊聚类法的细菌后向散射光谱分类方法 下载: 974次

A Method of Backscattering Micro-Spectrum Classification Based on Principal Component Analysis and Fuzzy Cluster Analysis
作者单位
1 上海理工大学生物医学光学与视光学研究所, 医用光学技术与仪器教育部重点实验室, 上海 200093
2 复旦大学上海医学院附属中山医院肾病科, 上海市肾病与透析研究所, 上海市肾脏疾病与血液净化重点实验室,上海市重中之重肾脏疾病临床医学中心, 上海 200030
3 上海理工大学医疗器械与食品工程学院食品微生物研究所, 上海 200093
4 教育部光学仪器与系统工程研究中心, 上海理工大学现代光学系统重点实验室, 上海 200093
摘要
食源性致病菌的快速检测是解决食品安全问题最有效的途径之一。为了实现对食源性致病菌的快速、高效、无标记检测和分类,提升了原有的光纤共聚焦后向散射光谱系统的性能,将其光场直径减小到适合较小生物样品的水平,即达到单菌水平检测。在无标记条件下,测定了三种常见的形态相近的食源性致病菌(肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌)的后向散射光谱。选取500~800 nm范围的特征波段,将主成分分析和模糊聚类分析相结合,建立多元分析模型。主成分分析结果表明,所得的前5个主成分已经包含80.41%的特征区光谱信息。将前5个主成分分量作为模糊聚类分析的变量。由所求得的隶属度矩阵可知,三种细菌聚类结果的准确率均为100%。该结果说明光纤共聚焦后向散射光谱方法结合主成分分析和聚类分析法能够快速、高效、无标记地对单个细菌进行分析和分类。
Abstract
Rapid detection of foodborne pathogens is one of the most effective ways to overcome food safety problems. To realize a rapid, efficient and label-free detection and classification of foodborne pathogens, this study aims to improve the performance of existing optical fiber confocal backscattering spectrum system. Through this process, the light field diameter is reduced to fit small biological samples, and single spectrum level detection can be achieved. Furthermore, the backscattering micro-spectrum of three categories of common foodborne pathogens (Salmonella enteritidis, Escherichia coli, and Salmonella typhimurium) with similar morphology is measured without labels. A multivariate analysis model is established by combining principal component analysis (PCA) and fuzzy cluster analysis (FCA) at the characteristic wavelength range of 500--800 nm. Results show that the top five principal components contain 80.41% characteristic spectral information. The scores of the top five principal components are taken as the variables for the FCA. The accuracy of 100%, according to the degree matrix of membership, is achieved for the clustering results of three kinds of bacteria. Also, results show that optical fiber confocal backscattering spectroscopy, combined with PCA and FCA, can be used to analyze and classify a single spectrum rapidly, efficiently, and without labels.

1 引言

尽管世界各国都在采取食品安全措施,但食源性疾病仍严重威胁着人们的身体健康。食源性致病菌是引起食源性疾病的主要原因。世界卫生组织的调查结果显示,全球每年有多达6亿人因食用受到污染的食品而生病[1]。食源性疾病最常见的临床表现为胃肠道症状,可能导致全身多器官衰竭,甚至引发癌症,从而造成极大的残疾和死亡负担。自然界存在的污染源分布广泛,包括受污染的粪便、水源、土壤、野生动物等,运输中的防护措施不当、自然腐坏等诸多因素都可能导致食品受到污染[2]。因此,快速检测与鉴定食源性致病菌是有效控制和预防食品安全问题、降低临床感染率的第一步。

近年来,针对食源性致病菌,出现了很多新的微生物快速检测方法,这些方法大致可分为分子生物学检测技术和免疫学技术两类。其中:生物学检测技术以聚合酶链式反应(PCR)为基础,衍生出了多重PCR技术[3]、实时荧光定量PCR技术[4]、基因芯片技术[5]及依赖PCR技术的DNA指纹图谱技术[6]等;免疫学技术以抗原抗体特异性结合为基础,主要包括酶联免疫吸附[7]、免疫胶体金技术[8]和免疫磁珠技术[9]等。但采用以上方法对不同的细菌进行检测和鉴定时仍存在一定的缺陷,例如:聚合酶链式反应和免疫学方法往往需要几小时甚至几天才能得到结果,不适合现场的快速检测;酶联免疫吸附法往往有较高的假阳性率。ATP(三磷酸腺苷)发光检测技术只能检测食品中所含微生物的总数,不能对目标微生物进行特异性检测。

在食源性致病菌快速检测领域,光学手段同样发挥着重要作用,例如:拉曼光谱由于其快速、灵敏的特性,在食源性致病菌检测领域的应用越来越广泛[10-11];高光谱成像技术在食品安全领域作出了巨大贡献,它可以省去复杂的准备工作而直接在食品上进行测试[12]。光散射是微小粒子与光相互作用的主要形式,散射光的特性与散射粒子的特性直接相关[13]。基于弹性散射光的光学检测方法可以在不引入外部介质的情况下测量和分析自然状态下活细胞内部结构的分布和变化。后向散射光谱携带着细菌细胞内的结构和化学成分等信息。本文以肠炎沙门氏菌、鼠伤寒沙门氏菌这两种高发病率的沙门氏菌以及具有高风险的大肠杆菌为例[14]进行研究。这三种菌在形态上看都是杆状形态,在显微镜下很难用肉眼区分。在无标记的情况下,本课题组利用光纤共聚焦后向散射显微光谱方法对这三种细菌的光谱进行测量和采集,通过对采集到的光谱进行主成分分析和模糊聚类分析,实现了单菌水平的分类和鉴定。

2 材料和方法

2.1 实验设备

图1所示的光纤共聚焦后向散射光谱仪(FCBS)在之前的研究中用于癌细胞的分类和鉴定[15-16]。在本实验中,基于共焦原理,采用光纤耦合器来实现共焦的目的。带有聚焦系统的宽带光源(BPS120,20 W)发射的光线通过单模光纤耦合器的端口1至端口3与光探头耦合,将照明光传输到物体使其成像,并收集来自照明焦点体积内的后向散射光,光纤端口3可以起到共焦空间滤波的作用。光探头由两个平场消光物镜构成,焦点的直径为3.5 μm。其中:一个平场消光物镜作为准直器,其数值孔径NA=0.4,倍率为20;另一个平场消色差物镜的NA=0.65,倍率为40。位于焦平面上的细菌样本与光作用后产生的后向散射光被光学探头接收,通过光纤耦合器端口3后经耦合器端口2传输进入光谱仪(BRC112)。该光谱仪响应较好的光谱带宽有600 nm(400~1000 nm)。样本下方的物镜与CCD相机组成倒置显微结构,用于直接观测被探测细菌。

图 1. FCBS光谱仪原理图

Fig. 1. Schematic of FCBS

下载图片 查看所有图片

2.2 细菌样本

本实验所用细菌样本分别为肠炎沙门氏菌(Salmonella enteritidis,ATCC50335)、大肠杆菌(Escherichia coli,ATCC25922)、鼠伤寒沙门氏菌(Salmonella typhimurium,ATCC14028)。所有细菌样本均来自上海理工大学微生物实验室。所有细胞学样品均未沉淀。

细菌按下述方法进行分离:三株菌在营养肉汤中培养16 h,然后用体积分数为1%的甲醇固定;取200 μL细菌悬浮液置于埃普多夫离心管中,在5000 r/min的转速下离心5 min;用1 mL去离子水冲洗沉淀部分,使细菌复苏,这个过程重复三次,最后在500 mL去离子水中使细菌复苏。在酒精灯上烘烤干净无油的载玻片,然后用无菌涂布棒将20 μL细菌悬浮液涂在准备好的载玻片上。

2.3 光谱的采集和预处理

使用在可见光和近红外波段反射率约为30%的硅片作为所有细菌后向散射光谱分析的标准反射器,目的是提高样品后向散射光的相对强度,以准确获得被测样品真实光谱的特征。分别将肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌放置于载玻片上,人工调节载物台使其沿水平方向移动,照射光焦点可在水平方向进行扫描。此时样品的微观信息是在单个细菌水平上测量的。

2.4 多元分析方法

本文所采集的后向散射光谱的特征波段为500~800 nm,是一条连续的曲线,各个波段的光谱数据虽然能为其分析提供大量的信息,但光谱数据的维度过高,且数据之间存在着显著的相关性。为了分析三种细菌后向散射光谱之间的差异,首先要对光谱数据进行降维处理。主成分分析能够将许多相关性很高的变量进行转化,使彼此之间相互独立或不相关。最后可以选出变异的少数几个能够解释数据综合性指标的新变量,即主成分,同时也实现了降维的目的[17]

聚类分析是一种无监督学习方式,不依赖于预先定义的对象和带符号的训练实例,按照一定的要求和规律将事物进行分类。与K-means聚类分析等把每个待辨识的样本严格划分到某个类中的方法不同,模糊聚类分析(FCA)引入“隶属度”的概念,除了计算聚类中心以外,根据每个样本属于每个类的程度建立隶属度矩阵U[18]。其中,样本隶属度uij的值越接近1,表示编号为i的样本属于第j(j=1,2,3)类的程度越高。

3 实验结果

本实验采用改进的FCBS测定肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的后散射光谱,利用BWSpec软件对这三种食源性致病菌的光谱数据进行采集。

3.1 光谱及主成分提取

本文所使用的三种细菌的光谱数据均为50组,选择的特征波段为500~800 nm,平均光谱曲线如图2所示。纵坐标表示细菌后向散射光谱相对参考硅片反射的后向散射光强之比(R)。采用相对测量的手段可以提高样品后向散射光的相对强度和信噪比。原始光谱数据的维度高,数据量大,不利于进一步的分析,需要对光谱进行降维,采用主成分分析提取光谱的主成分。对原始光谱数据进行主成分分析,前10个主成分的特征值、贡献率和累计贡献率如表1所示。结果显示,前5个主成分的累计贡献率已经超过80%,说明已经包含了原始光谱数据的主要信息。

图 2. 三种细菌的平均光谱曲线

Fig. 2. Average spectral curves of three bacteria

下载图片 查看所有图片

表 1. 前10个主成分的特征值、贡献率和累计贡献率

Table 1. Characteristic values, contribution rates and cumulative contribution rates of the top 10 principal components

PrincipalcomponentEigenvalueContributionrate /%Cumulativecontribution rate/%
PC1365.6851.2251.22
PC2153.4821.5072.71
PC334.854.8877.59
PC411.861.6679.25
PC58.231.1580.41
PC63.880.5480.95
PC72.750.3981.34
PC82.580.3681.70
PC92.490.3582.05
PC102.450.3482.39

查看所有表

通过主成分分析可以求出各主成分的分量,提取每一个样本的前3个主成分分量绘制三维散点图,如图3所示。结果显示,使用改良后的FCBS所得到的肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的显微光谱数据能够被有效分为三类。

图 3. 主成分分析散点图

Fig. 3. Scatter diagram of principal component analysis

下载图片 查看所有图片

3.2 模糊聚类分析结果

经过上述主成分分析,将各样本的前5个主成分分量作为模糊聚类分析的变量,得到了三种细菌样本的中心坐标值(表2)和隶属度矩阵U表3展示了隶属度矩阵的部分内容,其中,样本编号1~50为肠炎沙门氏菌,51~100为大肠杆菌,101~150为鼠伤寒沙门氏菌。在隶属度矩阵中,样本隶属度uij的值越接近1,表示编号为i的样本属于第j(j=1,2,3)类的程度越高。

表 2. 三类细菌的样本中心

Table 2. Sample centers of three categories of bacteria

CategoryPC1PC2PC3PC4PC5
Salmonella enteritidis-21.53699.490555-1.04738-0.112980.61074
Escherichia coli-2.00409-16.71380.8595150.530634-0.38007
Salmonella typhimurium24.691047.681297-1.055270.375939-0.34884

查看所有表

表 3. 隶属度矩阵

Table 3. Degree matrix of membership

NumberCategory 1Category 2Category 3
40.0272330.9582890.014478
50.0181910.9720880.009721
60.0369990.9428560.020145
70.0274080.9584410.014151
80.0171650.9739060.008929
630.9540390.0256930.020268
640.9771930.0124380.010369
650.9702930.0165020.013205
660.9813020.0101180.008579
670.9926090.004120.003271
1120.0284990.0205260.950975
1130.0417800.0315390.926681
1140.0271530.0166740.956173
1150.1055510.0936080.800841
1160.0089760.0058430.985182

查看所有表

对三种细菌的隶属度矩阵进行统计,得到了三种细菌判别分析结果,如表4所示,三种细菌的光谱数据各为50组,对三种细菌的判别准确率均达到100%,说明三种细菌的所有样本都得到了正确分类。

表 4. 三种细菌的判别分析结果

Table 4. Discriminant analysis results of three kinds of bacteria

CategoryDiscriminant analysis result
Category 1Category 2Category 3
Salmonella enteritidis(50 groups )0500
Escherichia coli(50 groups)5000
Salmonella typhimurium(50 groups)0050
Discriminantaccuracy /%100100100

查看所有表

4 讨论

食品安全问题关系到国计民生。传统的细菌鉴定技术耗时长,而且检测灵敏度低。基于分子生物学、免疫学和流式细胞术等的检测方法流程复杂,对操作人员的专业要求较高,而且高昂的仪器和试剂价格使其难以在常规实验室和现场检测中广泛使用[19]。与其他光学及光谱学手段相比[20-22],本文提出的基于共焦显微后向散射的检测方法操作简单,采样涂片后即可进行检测,亦可在线直接进行检测,无需复杂的预处理就能够实现单细胞水平的测量,重复性和准确性良好。由于后向散射光的光强较强,能够有效避免样品和装载容器背景荧光的干扰。采用主成分分析法大大简化了光谱数据的维度,可以更方便地提取其有效信息。因此在样本量较小的情况下,通常可在几分钟至几十分钟内得到完整的分类结果。本文所提方法是一种快速、无标记的检测方法,它可以将细菌细胞的空间信息抽象成光谱信息,进而得到不同细菌的散射特性。通过提取散射光谱的特征,可以对不同的细胞进行分析,具有系统简单、重复性好、光谱信号精度高等优点。

随着对食品微生物的进一步了解,相信更多的食源性致病菌分析方法和检测技术可以应用于实际。其中,光学检测方法是重要的一个分支。光与微小粒子作用的主要表现形式就是散射,散射光的特性与散射粒子的结构密切相关,如细胞散射光强度是由细胞大小、细胞内部结构的复杂程度等参数共同影响的结果[23-25]。然而针对细菌,目前尚未有明确的理论能够定性分析其内部微结构对其后向散射光的影响。虽然本研究对培养的三种形态类似的细菌有较好的区分能力,但由于食品中常见的食源性致病菌种类繁多,作用复杂,混合菌株样本的自动分类及其在临床检测和治疗中的应用也有待进一步研究。针对细菌的鉴别仍有大量的工作要做:一方面,需要收集更多的样本来确认目前的数据,然后将这项技术应用于实际工作中;另一方面,需要研究后向散射显微光谱与细菌形态结构之间的关系,探究生长阶段、生长环境等因素对细菌形态结构的影响。将光学技术与微流控、人工智能识别等技术相结合,有望实现食源性致病菌的准确、快速检测。

5 结论

本文采用改进后的FCBS采集了形态相近的肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的后向散射光谱数据,利用主成分分析与模糊聚类分析相结合的方法,对三种形态相近的食源性致病菌进行了分析和分类。结果表明:主成分分析所得前5个主成分的累计贡献率达到了80.41%,包含了光谱数据的绝大多数信息;根据前5个主成分分量,三种细菌光谱数据组间的差异较大,组内差异较小;对模糊聚类分析所得到的隶属度矩阵进行分析和统计,得到三种细菌在所对应类中的隶属度的值均接近1,判别准确率均达到100%,再次说明了三种细菌光谱数据组间差异较大,组内差异较小。可见,使用改进后的FCBS所得到的肠炎沙门氏菌、大肠杆菌、鼠伤寒沙门氏菌的后向散射显微光谱数据具有明显的区别。为下一步针对细菌亚种之间的分类奠定了基础。

参考文献

[1] World HealthOrganization. WHO estimates of the global burden of foodborne diseases[M]. Geneva: WHO, 2013: 3- 12.

[2] Alegbeleye O O, Singleton I. Sant'Ana A S. Sources and contamination routes of microbial pathogens to fresh produce during field cultivation: a review[J]. Food Microbiology, 2018, 73: 177-208.

[3] Liu M, Hu P, Zhang G, et al. Copy number variation analysis by ligation-dependent PCR based on magnetic nanoparticles and chemiluminescence[J]. Theranostics, 2015, 5(1): 71-85.

[4] Postollec F, Falentin H, Pavan S, et al. Recent advances in quantitative PCR (qPCR) applications in food microbiology[J]. Food Microbiology, 2011, 28(5): 848-861.

[5] 祝儒刚, 李拖平, 宋立峰. 应用基因芯片技术检测肉及肉制品中5种致病菌[J]. 食品科学, 2012, 33(14): 211-215.

    Zhu R G, Li T P, Song L F. Rapid detection of five pathogens in meat and meat products by DNA microarray[J]. Food Science, 2012, 33(14): 211-215.

[6] 刘霞, 刘社兰, 解奕瑞, 等. 基于16S rRNA基因和细菌基因组间重复序列的DNA指纹图谱技术对肝硬化大鼠肝移植后肠道菌群多样性的研究[J]. 中国微生态学杂志, 2010, 22(3): 193-198.

    Liu X, Liu S L, Xie Y R, et al. Dynamics of intestinal bacterial diversity in liver transplant rat with hepatic cirrhosis by PCR-DGGE and rep-PCR[J]. Chinese Journal of Microecology, 2010, 22(3): 193-198.

[7] Zhao Z J, Liu X M. Preparation of monoclonal antibody and development of enzyme-linked immunosorbent assay specific for Escherichia coli O157 in foods[J]. Biomedical and Environmental Sciences, 2005, 18(4): 254-259.

[8] 庞璐, 宋喆, 吴冬雪, 等. PCR-免疫胶体金试纸条方法检测食品中肠出血性大肠杆菌O157∶H7[J]. 食品安全质量检测学报, 2015, 6(2): 447-451.

    Pang L, Song Z, Wu D X, et al. Detection of Escherichia coli O157∶H7 in food by PCR-immunogold method[J]. Journal of Food Safety & Quality, 2015, 6(2): 447-451.

[9] Yu L S L, Uknalis J, Tu S-I. Immunomagnetic separation methods for the isolation of Campylobacter jejuni from ground poultry meats[J]. Journal of Immunological Methods, 2001, 256(1/2): 11-18.

[10] Duan N, Chang B Y, Zhang H, et al. Salmonella typhimurium detection using a surface-enhanced Raman scattering-based aptasensor[J]. International Journal of Food Microbiology, 2016, 218: 38-43.

[11] Wang P X, Pang S, Chen J H, et al. Label-free mapping of single bacterial cells using surface-enhanced Raman spectroscopy[J]. The Analyst, 2016, 141(4): 1356-1362.

[12] Feng Y Z, Sun D W. Application of hyperspectral imaging in food safety inspection and control: a review[J]. Critical Reviews in Food Science and Nutrition, 2012, 52(11): 1039-1058.

[13] Richter V, Voit F, Kienle A, et al. Light scattering microscopy with angular resolution and its possible application to apoptosis[J]. Journal of Microscopy, 2015, 257(1): 1-7.

[14] Tack D M, Marder E P, Griffin P M, et al. Preliminary incidence and trends of infections with pathogens transmitted commonly through food—Foodborne Diseases Active Surveillance Network, 10 US sites, 2015—2018[J]. American Journal of Transplantation, 2019, 19(6): 1859-1863.

[15] Wang C, Guo X D, Fang B Y, et al. Study of back-scattering microspectrum for stomach cells at single-cell scale[J]. Journal of Biomedical Optics, 2010, 15(4): 040505.

[16] 王成, 方宝英, 蔡文杰, 等. 单细胞水平的光纤共焦后向散射显微光谱[J]. 中国激光, 2009, 36(10): 2636-2641.

    Wang C, Fang B Y, Cai W J, et al. Fiber confocal back-scattering micro-spectrum in single biology cellular scale[J]. Chinese Journal of Lasers, 2009, 36(10): 2636-2641.

[17] Wold S, Esbensen K, Geladi P. Principal component analysis[J]. Chemometrics and Intelligent Laboratory Systems, 1987, 2(1/2/3): 37-52.

[18] 许海洋, 汪国安, 王万森. 模糊聚类分析在数据挖掘中的应用研究[J]. 计算机工程与应用, 2005, 41(17): 177-179.

    Xu H Y, Wang G A, Wang W S. A study of fuzzy clustering analysis in data mining[J]. Computer Engineering and Applications, 2005, 41(17): 177-179.

[19] Sirichayaporn H, Piyatip K, Krit T, et al. Raman spectroscopic analysis of food-borne microorganisms[J]. LWT-Food Science and Technology, 2019, 114: 108419.

[20] He H J, Sun D W. Microbial evaluation of raw and processed food products by visible/infrared, Raman and fluorescence spectroscopy[J]. Trends in Food Science & Technology, 2015, 46(2): 199-210.

[21] 戴艳, 董作人, 刘铭晖, 等. 抑制容器荧光干扰的双轴共焦拉曼检测方法[J]. 中国激光, 2018, 45(7): 0711001.

    Dai Y, Dong Z R, Liu M H, et al. A dual-axis confocal Raman detection method for suppressing fluorescence interference from containers[J]. Chinese Journal of Lasers, 2018, 45(7): 0711001.

[22] 姚森, 张霁, 刘鸿高, 等. 红外光谱技术在食用菌研究中的应用[J]. 食品科学, 2018, 39(1): 305-312.

    Yao S, Zhang J, Liu H G, et al. A review of the application of infrared spectroscopy in chemical analysis and quality control of edible mushrooms[J]. Food Science, 2018, 39(1): 305-312.

[23] 邓勇, 鲁强, 骆清铭. 用基于方位分辨的漫后向散射光确定粒子尺寸分布及相对折射率[J]. 光学学报, 2006, 26(8): 1214-1219.

    Deng Y, Lu Q, Luo Q M. Measurement of particle size distribution and refractive index using azimuth-resolved based diffuse backscattering light[J]. Acta Optica Sinica, 2006, 26(8): 1214-1219.

[24] 卜敏, 胡双双, 陶兆禾, 等. 白细胞对偏振光的散射特性及散射特性与细胞结构的关系[J]. 中国激光, 2017, 44(10): 1007001.

    Bu M, Hu S S, Tao Z H, et al. Scattering characteristics of leukocytes on polarized light and relationship between scattering characteristics and cell structure[J]. Chinese Journal of Lasers, 2017, 44(10): 1007001.

[25] 陶兆禾, 郑慧茹, 秦柳燕, 等. 前后向散射特征分析下的白细胞亚型分类识别仿真研究[J]. 红外与激光工程, 2019, 48(5): 0533001.

    Tao Z H, Zheng H R, Qin L Y, et al. Simulation research on classification and recognition of white blood cells subtypes under forward and backward scattering characteristics[J]. Infrared and Laser Engineering, 2019, 48(5): 0533001.

王成, 焦彤, 陆雨菲, 徐康, 李森, 刘箐, 张大伟. 基于主成分分析和模糊聚类法的细菌后向散射光谱分类方法[J]. 中国激光, 2020, 47(2): 0207030. Wang Cheng, Jiao Tong, Lu Yufei, Xu Kang, Li Sen, Liu Jing, Zhang Dawei. A Method of Backscattering Micro-Spectrum Classification Based on Principal Component Analysis and Fuzzy Cluster Analysis[J]. Chinese Journal of Lasers, 2020, 47(2): 0207030.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!