基于时域演化特征的细胞有丝分裂事件识别与检测 下载: 788次
1 引言
测量体外细胞的增殖行为对许多生物医学应用(如干细胞制造、药物发现、组织工程等)都有很重要的价值,因此如何准确和自动化地识别有丝分裂事件对此类测量至关重要。然而体外细胞增殖行为的测量需要对细胞长时间观测,使用人工标定方法不仅耗时,而且长时间连续工作也将导致手动注释的准确性大大降低。随着高通量成像的普及,细胞图像自动化分析成为解决这些问题的最优选择。
在显微图像序列中检测有丝分裂事件的方法大致分为两类,基于局部显著性的方法和基于时序建模的方法[1-2]。基于局部显著性的方法:Siva等[3]利用时移图像的时间信息来跟踪胚胎组织的变形,通过跟踪胚胎组织区域的强度变化来识别和定位细胞分裂事件的阶段;Ma等[4]提出一种基于多尺度卷积特征对乳腺癌细胞进行有丝分裂分类的方法(MSSN),该方法利用正方形和非正方形滤波器从不同尺度[5]对有丝分裂事件的局部空间形态关系进行描述,进而实现有丝分裂事件的分类。基于时序建模的方法:Gallardo等[6]采用隐马尔可夫模型[7](HMM)构建基于细胞形状和外观特征的时间模式,进而对候选序列进行分类;Liang等[8]利用条件随机场(CRF)模型识别细胞有丝分裂的阶段;Su等[9]提出一种基于隐状条件神经场(HSCNF)的有丝分裂事件检测方法,该方法提取候选序列中各帧的Gist特征进行可视化表示,然后在隐藏状态条件下训练一个神经场分类器对有丝分裂事件进行分类。
细胞图像自动检测方法通常包括两个重要步骤,即特征表示和模型学习。基于局部显著性的方法通过对图像序列完成顺序扫描,依据强度[10]、纹理[11]和形态三方面的特征[12]的统计变化来对有丝分裂事件完成分类。尽管研究人员在这项任务上已经做了很多工作,但仍有一个问题有待解决,即现有的视觉特征和表现方法无法表征细胞外观随时间的变化趋势。基于时序建模的方法利用每帧细胞图像的形状特征来训练隐含时序动态信息的模型,进而识别和定位细胞有丝分裂事件,但是分类器捕捉细胞分裂过程中的时序变化信息,降低了模型检测的性能。因此,迫切需要一种新的表示方法来再现细胞序列中帧间的详细变化。然而,由于不同的细胞通常呈现不同的外观,并且在有丝分裂期间将发生显著的细胞形态变化,因此对细胞序列中外观随时间细节变化建模是非常困难的任务。为解决这一难题,本文提出一种新的特征表示方法 (EOF)。给出一个候选序列样本,提取该样本子序列中每帧图像的低级特征后,得到一个有限元矩阵;用一组滤波器处理该有限元矩阵后得到单个特征向量,该特征向量可以直接输入到支持向量机(SVM)实现模型学习和预测。在上述实现方法中使用时间金字塔结构[13]来获得滤波器组,本文EOF通过使用获得的滤波器和多个池化操作符计算出低级特征描述符的短期和长期变化。
2 细胞有丝分裂事件的识别与检测方法
本文所介绍的系统包括两个主要步骤,即特征表示和模型学习。本节将详细介绍一种新的特征表示方法即时域演化特征,并简要介绍模型学习部分。特征提取的工作流程如
2.1 特征表示
特征表示的目的是将一组低级特征描述符转换为高级特征表示,本文的EOF可以更好地抽象出细胞外观随时间的变化趋势。有丝分裂事件可以被视为一个有规律的运动,它包含了明显的结构信息,如
图 2. 有丝分裂的全过程,当出现“8”形状时说明有丝分裂完成
Fig. 2. Whole process of mitosis. It means that mitosis is completed when shape of “8” appears
本文EOF首先从给定的候选序列样本的每帧细胞图像中提取视觉特征。视觉特征选用尺度不变特征变换(SIFT)特征、通用搜索树(GIST)特征以及卷积神经网络(CNN)特征[14],其中SIFT特征和GIST特征是用作细胞检测的常见特征,选择CNN特征是为了与传统视觉特征进行性能对比。在时间坐标系下,第
2.2 时间池化操作
求和池化操作与最大池化操作定义分别为
式中:
除这些传统的池化操作之外,还引入两种新的梯度池化操作,第一种用来计算时间过滤器内正(负)梯度的大小,第二种沿袭第一种池化操作的思想,但它不是简单计算梯度大小,而是对变化的正(负)梯度大小求和。新引入的两种操作符的定义为
式中:
与求和池化操作和最大池化操作不同,上文介绍的新的梯度池化操作在对每个时间滤波器进行操作后生成一对值(即
2.3 模型学习
在模型学习过程中,将经典的SVM[15]分类器与卡方核(Chi-square kernel)结合应用于有丝分裂事件分类的模型建立。本文将2.1节特征表示中得到的连接池结果输入到现成的SVM分类器中进行分类。
3 有丝分裂事件检测实验
在细胞有丝分裂事件检测领域,为评估本文检测方法的检测性能,在相同的实验条件下,本文就池化时间长短、池化方法和特征提取三部分对本文方法的性能影响进行评估。此外,本文通过对比EOF与先前的特征表示,如视觉词袋模型[16](BoW)等,分类检测结果证明本文方法具有更优越的性能。
3.1 实验数据集
在两种干细胞群上测试上文提出的池化时间序列表示方法:C3H10间充质干细胞和C2C12[9]成肌干细胞。C2C12为小鼠成肌干细胞群落,该数据集包含四个子集并具有很高的汇合度。这四个子集分别包含634、636、608和257个有丝分裂事件序列。每个序列由1013个图像(1392×1040分辨率)组成。C3H10为小鼠髓间充质干细胞群落,该数据集包含5个相位对比细胞图像子集,总共有409个有丝分裂事件序列,每个序列由1436个图像(1392×1040分辨率)组成。
对于候选序列提取部分,本实验首先在C2C12和C3H10共9个子集上手动注释有丝分裂事件,遵循的原则为当可以清楚地观察分裂后两个子细胞之间的边界时,标记边界的中心。利用这种注释信息,本实验可以确定包含有丝分裂事件的阳性样本,反之,阴性样本是在相同的时空维度下随机生成的。由于F0002子集包含最多的有丝分裂事件,本实验选其作为训练数据集,而除F0002外的其他子集作为测试数据集。训练数据集包括1013个候选序列,即501个有丝分裂事件(阳性样本)和512个非有丝分裂事件(阴性样本)。
3.2 有丝分裂事件检测方法的评估
为评估每个候选序列中有丝分裂事件检测方法的性能,本实验分别计算C3H10上测试数据集的准确度(accuracy)、精确度(precision)、召回率(recall)以及F-score。同时,本实验计算了C2C12上测试数据集测试的准确度、精确度、召回率和F-score。为计算四种性能评估参数,定义四种情况TP、FN、FP和TN:对于阳性样本(包含有丝分裂事件的斑块序列),如果检测结果中具有丝分裂标记,则定义为TP(真阳性),否则,它将被定义为FN(假阴性);当阴性样本(不包含有丝分裂事件的斑块序列)在检测结果中具有有丝分裂标记,将其定义为FP(假阳性),否则它被定义为TN(真阴性)。准确度、精确度、召回率以及F-score的定义为
式中:
3.3 时间池化长短对识别性能的影响
在这项工作中,为确认本文基于EOF框架的有丝分裂事件检测方法在捕获每个描述符的长期和短期变化方面的优势,进行两个不同相位划分结构的对比实验,以找到最佳的划分比例,如
表 1. C2C12数据库不同level的实验结果
Table 1. Experimental results with different levels on C2C12 dataset
|
实验结果显示两种划分结构得到的检测结果无明显差异,但组合两个划分结构能实现最佳的性能,因为组合两个划分结构可以保存特征描述符的长期变化和短期变化。这个实验也证明了本文检测框架的有效性。
3.4 池化方法对识别性能的影响
本文介绍四种类型的池化操作符:求和池化操作符、最大池化操作符、以及两种不同类型的时间序列梯度池化操作符。考虑到池化组合策略在时空特征学习中的重要作用,本课题组进行了对比实验以找到最佳池化组合,继而实现七种组合策略,包括单一类型池化操作模式和组合模式。组合模式是指将多个池化操作的结果连接起来作为连接池结果的最终表示。本实验使用与3.3节相同的训练集和测试集,在获得最终表示后,应用SVM分类器对有丝分裂事件进行分类。相关结果如
在
3.5 特征提取对识别性能的影响
之前的实验结果表明第2种相位划分结构
表 2. C2C12数据库不同池化方法的实验结果
Table 2. Experimental results with different pooling strategies on C2C12 dataset
|
(level-2)和多个池化算子组合的池化策略是EOF的最佳选择。对于细胞图像特征的提取,选用SIFT特征、GIST特征以及CNN特征分别在C2C12数据集和C3H10数据集上进行识别性能对比试验,其中SIFT特征和GIST特征是用作细胞检测的常见特征,CNN特征是基于VGG-16模型[17]训练得到的特征,相关实验结果如
表 3. 不同特征在C2C12数据库的实验结果
Table 3. Experimental results with different features on C2C12 dataset
|
表 4. 不同特征在C3H10数据库的实验结果
Table 4. Experimental results with different features on C3H10 dataset
|
实验结果显示CNN特征优于GIST和SIFT特征,证明了深度学习在视觉特征提取中的优越性。
3.6 有丝分裂事件检测方法与当前技术进行比较
为证明本文基于EOF框架的有丝分裂事件检测方法的优越性,将本文方法与其他方法进行比较,包括结合线性SVM分类器的视觉词袋(BoW)模型,及基于图模型的方法,如隐条件随机场[18](HCRF)、隐状态条件随机场[19](HSCRF)、隐状态条件神经场[9](HSCNF)等。定量比较结果如
表 5. EOF+SVM与其他方法在C2C12数据库的比较
Table 5. Comparison of EOF+SVM with other methods on C2C12 dataset
|
表 6. EOF+SVM与其他方法在C3H10数据库的比较
Table 6. Comparison of EOF+SVM with other methods on C3H10 dataset
|
结果表明本文基于EOF框架的检测方法(EOF+SVM)在准确度、召回率以及F-sore评估参数上都达到最优。特别地,基于EOF框架的检测方法显著优于基于BoW的检测方法,这表明本方案对于时空表示辨别力更强。
3.7 有丝分裂时空联合检测
在时空联合检测实验中,利用空间和时间的滑动窗口对候选序列进行详尽的搜索。通过计算序列中所有帧的标准偏差总和,可以滤除大多数背景序列,因此,本文方法在实际应用中仍然有效。这里,选择来自C2C12数据集的子集F0001作为测试集以证明本文方法的性能。一些检测结果如
图 3. 在C2C12数据集上的相差显微镜图像中的有丝分裂位点的结果。(a)第918帧检测结果;(b)第952帧检测结果;(c)第782帧检测结果;(d)第902帧检测结果
Fig. 3. Results of mitosis locations in phase-contrast microscopy image on C2C12 dataset. (a) Detection result of 918th frame; (b) detection result of 952nd frame; (c) detection result of 782nd frame; (d) detection result of 902nd frame
4 结论
提出一种新的特征表示框架来表示有丝分裂事件,池化时间序列可以表示细胞子序列帧之间的时间关系,其思想是追踪特征描述符值随时间的变化趋势,并将其汇总以表示细胞序列中的外观。除此之外,本文的表示框架通用性很强,它能够处理任何类型的低级特征描述符,对比实验也证明了本方法的优越性。但是由于在细胞分裂过程中,细胞位置的动态变化会影响候选序列的提取,因此最终提取到的静态候选序列对整个有丝分裂事件的描述是不完全的,这必然会对有丝分裂事件的特征表示产生影响,进而降低识别结果的精度。这是当前有丝分裂事件检测领域的难点,也是未来研究的方向。
[1] Gao Y, Zhang H W, Zhao X B, et al. Event classification in microblogs via social tracking[J]. ACM Transactions on Intelligent Systems and Technology, 2017, 8(3): 35.
[2] Gao Y, Zhen Y, Li H J, et al. Filtering of brand-related microblogs using social-smooth multiview embedding[J]. IEEE Transactions on Multimedia, 2016, 18(10): 2115-2126.
[3] SivaP, Brodland GW, ClausiD. Automated detection of mitosis in embryonic tissues[C]∥Fourth Canadian Conference on Computer and Robot Vision (CRV '07), May 28-30, 2007, Montreal, Que., Canada. New York: IEEE, 2007: 9830332.
[4] Ma ML, Shi YH, Li WB, et al. A novel two-stage deep method for mitosis detection in breast cancer histology images[C]∥2018 24th International Conference on Pattern Recognition (ICPR), August 20-24, 2018, Beijing, China. New York: IEEE, 2018: 3892- 3897.
[5] 单倩文, 郑新波, 何小海, 等. 基于改进多尺度特征图的目标快速检测与识别算法[J]. 激光与光电子学进展, 2019, 56(2): 021002.
[7] 张宏伟, 张凌婕, 袁小锋, 等. 基于离散余弦变换特征和隐马尔科夫模型的铜熔炼过程烟雾分级[J]. 激光与光电子学进展, 2018, 55(12): 121504.
[8] Liang LC, Zhou XB, Li FH, et al. Mitosis cell identification with conditional random fields[C]∥2007 IEEE/NIH Life Science Systems and Applications Workshop, November 8-9, 2007, Bethesda, MD, USA. New York: IEEE, 2007: 9- 12.
[9] Su YT, YuJ, Liu AN, et al. Cell type-independent mitosis event detection via hidden-state conditional neural fields[C]∥2014 IEEE 11th International Symposium on Biomedical Imaging (ISBI), April 29-May 2, 2014, Beijing, China. New York: IEEE, 2014: 222- 225.
[11] ThibaultG, AnguloJ. Efficient statistical/morphological cell texture characterization and classification[C]∥Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012), November 11-15, 2012, Tsukuba, Japan. New York: IEEE, 2012: 2440- 2443.
[12] LiK, Yin JP, LuZ, et al. Multiclass boosting SVM using different texture features in HEp-2 cell staining pattern classification[C]∥Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012), November 11-15, 2012, Tsukuba, Japan. New York: IEEE, 2012: 170- 173.
[13] ChoiJ, Jeon WJ, Lee SC. Spatio-temporal pyramid matching for sports videos[C]∥Proceeding of the 1st ACM international conference on Multimedia information retrieval - MIR '08, October 30-31, 2008, Vancouver, British Columbia, Canada. New York: ACM, 2008: 291- 297.
[14] 史紫腾, 王知人, 王瑞, 等. 基于卷积神经网络的单幅图像超分辨[J]. 激光与光电子学进展, 2018, 55(12): 121001.
[15] Vapnik VN. The nature of statistical learning theory[M]. New York, NY: Springer, 2000: 13- 20.
[16] Liu L, Chen J, Fieguth P, et al. From BoW to CNN: two decades of texture representation for texture classification[J]. International Journal of Computer Vision, 2019, 127(1): 74-109.
[17] DengJ, DongW, SocherR, et al. ImageNet: a large-scale hierarchical image database[C]∥2009 IEEE Conference on Computer Vision and Pattern Recognition, June 20-25, 2009, Miami, FL, USA. New York: IEEE, 2009: 248- 255.
Article Outline
陈闯, 贾文武, 王亚. 基于时域演化特征的细胞有丝分裂事件识别与检测[J]. 激光与光电子学进展, 2019, 56(24): 241007. Chuang Chen, Wenwu Jia, Ya Wang. Recognition and Detection of Mitosis Event Based on Feature of Evolution in Time Domain[J]. Laser & Optoelectronics Progress, 2019, 56(24): 241007.