基于卷积神经网络与显微高光谱的胃癌组织分类方法研究 下载: 1070次
1 引言
由于饮食习惯和地域环境等因素影响,我国胃癌发病率一直居高不下,全球每年40%的新发病例都在我国[1],因此能否对胃癌进行及时准确的诊断显得尤为重要。目前,组织病理学仍是胃癌等疾病诊断的“金标准”[2]。病理学家通常需要对病理切片进行固定、染色等一系列处理,诊断过程繁琐费时,工作量大,诊断结果容易受人为经验的影响。随着新型医学成像技术与医学影像学的快速发展,现有的组织病理学有望在计算机辅助分析的基础上,得到更大的进步。
高光谱成像技术融合了光谱分析和光学成像两项传统光学诊断方法[3-6],而医学显微高光谱成像技术则是建立在临床医学、影像学、病理组织分析等多门学科之上的综合交叉技术。对光谱进行分析可以获得生物组织样本上某一点在感兴趣波长范围的完整光谱[7],从而对不同病理组织的化学组成和物理特征进行分析;光学成像技术则提供了各显微组织的空间分布信息,直观地呈现了不同的病理结构。因此,医学显微高光谱将二维图像信息与一维光谱信号结合成为一个三维的数据立方体,它不仅包含了丰富的空间信息,还包含了反映生物组织特性的光谱信息,这样能够准确区分不同的病理组织成分。2012年,Akbari等[8]在获取肺部转移肿瘤在450~950 nm处显微高光谱图像的基础上,利用支持向量机(SVM)进行分类,对肺癌转移组织的检测灵敏度为92.6%;2015年,刘洪英等[9]利用显微超光谱成像系统采集了运动神经细胞和感觉神经细胞的光谱数据,利用改进的光谱角制图(SAM)算法实现了神经细胞的分类。近年来,高光谱技术的新应用--医学病理组织的显微高光谱研究,无论是在样本制备、数据采集、数据预处理等方面,还是在进一步的建模分析等方面都还有较大的改进空间,总体来说仍处于初步摸索阶段[10-14]。
深度学习是当前人工智能领域的研究热点,自从Hinton等[15]提出深度学习理论以来,其已在图像分类、目标检测、面部识别等领域得到了广泛应用。深度学习通常需要构建多层神经网络,涉及到不同层次的数据表达,通过无监督学习进行初始化,以监督学习的方式进行模型微调。这种结构可以从浅层表现中学习到更本质的深层特征,利于提取数据的抽象特征和不变特征。在比较成熟的几类深度模型中,卷积神经网络(CNN)是最具代表性的模型之一[16-17],其特有的权值共享和局部连接理论,使得CNN拥有更丰富的生物学意义,应用范围扩展到了语音识别和生物医学图像等领域,在各类任务中均取得了突出成果。对于高光谱图像处理,CNN在提取复杂光谱特征的有效结构和训练方法等方面仍需进一步研究。
因此,本文将CNN模型应用于显微高光谱图像的分类任务中,通过对光谱信息进行分析预处理,研究了合适高效的CNN模型架构,以提取胃癌组织的深层光谱特征,并实现准确分类。
2 方法原理
2.1 CNN
CNN是在局部连接理论基础上构建的深度神经网络,由输入层、隐含层和输出层组成。隐含层通常包括若干个卷积层、池化层和全连接层。局部连接的思想来源于生物学中的视觉系统结构,人类视觉表层的神经元就是接收局部信息的,只对某些特定区域刺激做出响应。如
总体来说,通过多层结构,CNN将数据的初始浅层特征逐渐转化为深层特征,然后通过逻辑回归(LR)等操作即可完成复杂的分类任务。其训练过程主要分为前向传播和反向传播两部分:前向传播是用当前网络参数对输入数据进行分类;反向传播用来更新训练参数,使当前分类结果与目标分类结果的差异最小。具体训练过程如
图 2. 医学显微高光谱数据CNN建模流程图
Fig. 2. Flow chart of CNN modeling towards medical micro-hyperspectral data
2.1.1 前向传播
模型参数
式中:
2.1.2 反向传播
在反向传播中,应用mini-batch随机梯度下降法来更新参数,通过最小化代价函数来实现。代价函数定义为
式中:
在每次迭代中需要不断调整
式中:
随着迭代次数逐渐增加,代价函数返回值不断减小,意味着当前输出正接近目标输出,当两者之间的差异足够小时迭代停止,CNN模型训练完成。
2.2 预防过拟合
通常,CNN等深度学习模型应用的对象都有大数据集,训练样本达到数万,甚至数百万级别。但对于高光谱图像,尤其是医学高光谱图像来说,训练样本的获取并不容易,需要医生等专业人员对少量的医学组织材料进行选取、制备、分类和标记,因此可供研究的样本数量通常不多,这就使得网络模型面临过拟合的风险。为了避免过拟合带来的影响,本研究采用组合训练策略,包括ReLU和Dropout方法等[18],根据训练数据结构特点提出了简单高效的CNN模型架构,以便有效改善光谱数据维度较高与训练样本数量较少之间的不平衡。
3 实验部分
3.1 实验仪器与数据采集
本实验采用自主设计的显微高光谱成像仪,系统由高光谱成像仪和生物显微镜组成(如
实验样本来自于西安市中心医院病理科,包括胃癌病理切片和正常胃组织病理切片。其中:胃癌切片8例,来自于4名胃癌患者(每例患者2个病理切片);正常胃组织切片6例,来自于3名正常人体样本。经过H-E染色后,病理医生对胃癌组织与正常组织的范围进行了详细的区分标记。实验时调节光源强度,选取目标区域和调整调焦机构,以保证病理切片处于最佳位置,保持光源强度与物镜放大倍数不变,采集病理切片的显微高光谱图像。
图 4. (a)胃组织显微高光谱数据立方体;(b)像素点光谱曲线提取示意图
Fig. 4. (a) Micro-hyperspectral data cube of gastric tissue; (b) schematic of pixel point spectrum curve extraction
3.2 光谱数据预处理
由于系统光源、光学部件和探测器性能等因素的影响,采集到的原始数据会不可避免地包含各种噪声,这会对图像质量造成一定影响。因此对于后期分类模型的建立,有效的预处理过程至关重要。首先从图像的角度考虑,随机噪声可能产生于数据采集的各个阶段,因其分布是分散且独立的,本实验采用高斯低通滤波来处理噪声;另外,由于探测器阵列的辐射响应不均匀,图像中会出现部分条带噪声,表现为周期性的竖条纹或亮线,根据其与相邻区域(8邻域)亮度值的差异,本实验对每一谱段进行了去条带处理。然后从光谱维的角度考虑,采用Savitzky-Golay(S-G)平滑结合一阶求导的方法,来消除高频噪声和基线偏移的影响。考虑到平滑去噪效果与有效信息保留,将移动窗口宽度设置为7,以实现两者之间的较好平衡。
3.3 样本数据选取
对于预处理之后的图像数据,根据医生标记的胃癌区域与正常组织区域,分别提取典型的光谱曲线。具体方法为:首先去除空白背景区域,保留有效组织信息并划定感兴趣区域(ROI),然后对于任一ROI均提取2个样本点,两者的平均光谱曲线作为此处ROI的特征光谱。考虑到350~410 nm和910~1000 nm两段光谱数据受到噪声干扰较大,将这部分数据剔除,保留410~910 nm共200个谱段的信息作为本次实验的研究对象。训练样本共包括1880条光谱曲线,胃癌组织与胃部正常组织样本各占一半。具体的训练集和测试集划分如
表 1. 样本训练集和测试集统计
Table 1. Statistics of training and test sets of samples
|
4 结果与分析
4.1 光谱分析
训练样本中的2类组织的平均光谱曲线如
式中:
4.2 CNN模型参数的设置
本研究提出的CNN模型是利用keras框架实现的。keras是基于python语言的新型训练模型,可以实现对深度网络更高效的优化、调参和评估过程。通常,深度学习方法会构建多层网络,包含多个卷积层与池化层,因为更深层的神经网络可以代表更复杂的数据。其中:卷积层的应用保证了模型对高维输入降维的同时,能够提取到原始数据的核心特征;池化层通过亚采样使模型具有平移不变性[19],增强了网络整体的泛化能力。考虑到本次显微高光谱数据的波段数以及训练样本数相对较少,过于深层的网络并不利于模型收敛,可能会导致分类效果不佳,因此将2个卷积层与2个池化层进行组合,测试第一类CNN模型(CNN-1)。
在训练过程中,使用70%的训练样本来学习每个神经元的权重参数,剩下的30%作为验证集,用来评估当前网络的性能,确定是否过拟合,从而引导正确的体系结构设计。然后优化模型,重点调整卷积核个数、卷积核尺寸以及全连接层神经元个数,根据模型收敛速率和分类效果再进行针对性的调整。得到的网络具体结构参数如
表 2. 胃癌切片组织CNN分类模型的结构参数
Table 2. Specific parameters of CNN classification model of gastric carcinoma slices
|
图 6. 训练误差与分类准确率随迭代次数的变化趋势
Fig. 6. Variations of training loss and classification accuracy with the number of iterations
观察发现,训练集的分类精度较高且不断提升,但验证集的精度变化较大。测试集的效果也并不理想,原因在于2个卷积层的结构仍相对复杂,对于输入的数据来说有过拟合的风险。因此将卷积层和池化层个数减到1,测试第二类更简单、更高效的CNN模型。为了提升调优效率,对2组参数(CNN-2,CNN-3)同时测试并分析、对比结果,具体结构参数如
实验中训练迭代了100次之后,模型逐渐收敛到最佳。CNN-3共包含5层,包括输入层、卷积层、池化层、全连接层以及输出层。其中,输入层包括200个节点,卷积层的每个特征图包括(200-17+1)=184个节点,卷积层与输入层之间包括22×(17+1)=396个参数,全连接层与池化层之间包括[22×(184/4)+1]×100=101300个参数,所有的可训练参数个数之和达到了10万级别。在测试集上验证,得到分类准确率为95.71%,证明此模型在得到较高准确率的同时有效抑制了过拟合。这表明本次实验提出的CNN模型具有提取细微光谱特征的能力。
4.3 与其他方法对比
在本组实验中,将CNN-3模型与传统神经网络(NN)以及SVM进行比较,探讨3种模型对高光谱数据分析的差异。其中,神经网络设置3个隐藏层,模型结构为输入(200)-全连接(60)-全连接(40)-全连接(20)-输出(2)。SVM使用径向基函数(RBF)作为内核,对于模型中的2个可选择参数
表 3. 3类模型的分类结果
Table 3. Classification results obtained by three kinds of models
|
5 结论
将高光谱成像技术应用于生物医疗领域已成为目前研究的热点,现有的数据处理算法多为主成分分析和SVM等传统方法。本研究针对胃癌组织高光谱数据,提出了一个包含单层卷积层的CNN分类模型,实现了对胃癌病变组织与胃部正常组织的高效鉴别,说明了两者在组织病理层面具有光谱特征差异,也证明了深度学习方法应用于此类显微高光谱图像的可行性。本研究提出的CNN模型结构相对简单且易训练,可以推广至其他医学组织研究中,如病理成分更复杂的部分浸润癌或癌前病变研究中。下一部工作将引入高光谱图像维特征,提取病理组织结构纹理特点,并与光谱维信息联合建模,以进一步提升模型的分类性能。
[3] Luo B, Zhang L. Robust autodial morphological profiles for the classification of high-resolution satellite images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 52(2): 1451-1462.
Luo B, Zhang L. Robust autodial morphological profiles for the classification of high-resolution satellite images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 52(2): 1451-1462.
[4] 侯榜焕, 姚敏立, 王榕, 等. 面向高光谱图像分类的空谱半监督局部判别分析[J]. 光学学报, 2017, 37(7): 0728002.
侯榜焕, 姚敏立, 王榕, 等. 面向高光谱图像分类的空谱半监督局部判别分析[J]. 光学学报, 2017, 37(7): 0728002.
[6] 候华毅, 方朝晖, 张元志, 等. 皮肤胆固醇无创光谱检测模拟和在体实验研究[J]. 中国激光, 2016, 43(9): 0907001.
候华毅, 方朝晖, 张元志, 等. 皮肤胆固醇无创光谱检测模拟和在体实验研究[J]. 中国激光, 2016, 43(9): 0907001.
[7] 董安国, 李佳逊, 张蓓, 等. 基于谱聚类和稀疏表示的高光谱图像分类算法[J]. 光学学报, 2017, 37(8): 0828005.
董安国, 李佳逊, 张蓓, 等. 基于谱聚类和稀疏表示的高光谱图像分类算法[J]. 光学学报, 2017, 37(8): 0828005.
[8] AkbariH, Halig LV, Zhang HZ, et al. Detection of cancer metastasis using a novel macroscopic hyperspectral method[C]. SPIE, 2012, 8317: 831711.
AkbariH, Halig LV, Zhang HZ, et al. Detection of cancer metastasis using a novel macroscopic hyperspectral method[C]. SPIE, 2012, 8317: 831711.
[9] 刘洪英, 顾文荃, 李庆利, 等. 超光谱成像技术应用于神经分类的研究[J]. 光谱学与光谱分析, 2015, 35(1): 38-43.
刘洪英, 顾文荃, 李庆利, 等. 超光谱成像技术应用于神经分类的研究[J]. 光谱学与光谱分析, 2015, 35(1): 38-43.
[14] 原江伟, 张春光, 王号, 等. 基于声光可调滤波器的肺癌组织快速显微光谱成像[J]. 中国激光, 2018, 45(4): 0407003.
原江伟, 张春光, 王号, 等. 基于声光可调滤波器的肺癌组织快速显微光谱成像[J]. 中国激光, 2018, 45(4): 0407003.
[16] LecunY, BottouL, BengioY, et al. Gradient-based learning applied to document recognition[C]. Proceedings of the IEEE, 1998, 86( 11): 2278- 2324.
LecunY, BottouL, BengioY, et al. Gradient-based learning applied to document recognition[C]. Proceedings of the IEEE, 1998, 86( 11): 2278- 2324.
[17] KarenS, AndrewZ. Very deep convolutional networks for large-scale image recognition[C]. Proceedings of ICLR, 2015: 1- 14.
KarenS, AndrewZ. Very deep convolutional networks for large-scale image recognition[C]. Proceedings of ICLR, 2015: 1- 14.
Article Outline
杜剑, 胡炳樑, 张周锋. 基于卷积神经网络与显微高光谱的胃癌组织分类方法研究[J]. 光学学报, 2018, 38(6): 0617001. Jian Du, Bingliang Hu, Zhoufeng Zhang. Gastric Carcinoma Classification Based on Convolutional Neural Network and Micro-Hyperspectral Imaging[J]. Acta Optica Sinica, 2018, 38(6): 0617001.