乳腺癌是世界上对于女性非常危险的疾病, 其患病率逐年增长, 是世界妇女死亡的主要原因。 在大样本情况下, 乳腺癌临床诊断受优质医疗资源相对短缺的限制, 诊断周期长、 检测费用高。 因此, 高效、 准确、 性价比高的乳腺癌诊断方法具有广阔的应用前景, 为临床诊断迫切需求。 荧光光谱检测是一种可以表征细胞中物理和化学综合变化的方法, 可用于表征正常和癌变细胞的特征。 机器学习擅长从大量数据中挖掘有用信息, 是进行分类和预测的有效手段。 以往机器学习多使用包含部分生化信息的数据库训练模型, 易导致信息缺失。 荧光光谱是细胞多种物质的叠加光谱, 使用荧光光谱特征峰诊断乳腺癌存在量化不确定性问题。 因此, 提出了机器学习结合乳腺癌样本荧光光谱的诊断方法。 使用405 nm波长的激光, 采集了正常和癌变乳腺组织(已做出病理诊断)的荧光光谱数据, 以此作为数据集, 比较了K-近邻(KNN)、 支持向量机(SVM)、 随机森林(RF)三种算法对正常和癌变乳腺组织荧光光谱的分类能力。 判别结果显示: 与SVM算法相比, KNN和RF算法的准确率更高、 平衡召回率和精度的能力更强, 对乳腺癌荧光光谱的分类能力更好, 其准确性、 召回率、 精度以及F1-score函数结果均在95%之上, 更利于乳腺癌的诊断。 进而探讨了权重KNN(WKNN)算法对正常和癌变乳腺组织荧光光谱的分类能力。 WKNN较KNN算法的分类评估结果有小幅度提升, 且具有更好的抗噪和适应能力, 算法简单。 综上所述, 本文提出的机器学习结合荧光光谱的乳腺癌诊断方法, 精度高、 速度快、 性价比高, 是未来乳腺癌诊断方法的发展方向, 具有重要的临床应用价值。
荧光光谱 乳腺癌 机器学习 Fluorescence spectrum Breast cancer Machine learning K-nearest Neighbor KNN 光谱学与光谱分析
2023, 43(8): 2407
乳腺组织自体荧光光谱法通常采用420~512 nm波段的光源,本次实验采用波长为405 nm的激光源获取乳腺组织切片的自体荧光光谱,避免了活体检测时脂肪和血液对光谱的干扰。荧光光谱是多种发光基团的叠加光谱,基于荧光光谱对乳腺癌细胞的生化信息进行定性和定量分析时,光谱特征峰不易分辨。本文提出了高斯函数拟合乳腺组织切片荧光光谱的方法,该方法可有效分离重叠峰。与正常组织相比,癌变组织的荧光特征峰出现了明显的红移现象。通过面积比值法分析了正常与癌变乳腺组织中荧光物质的差异,癌变组织在517 nm和635 nm处的峰面积与492 nm处的峰面积之比(A517/A492和A635/A492)分别是正常组织的2.4~5.5倍和5.4~8.5倍,可作为诊断乳腺癌的标准。最后,本文分析了支持向量机(SVM)算法对乳腺组织荧光光谱进行分类的可行性,分类准确率为87.50%,为乳腺癌的快速诊断提供了新方向。
医用光学 高斯函数拟合 乳腺癌 荧光光谱 支持向量机 中国激光
2022, 49(20): 2007106