基于支持向量机和关联成像的分类方法研究【增强内容出版】
1 引言
在机器学习中,分类问题是基础,由分类问题可以演变出很多应用,同时许多问题也可以转化为分类问题[1]。解决分类问题一般通过样本训练一个机器学习模型,训练完毕后,模型可被应用于预测样本的类别。模型的训练和预测过程依赖于物体的图像,对于一些无法直接获取物体图像的情况,分类往往无法进行。为此,人们将关联成像技术[2-3]引入了机器学习。
关联成像,也称为“鬼”成像,是基于量子纠缠或者经典光场涨落的关联特性,通过参考光场与目标探测光场之间的强度关联非局域地获取目标物体信息的一种新型成像技术。关联成像系统中有两支光路:其中一支光路用一个无空间分辨能力的桶探测器来接收散斑照射物体后的光场信号,这支光路被称为信号光路;另一支光路由具有空间分辨能力的探测器接收散斑传输一段距离后的光场信号,这支光路则被称为参考光路。最后对两支光路探测器的结果进行关联计算就可以在参考光路上得到物体的恢复图像。关联成像近年来发展迅速,计算“鬼”成像[4]、赝热光“鬼”成像[5]等新型关联成像相继被提出。随着成像性能的提高,各种基于关联成像的技术被广泛应用于医学、加密等领域[6-10]。然而,目前为止没有见到关联成像在分类方法中的应用报道。
支持向量机(SVM)是一种按监督学习方式对数据进行二元分类的广义线性分类器,其主要思想是对训练样本求解最大边距超平面[11-13]。由于SVM能够通过不同的核函数生成非线性决策边界,因此SVM在不同分类问题上具有出色的表现。
本文在SVM方法中引入线性判别分析(LDA)[14-16]和关联成像,提出了一种未知物体分类方法。该方法利用LDA提取物体的特征向量并以此设计对应的特征散斑,令特征散斑照射物体并利用桶探测器来获取照射后的光场信号;SVM根据获取的光场信号学习决策超平面,完成学习后的SVM可以通过特征散斑照射测试物体生成的桶探测器值来输出物体类别。该方法利用了关联成像的特性,解决了在无法直接获取物体图像情况下的分类问题。
在MNIST手写体数字集上验证了所提方法的可行性。现有的分类方法都是在获取清楚图片的基础上进行的。所提方法充分利用关联成像的“鬼”特性,通过LDA提取手写数字图片的特征向量,并以此设计用于关联成像的特征散斑;当特征散斑照射待测未知的手写体数字图片时,可以获得对应的桶探测器值;通过对桶探测器值进行SVM,输出未知手写数字的类别。该方法可通过极少的特征散斑获得未知手写体数字图片的分类。
2 基于SVM和关联成像的分类方法
基于SVM和关联成像的分类方法的原理图如
图 1. 基于SVM和关联成像的分类方法原理图
Fig. 1. Schematic diagram of the classification method based on SVM and correlation imaging
2.1 特征散斑设计
特征散斑是利用LDA进行设计的。LDA的目标是找到投影矩阵
类内散度矩阵
LDA的目标函数[14]表示为
式中,
式中,
矩阵
2.2 关联成像
在得到特征散斑后,利用特征散斑进行关联成像过程。首先将特征散斑载入数字微反射镜(DMD),使用激光器照射DMD,物体经反射产生特征散斑光场。在成像光路中,令特征散斑光场照射物体
2.3 SVM分类
SVM需要根据训练集学习决策超平面。训练集
对于第
式中,上标表示
对于新样本,采用投票策略进行分类。每个SVM根据决策函数对新样本
3 仿真与实验结果
在MNIST数据集上对所提方法进行仿真,仿真中样本为数字“0”到数字“9”的手写体数字图像,其中有60000个训练样本和10000个测试样本。各手写体数字图片的像素尺寸为28 pixel×28 pixel。由于需要对未知数字图片进行十分类,因此,设计了9个用于照射未知手写体数字图片的散斑。
为了说明手写体数字识别问题的难度,首先测试了图像为同一个数字时所提方法的分类效果。
图 2. 数字“2”的部分图像及分类结果。(a)相同手写数字的辨别结果;(b)桶探测器值随散斑的变化曲线
Fig. 2. Partial images and classification results of the digit"2". (a) Discrimination of identical handweitten digits; (b) variation curves of bucket detection values against patterns
进一步对不同数字进行实验和仿真分类,结果如
图 3. 不同数字的分类结果。(a)实验设置;(b)实验与仿真结果
Fig. 3. Classification results of different digits. (a) Experimental setup; (b) experimental and simulation results
为了进一步测试所提方法的性能,逐一对测试集中10类数字进行了预测,测试结果的准确率如
为了进一步说明所提方法的优势,将所提方法在散斑相同的条件下与随机森林、KNN、逻辑回归、高斯朴素贝叶斯和决策树5个不同的机器学习分类方法进行了对比。
图 5. 不同分类方法在MNIST数据集上的分类准确率
Fig. 5. Classification accuracy of different classification methods on the MNIST dataset
4 结论
本文提出了一种基于SVM和关联成像的未知物体分类方法。与需要已知物体情况才能分类的方法不同,由于包含关联成像过程,所提方法可以对未知物体进行分类。首先通过LDA提取物体的特征向量并以此设计特征散斑,再通过特征散斑照射物体获得桶探测器值;SVM根据桶探测器值和类别学习决策超平面,完成学习后的SVM可以根据新物体的桶探测器值准确预测其类别。所提方法的可行性在MNIST数据集上得到了验证并取得了90.5%的分类准确率,与其他分类方法的仿真结果对比表明了所提方法在分类问题上更具优势。
[1] Janiesch C, Zschech P, Heinrich K. Machine learning and deep learning[J]. Electronic Markets, 2021, 31(3): 685-695.
[2] 郑佳慧, 俞晓迪, 赵生妹, 等. 基于均值滤波的关联成像去噪[J]. 光学学报, 2022, 42(22): 2211002.
[3] Gatti A, Brambilla E, Bache M, et al. Correlated imaging, quantum and classical[J]. Physical Review A, 2004, 70(1): 013802.
[4] Shapiro J H. Computational ghost imaging[J]. Physical Review A, 2008, 78(6): 061802.
[5] 宗岩峰, 郑淮斌, 吴鑫伟, 等. 基于时序控制的赝热光鬼成像系统[J]. 光学学报, 2023, 43(7): 0711001.
[6] Liu J F, Wang L, Zhao S M. Orthogonal-triangular decomposition ghost imaging[J]. Chinese Physics B, 2022, 31(8): 084202.
[7] Clemente P, Durán V, Torres-Company V, et al. Optical encryption based on computational ghost imaging[J]. Optics Letters, 2010, 35(14): 2391-2393.
[8] Xu C X, Li D K, Guo K, et al. Computational ghost imaging with key-patterns for image encryption[J]. Optics Communications, 2023, 537: 129190.
[9] Pelliccia D, Rack A, Scheel M, et al. Experimental X-ray ghost imaging[J]. Physical Review Letters, 2016, 117(11): 113902.
[10] 侯明轩, 侯昌伦. 关联成像应用及其最新进展[J]. 激光与光电子学进展, 2023, 60(2): 0200003.
[11] Hearst M A, Dumais S T, Osuna E, et al. Support vector machines[J]. IEEE Intelligent Systems and Their Applications, 1998, 13(4): 18-28.
[12] 马永杰, 马芸婷, 陈佳辉. 结合卷积神经网络多层特征和支持向量机的车辆识别[J]. 激光与光电子学进展, 2019, 56(14): 141001.
[13] Noble W S. What is a support vector machine?[J]. Nature Biotechnology, 2006, 24(12): 1565-1567.
[14] Sharma A, Paliwal K K. Linear discriminant analysis for the small sample size problem: an overview[J]. International Journal of Machine Learning and Cybernetics, 2015, 6(3): 443-454.
[15] Balakrishnama S, Ganapathiraju A. Linear discriminant analysis: a brief tutorial[J]. Institute for Signal and Information Processing, 1998, 18(1998): 1-8.
[16] Zhu F, Gao J B, Yang J, et al. Neighborhood linear discriminant analysis[J]. Pattern Recognition, 2022, 123: 108422.
吴逸华, 何峥, 赵生妹. 基于支持向量机和关联成像的分类方法研究[J]. 激光与光电子学进展, 2024, 61(10): 1011008. Yihua Wu, Zheng He, Shengmei Zhao. Classification Method Based on Support Vector Machine and Correlation Imaging[J]. Laser & Optoelectronics Progress, 2024, 61(10): 1011008.