中国激光, 2021, 48 (6): 0602108, 网络出版: 2021-03-15   

基于级联支持向量机的飞秒激光烧蚀光斑分类 下载: 605次

Spot Ablated by Femtosecond Laser Classification Based on Cascaded Support Vector Machine
作者单位
1 华北理工大学电气工程学院, 河北 唐山 063210
2 卡尔加里大学机械及制造工程系, 加拿大卡尔加里 T2N 1N4
摘要
为了对光斑图像进行精确分类,提出优化的级联支持向量机(SVM)分类器。首先通过SVM分类器并采用质心特征对光斑进行一级分类,得到一类被正确地分类到相对应的运动状态,称为R光斑,其中包括一级拖尾方向为左上(UP)光斑和一级拖尾方向为左下光斑(DN),另一类被错误分类,称为E光斑。然后,对一级DN光斑进行叠加并求取均值,得到均值光斑。为了进一步得到标准模型使其与每个一级DN光斑相似度尽可能最大,将均值光斑放入GAN中进行训练。最后,利用结构相似度计算E光斑与标准模型的相似度,对E光斑进行二级SVM分类,产生二级UP和DN光斑。将其与一级光斑合并,则为最终的分类结果。对功率分别为10,20,50 mW下的光斑图像进行分类,对应的分类精度为100%、100%和98.5%。相比于传统的分类方法,对应的分类精度提升5~9个百分点,12~16个百分点和9.0~15.5个百分点,说明该分类器具有明显的优越性。
Abstract

Objective Femtosecond laser micromachining technology has excellent three-dimensional (3D) processing capabilities and provides significant advantages in the production of experimental materials with complex 3D structural features. However, the continuous improvement of ablation efficiency and accuracy is still an eternal topic. The femtosecond laser ablation of monocrystalline silicon is accompanied by the luminescence phenomenon derived from the plasma. During the movement of the three-degree-of-freedom motion control platform in 3D space, the plasma spot produces different forms, particularly during the reciprocating ablation process in the X direction, and two distinct spot forms appear. The trailing direction of the light spot is the upper and lower left when moving forward and backward, respectively. The optimized cascaded support vector machine (SVM) classifier is used to accurately classify and analyze the light spot and can explore the ablation efficiency and accuracy in different ablation directions.

Methods First, the SVM classifier uses the feature of the spot centroid to classify the light spots at the first level. Then, we introduce the means of upper and lower peer lines and obtain two types of light spots. One type is correctly classified into the corresponding ablation direction, called the R light spot, which includes the first-level UP light spot (the trailing direction is the upper left) and first-level DN spot (the trailing direction is the lower left). The other type is incorrectly classified into the opposite ablation direction, called the E spot. Next, the first-level DN spot is superimposed, and the average value is calculated to obtain the average spot. To further obtain the standard model to maximize the similarity of each first-level DN spot, the mean spot is placed into a generative adversarial network (GAN) for training and generation. Compared with random noise, the use of average light spots can reduce the number of training and produce a final generated image more similar to the standard model. Finally, SSIM is used to calculate the similarity between the E spot and standard model, and the E spot is classified using the second-level SVM to generate the second-level UP and DN. Combining the E spot with the first-level UP and DN spots, the final classification result is achieved.

Results and Discussions Using this method, the classification accuracy is 100% under the processing power of 10 mW. In the entire ablation cycle, 34 spots are produced corresponding to the two trailing directions in the two ablation directions. Under 20 mW, the classification accuracy is also 100%. Each half of the ablation cycle produces 33 light spots in the same trailing direction. The deviation is the classification result under 50 mW, and its accuracy is 98.5%. There should be 66 light spots in the same motion state every half cycle; in the second half cycle, one light spot is not correctly classified in the classification result. In the entire time series, only two spots are misclassified, which is close to 100%, and the classification effect is significantly improved. To verify the accuracy of the cascaded SVM classifier in the classification of different states of light spots generated under different ablation directions, three classification methods of histogram of oriented gradient (HOG)-SVM, local binary mode (LBP)-SVM, and Gaussian pyramid (GP)-SVM are compared. Among them, HOG is constructed by calculating and counting the histogram of the gradient direction of the local area of the image operating on the image local grid unit and maintaining good invariance of the image deformation. LBP is an operator that can effectively measure and extract local texture information of an image. It has significant advantages such as nonrotational deformation and gray invariance. GP downsamples the image to obtain partial information of the image. Compared with the traditional HOG-SVM, LBP-SVM, and GP-SVM classification methods, the classification accuracy of the cascaded SVM classifier is increased by 5 to 9 percentage points, 12 to 16 percentage points and 9.0 to 15.5 percentage points 10, 20, and 50 mW, respectively. The cascaded SVM classifier delivers nearly 100% classification accuracy for the spot when using each level of processing power, which has obvious advantages.

Conclusions To classify the different forms of light spots in the femtosecond laser ablation process of single crystal silicon, an optimized cascaded SVM classifier is used. First, the first-level classification is performed based on the spot centroid feature. Then, the standard model is established by generating confrontation GAN. Next, the second-level SVM classification is performed using the structural similarity SSIM of the misclassified spot and the standard model. The classification results are remarkable. A better understanding of the movement state of the light spots can aid further exploration of the law of ablation. It has an indelible effect on the improvement of ablation efficiency and accuracy.

1 引言

由于飞秒激光微加工技术具备卓越的三维加工能力,因此在制作具有复杂三维结构特征的实验材料时具有显著优势,然而不断提高烧蚀效率和精度仍是一个亘古不变的话题。

飞秒激光烧蚀单晶硅的过程中,采集到的序列光斑图像与烧蚀效果有直接关系。三自由度运动控制平台在沿着X方向往复移动的过程中,每一个烧蚀周期的光斑都会呈现两种不同的运动状态,此时需对光斑进行精准分类。对光斑的形态特征进行分析能够进一步探究加工规律,进而提高烧蚀效率与精度。

在机器学习中,支持向量机(SVM)[1-3]的监督学习模型与相关的学习算法可以用于数据分类和回归分析。SVM其是一种二类分类模型[4],基本模型定义为特征空间上间隔最大的线性分类器,学习策略便是间隔的最大化,最终可转化为一个凸二次规划问题的求解。SVM在很多诸如文本分类、图像分类、生物序列分析、生物数据挖掘和手写字符识别等领域有很多的应用范围。

HOG特征[5]、LBP特征[6]、Haar特征[7]、SIFT特征[8]、SURF特征[9]、PCA特征[10]和LDA特征[11]等常与SVM分类器结合,广泛应用于图像识别与分类等。图像的特征描述子[12]不仅应该具有很强的不变性,还应该具有很强的可区分性。Wang等[6]使用HOG特征对SVM分类器进行了训练和优化,可以对油棕树进行精确计数。Kumar等[7]提出了一种新的自动实时FED(Facial Expression Detection)算法,该算法使用径向基函数对Haar小波进行变换用于特征提取,并将RBF-SVM(Radial Basis Function-SVM)用于分类。Sirajudeen等[13]基于多尺度LBP和SVM分类器对糖尿病患者的病变视网膜进行了有效的概率多标记病变分类。综上可知,国内外的研究在此领域都取得了不错的成果。

结合多种分类方式的经验,本文提出优化的级联SVM分类方法,其中第一级SVM分类方法结合质心特征,第二级SVM分类方法结合结构相似性(SSIM)[14],通过生成对抗网络(GAN)[15]生成标准模型。将所提方法与传统方法进行比较,精度有大幅度的提升。

2 飞秒激光烧蚀平台

飞秒激光广泛应用于微加工领域,使用高能量的激光束烧蚀样品可以获得各种微尺度结构。实验中的烧蚀样品为P型掺杂(硼)单晶硅片,通过三自由度运动控制平台的移动来完成对单晶硅在三维空间的烧蚀。飞秒激光脉冲沿着Z方向垂直于硅片进行微结构的深度方向烧蚀。三自由度运动控制平台沿着X方向往复一次为一个烧蚀周期,每半个烧蚀周期沿着Y方向步进2 μm,按此规律完成X-Y平面的烧蚀。飞秒激光烧蚀平台如图1所示。

图 1. 飞秒激光烧蚀平台

Fig. 1. Femtosecond laser ablation platform

下载图片 查看所有图片

在飞秒激光烧蚀单晶硅的过程中,伴随着离子体的发光,使用CCD(Charge Coupled Device)相机来采集序列光斑图像。由于三自由度运动控制平台沿着X方向往复移动并对单晶硅进行烧蚀,此时光斑呈现两种运动状态。沿着X轴正向移动,光斑的拖尾方向为左上,沿着X轴反向移动,光斑的拖尾方向为左下[16]。对不同加工参数下的光斑图像进行精准分类研究,有助于把握其烧蚀规律,对烧蚀深度的探究可以起到推动作用。图2为三种功率下选取的部分光斑拖尾方向为左上(第一行)和左下(第二行)的两种运动状态。

图 2. 光斑在不同功率下的两种形态。(a)10 mW;(b)20 mW;(c)50 mW

Fig. 2. Two forms of light spot at different powers. (a) 10 mW;(b) 20 mW;(c) 50 mW

下载图片 查看所有图片

3 光斑分类

虽然不同的烧蚀方向对应的光斑呈现不同的运动状态,但是加工设备存在的误差和周围环境的影响会导致光斑不稳定,而且光斑非常小,灰度级较低,因此较难判读并区分光斑的运动状态。于是,采用优化的级联SVM分类器对光斑进行分类。首先一级SVM分类器利用光斑的质心特征进行初次分类,得到一类是被正确地分类到相对应的运动状态,称为R光斑,其中包括一级拖尾方向为左上(UP)的光斑和一级拖尾方向为左下(DN)的光斑,另一类被错误分类,称为E光斑;然后通过GAN生成代表两种光斑的标准模型;最后通过各个光斑与标准模型之间的相似特征进行二级SVM分类。整体的操作流程如图3所示。

图 3. 级联SVM分类流程

Fig. 3. Classification process of cascaded SVM

下载图片 查看所有图片

3.1 一级质心特征SVM分类

SVM[17]是从瓦普尼克(Vapnik)的统计学习理论发展而来的,主要是对小样本数据进行学习、分类和预测的一种方法,其基本模型是在特征空间上找到最佳的分离超平面,使得训练集上正、负样本间隔最大。

一级SVM分类器,如图3&1所示。使用的是光斑图像的质心特征,质心是光斑位置和整体运动状态的一个很好的表达方式。不同功率下序列光斑的质心位置,如图4所示。为了判断每种运动状态下光斑的个数是否一致,选取图像中必须包含一个完整的烧蚀周期产生的光斑图像。在10 mW和20 mW的加工功率下选取连续时间序列的100个光斑图像,而在加工功率为50 mW的条件下选取200个光斑图像。

图 4. 序列光斑在不同功率下的质心位置。(a)10 mW;(b)20 mW;(c)50 mW

Fig. 4. Centroid coordinates of sequential spots at different powers. (a) 10 mW; (b) 20 mW; (c) 50 mW

下载图片 查看所有图片

图4可以看到,三自由度运动控制平台沿着X方向往复运动的过程中,光斑呈现的两种运动状态对应的质心点也分布在两个不同的范围;当沿着X正方向移动时,质心点分布在较高的范围内,对应的光斑向左上拖尾,反之则分布在较低的范围内,对应的光斑向左下拖尾。根据这些质心点,显然可以使用SVM分类器将这些数据分成两类。如果使用aY表示质心点坐标,类别可以取1或者-1,分别代表两个不同的类。一个线性分类器的学习目标便是在N维的数据空间中找到一个超平面 [18],这个超平面的方程可以表示为

wTaY+b=0,(1)

式中:w为超平面的法向量;b为截距。SVM[19]就是使这个超平面和离其最近的质心点之间的距离尽可能大,这样有利于将分布在两个范围内的质心点明确分离出来。根据质心特征得到的一级SVM分类结果如图5所示,其中 “实心圆点”表示R光斑,而“叉号”则表示E光斑。

图 5. 不同功率下的一级SVM分类结果。(a)10 mW;(b)20 mW;(c)50 mW

Fig. 5. First-level SVM classification results under different powers. (a) 10 mW; (b) 20 mW; (c) 50 mW

下载图片 查看所有图片

若分类结果为1,则表示此光斑质心点分布在较高的范围内,也就是此光斑拖尾方向为左上。若分类结果为0,则表示此光斑质心点分布在较低的范围内,对应的拖尾方向为左下。

光斑的不稳定性和质心提取存在的误差,导致一些光斑被错误分类。理想状态下,三自由度运动控制平台沿着X方向往复移动,每半个烧蚀周期所对应的光斑数量应相同的,也就是每半个烧蚀周期下1和0的分类结果是相同的。根据这一特征,引入上下对等线的方式将被错误分类的光斑提取出来。上下对等线的方式如图6所示,其中n为除去初、末位置的光斑个数,0为初位置的光斑个数,n+1为末位置的光斑个数。

图 6. 上下对等线的方式

Fig. 6. Way of upper and lower peer lines

下载图片 查看所有图片

图6虚线以上是分类结果为1的光斑,虚线以下是分类结果为0的光斑。由于初(0)位置和末(n+1)位置不一定为完整的半周期,所以两个位置的光斑数量不一定相同。除此之外的中间过程,比如(1)、(3)和(n-2)的位置都为完整的半个周期,而相邻的如(1)和(2)、(n-1)和(n)为一个完整的烧蚀周期。利用此方式对应到一级分类结果中,保持中间过程的每个部分长度相等,并且使分类结果的每个点尽可能多地落到上下对等线上,可将被错误分类的光斑提取出来。

一级分类结果:10 mW功率下的分类精度为93%,20 mW功率下的分类精度为91%,50 mW功率下的分类精度为86.5%。

3.2 基于GAN-SSIM的二级SVM分类

采用上下对等线的方式对被错误分类的E光斑进行粗提取,因相邻两个半周期之间转换的几个光斑不易精确地区分出来,于是再使用如图3&3的二级SVM分类器将被分类错误的E光斑进行二次分类,通过E光斑与标准模型的结构相似性来判定。但在分类之前,需通过GAN训练生成一个标准模型,如图3&2所示。分类过程如下。

1)在R光斑中,将拖尾方向为左上的光斑挑选出来,称其为一级UP光斑,将拖尾方向为左下的光斑称为一级DN光斑。将所有一级DN光斑图像进行叠加后取平均,表达式为

g¯=i=1ng(x,y)n,(2)

式中:g(x,y)为光斑在(x,y)处的灰度值。得到的均值光斑如图3&2.1.1所示。

2)将均值光斑通过GAN生成一个标准模型,使其与每个一级DN光斑的相似度尽可能最大,并将其作为DN类光斑的代表。

GAN[20-25]的主要灵感源于博弈论中零和博弈的思想,应用到深度学习神经网络上就是通过生成网络G(Generator)和判别网络D(Discriminator)不断博弈,进而使G学习到数据的分布,如果应用到图片生成上,则训练完成后,G可以从一段随机数中生成逼真的图像。

G是一个生成式的网络,其接收一个随机的噪声(随机数),通过这个噪声来生成图像。D是一个判别网络,判别一张图像是不是“真实的”,其输入是一张生成图像和一张真实图像,输出的数值代表生成图像为真实图像的概率,如果概率值为1,就代表100%是真实的图像,而输出为0,就代表不可能是真实的图像[26]

训练过程中,G的目标就是尽量生成真实的图像以欺骗D,而D的目标就是尽量辨别出G生成的假图像和真实图像,这样G和D就构成了一个动态的“博弈过程”,最终的平衡点即纳什均衡点[26]

两个博弈优化过程可表示为

minGmaxDV(D,G)=El~Pdata(l)lbD(l)+Ek~Pk(k)lb1-DG(k),(3)

式中:Pdata(l)为真实数据的概率期望值;Pk(k)为生成数据的概率期望值;l为训练数据;k为生成数据。由随机噪声生成图像,这个过程需要训练很多次才能成形。实验采用图3&2.1的方式将均值光斑(训练数据)与一级DN类光斑(真实值)输入D中,用来判别均值光斑的真实性。如果概率值为1,则均值光斑则为标准模型,若结果为0,则将均值图像作为G的输入。代替掉随机噪声,可以理解为将一个“半成品”作为G的输入以生成标准模型,如图3&2.2所示。联合D,以一级DN光斑作为真实值并判断生成图像的真实性,经过多次训练直到出现数值1为止,如图3&2.3所示。训练过程中,学习率为0.01,动量为0.5,训练次数为1000,先通过前向反馈生成损失函数和判别损失函数,后通过梯度下降最小化损失并更新权值。

由此生成的标准模型不仅减少了GAN的训练次数,而且对于DN类光斑来说,标准模型也比均值图像更为优质。不同功率下DN类光斑的标准模型如图7所示。

图 7. 不同功率下的标准模型。(a)10 mW;(b)20 mW;(c)50 mW

Fig. 7. Standard models at different powers. (a) 10 mW; (b) 20 mW; (c) 50 mW

下载图片 查看所有图片

3)求取一级分类过程中被错误分类的E光斑与标准模型的SSIM,以此作为二级SVM分类器的数据源并对E光斑进行二次分类,如图3&3所示。

SSIM是一种衡量两幅图像相似度的指标,该指标由德州大学奥斯丁分校的图像和视频工程实验室(Laboratory for Image and Video Engineering)[27]提出。对图像的亮度、对比度和结构进行计算,表达式为

L(X,Y)=2μXμY+C1μX2+μY2+C1,(4)C(X,Y)=2σXσY+C2σX2+σY2+C2,(5)S(X,Y)=σXY+C3σXσY+C3,(6)

式中:μXμY分别为图像XY的均值;σXσY分别为图像XY的标准差;σXY为图像XY的协方差;C1C2C3为常数,是为了避免分母为0而维持稳定,通常取C1= (K1×L)2,C2= (K2×L)2,C3=C2/2,一般K1=0.01,K2=0.03,L=255(L是像素值的动态范围,一般都取为255)。

最后的SSIM指数为

xSSIM(X,Y)=L(X,Y)×C(X,Y)×S(X,Y)(7)

当设定C3=C2/2时,可以将(7)式改写成更简单的形式,即

xSSIM(X,Y)=(2μXμY+C1)(2σXY+C2)(μX2+μY2+C1)(σX2+σY2+C2)(8)

SSIM指数从图像组成的角度将结构信息定义为,独立于亮度和对比度的反映场景中物体结构的属性,并将失真建模为亮度、对比度和结构三个不同因素的组合。使用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量。

三种功率下,E光斑与DN光斑标准模型的SSIM如图8所示,其中虚线以上为一级分类为1的E光斑,对应的SSIM值较大,虚线以下为一级分类为0的E光斑,对应的SSIM值较小。

图 8. E光斑在不同功率下的SSIM值。(a)10 mW;(b)20 mW;(c)50 mW

Fig. 8. SSIM values of E spot at different powers. (a)10 mW; (b) 20 mW; (c) 50 mW

下载图片 查看所有图片

基于GAN+SSIM对E光斑进行二级SVM分类,得到二级UP光斑和二级DN光斑。

3.3 合并分类结果

采用级联SVM分类器对光斑进行分类,将二级UP和DN光斑与一级UP和DN光斑结合,分类结果如图9所示。

图 9. 级联SVM在不同功率下的分类结果。(a)10 mW;(b)20 mW;(c)50 mW

Fig. 9. Cascade SVM classification results at different powers. (a) 10 mW; (b) 20 mW; (c) 50 mW

下载图片 查看所有图片

图9可以看到,在10 mW的加工功率下,分类精度为100%;整个烧蚀周期内,两种烧蚀方向对应两种拖尾方向的光斑都有34个;在20 mW的加工功率下,分类精度同样为100%,每半个烧蚀周期都呈现33个相同拖尾方向的光斑;出现偏差的是50 mW的加工功率下的分类结果,其精度为98.5%。实际上,每半个周期同样运动状态的光斑应有66个,而分类结果中,在第二个半周期内有一个光斑未被正确分类。整个时间序列下的光斑只有两个光斑被错误分类,分类精度也接近100%,分类效果显著提高。

4 分类结果对比分析

为了验证级联SVM分类器对不同烧蚀方向产生不同状态的光斑的分类准确性,将HOG-SVM、LBP-SVM和GP-SVM三种分类方法与所提方法进行对比。其中HOG特征是通过计算和统计图像局部区域的梯度方向直方图来构成的,在图像的局部方格单元上对图像的形变能够保持很好的不变性;LBP特征能够有效地度量和提取图像的局部纹理信息,具有旋转不变性和灰度不变性等显著优点;GP特征对图像进行下采样处理,可以获取图像部分信息。将三种特征描述特征分别与SVM结合并对光斑进行分类。在同一加工功率和同一时间序列下,对比分析4种方法的分类结果及分类精度,结果如图10~12所示,其中方法1为HOG-SVM,方法2为LBP-SVM,方法3为GP-SVM,方法4为级联SVM分类器。

图10~12可以看到,未被正确分类的E类光斑较多,分类误差较大,效果不够稳定,三种传统方法的分类精度都不及优化的级联SVM高。采用4种方法对不同加工功率下的分类精度进行进一步分析,结果如表1所示。

图 10. 10 mW功率下不同方法的分类结果。(a)HOG-SVM方法;(b)LBP-SVM方法;(c)GP-SVM方法;(d)4种方法的精度对比曲线

Fig. 10. Classification results of different methods at 10 mW power. (a) HOG-SVM method; (b) LBP-SVM method; (c) GP-SVM method; (d) accuracy comparison curves of four methods

下载图片 查看所有图片

表 1. 不同法的分类精度

Table 1. Classification accuracy of different methods

Power /mWHOG-SVM /%LBP-SVM /%GP-SVM /%Cascade SVM /%
1093.091.095.0100.0
2085.088.084.0100.0
5088.583.089.598.5

查看所有表

图 11. 20 mW功率下不同方法的分类结果。(a)HOG-SVM方法;(b)LBP-SVM方法;(c)GP-SVM方法;(d)4种方法的精度对比曲线

Fig. 11. Classification results of different methods at 20 mW power. (a) HOG-SVM method; (b) LBP-SVM method; (c) GP-SVM method; (d) accuracy comparison curves of four methods

下载图片 查看所有图片

图 12. 50 mW功率下不同方法的分类结果。(a)HOG-SVM方法;(b)LBP-SVM方法;(c)GP-SVM方法;(d)4种方法的精度对比曲线

Fig. 12. Classification results of different methods at 50 mW power. (a) HOG-SVM method; (b) LBP-SVM method; (c) GP-SVM method; (d) accuracy comparison curves of four methods

下载图片 查看所有图片

表1可以看到,在10 mW和20 mW的加工功率下,分类精度高达100%,在50 mW的加工功率下,分类精度达到98.5%;相比于传统的HOG-SVM、LBP-SVM和GP-SVM分类方法,级联SVM分类器在10 mW的功率下,分类精度提升5~9个百分点;20 mW的功率下,分类精度提升12~16个百分点;50 mW的功率下,分类精度提升9.0~15.5个百分点;级联SVM分类器对于每种功率下的光斑分类精度都接近100%,具有明显的优越性。

5 结论

为了对飞秒激光烧蚀单晶硅过程中不同形态的光斑进行分类,采用优化的级联SVM分类器。首先通过光斑质心特征进行一级分类,然后经过GAN生成标准模型,利用被错误分类的光斑与标准模型之间的SSIM特征进行二级SVM分类。实验结果表明,在10 mW和20 mW的加工功率下,分类精度高达100%,在50 mW的加工功率下,分类精度达到98.5%,也接近100%,这对光斑的运动状态有更大的把握,能够进一步探究烧蚀规律,对烧蚀效率与烧蚀精度的提高起到不可磨灭的作用。

参考文献

[1] Liang C W, Juang C F. Moving object classification using local shape and HOG features in wavelet-transformed space with hierarchical SVM classifiers[J]. Applied Soft Computing, 2015, 28: 483-497.

[2] Li P F, Dong L M, Xiao H C, et al. A cloud image detection method based on SVM vector machine[J]. Neurocomputing, 2015, 169: 34-42.

[3] 李玉娟. 基于计算机视觉的手势识别方法研究[D]. 西安: 西安电子科技大学, 2017.

    Li YJ. Gesture recognition method based on computer vision research[D]. Xi'an: Xidian University, 2017.

[4] 刘增健. 临床医疗文本中实体时序化问题研究[D]. 哈尔滨: 哈尔滨工业大学, 2018.

    Liu ZJ. Research on temporal ordering of medical entity in clinical texts[D]. Harbin: Harbin Institute of Technology, 2018.

[5] Liang C W, Juang C F. Moving object classification using local shape and HOG features in wavelet-transformed space with hierarchical SVM classifiers[J]. Applied Soft Computing, 2015, 28: 483-497.

[6] Wang Y R, Zhu X L, Wu B. Automatic detection of individual oil palm trees from UAV images using HOG features and an SVM classifier[J]. International Journal of Remote Sensing, 2019.

[7] Kumar S, Singh S, Kumar J. Automatic live facial expression detection using genetic algorithm with haar wavelet features and SVM[J]. Wireless Personal Communications, 2018, 103(3): 2435-2453.

[8] JoshiC, Purohit GN, Mukherjee S.SIFT, SURF, Gabor and fused feature classification using SVM for multispectral satellite image retrieval[C] //Proceedings of the 6th International Conference on Literature, Languages, Humanities and Social Sciences (L2HSS-17), December 7, 2017, Paris, France. [S.l.: s.n.], 2017.

[9] Salleh S, Mahmud R, Rahman H, et al. Speed up robust features (SURF) with principal component analysis-support vector machine (PCA-SVM) for benign and malignant classifications[J]. Journal of Fundamental and Applied Sciences, 2018, 9(5): 624.

[10] Yin Y J, Xu D, Wang X G, et al. Online state-based structured SVM combined with incremental PCA for robust visual tracking[J]. IEEE Transactions on Cybernetics, 2015, 45(9): 1988-2000.

[11] Hu N, Wang G, Wu Y H, et al. LDA-SVM-based EGFR mutation model for NSCLC brain metastases: an observational study[J]. Medicine (Madr), 2015, 94(5): e375.

[12] 都业刚. 基于显著性的移动图像检索[D]. 大连: 大连海事大学, 2015.

    Du YG. Mobile visual search based on saliency[D]. Dalian: Dalian Maritime University, 2015.

[13] Sirajudeen A, Ezhilarasi M. Multi-scale LBP and SVM classification to identify diabetic retinopathy in lesions[J]. Current Medical Imaging Reviews, 2015, 11(1): 49-55.

[14] Roy A, Laskar R H. Fuzzy SVM based fuzzy adaptive filter for denoising impulse noise from color images[J]. Multimedia Tools and Applications, 2019, 78(2): 1785-1804.

[15] Ali-Gombe A, Elyan E. MFC-GAN: class-imbalanced dataset classification using multiple fake class generative adversarial network[J]. Neurocomputing, 2019, 361: 212-221.

[16] 王福斌, 刘梦竹, 曾凯, 等. 飞秒激光烧蚀光斑图像灰度特征及应用分析[J]. 激光杂志, 2020, 41(6): 26-30.

    Wang F B, Liu M Z, Zeng K, et al. Gray features and application analysis of ablated spot image by femtosecond laser[J]. Laser Journal, 2020, 41(6): 26-30.

[17] 刘凯莉. 面向微博话题的情感计算和舆情分析[D]. 郑州: 郑州大学, 2017.

    Liu KL. Affective computing and public opinion analysis of micro-blog topics[D]. Zhengzhou: Zhengzhou University, 2017.

[18] 孙晨阳. 多尺度遥感影像道路信息提取方法研究[D]. 重庆: 西南大学, 2015.

    Sun CY. Research on road information extraction method based on multi-scale remote sensing image[D]. Chongqing: Southwest University, 2015.

[19] 罗浩. 基于图像处理的非金属材料一致性比对系统研究[D]. 北京: 北京化工大学, 2015.

    LuoH. Study on consistency comparison system of non-metallic materials based on image processing[D]. Beijing: Beijing University of Chemical Technology, 2015.

[20] Shi X R, Zhou F, Yang S, et al. Automatic target recognition for synthetic aperture radar images based on super-resolution generative adversarial network and deep convolutional neural network[J]. Remote Sensing, 2019, 11(2): 135.

[21] Li L, Fan Z J, Zhao M Y, et al. Super-resolution reconstruction of underwater image based on image sequence generative adversarial network[J]. Mathematical Problems in Engineering, 2020, 2020: 1-10.

[22] 张杨子. 面向对话系统回复质量的自动评价研究[D]. 哈尔滨: 哈尔滨工业大学, 2018.

    Zhang YZ. Research on automatic evaluation on dialogue system reply quality[D]. Harbin: Harbin Institute of Technology, 2018.

[23] 刘坤, 王典, 荣梦学. 基于半监督生成对抗网络X光图像分类算法[J]. 光学学报, 2019, 39(8): 0810003.

    Liu K, Wang D, Rong M X. X-ray image classification algorithm based on semi-supervised generative adversarial networks[J]. Acta Optica Sinica, 2019, 39(8): 0810003.

[24] 胡麟苗, 张湧. 基于生成对抗网络的短波红外-可见光人脸图像翻译[J]. 光学学报, 2020, 40(5): 0510001.

    Hu L M, Zhang Y. Facial image translation in short-wavelength infrared and visible light based on generative adversarial network[J]. Acta Optica Sinica, 2020, 40(5): 0510001.

[25] 谢江荣, 李范鸣, 卫红, 等. 基于生成对抗式神经网络的红外目标仿真方法[J]. 光学学报, 2019, 39(3): 0311002.

    Xie J R, Li F M, Wei H, et al. Infrared target simulation method based on generative adversarial neural networks[J]. Acta Optica Sinica, 2019, 39(3): 0311002.

[26] 冯川. 基于深度学习的行人重识别技术研究[D]. 武汉: 湖北工业大学, 2019.

    FengC. Research on person re-identification based on deep learning[D]. Wuhan: Hubei University of Technology, 2019.

[27] 贾大宇. 基于图像特征和光流场的非刚性配准算法研究[D]. 济南: 山东大学, 2016.

    Jia DY. The research of non-rigid registration algorithms based on image characteristics and optical flow[D]. Jinan: Shandong University, 2016.

王福斌, 刘梦竹, PaulTu. 基于级联支持向量机的飞秒激光烧蚀光斑分类[J]. 中国激光, 2021, 48(6): 0602108. Fubin Wang, Mengzhu Liu, Tu Paul. Spot Ablated by Femtosecond Laser Classification Based on Cascaded Support Vector Machine[J]. Chinese Journal of Lasers, 2021, 48(6): 0602108.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!