基于优化核函数支持向量机在行人检测中的应用 下载: 1160次
1 引言
行人检测是利用计算机视觉技术判断图像或视频中是否存在行人,并对其进行精准的定位,必要时检测出目标的状态、姿势等。该技术已被广泛地应用于车辆辅助驾驶系统、智能视频监控、智能交通等领域,成为机器学习的研究热点之一。
现代行人检测的方法主要分为两大类:1) 基于背景建模的方法。先分割图像,然后提取目标,提取特征,最后进行分类,这种方法对于环境的变化,如光照和天气,都比较敏感。2) 较为常用的基于统计学习的方法,根据大量的学习样本构建分类器,例如目前使用较广泛的行人检测传统算法是基于梯度方向直方图(HOG)+支持向量机(SVM)的方法,以HOG算法提取行人特征,SVM作为分类器,HOG特征主要用于捕捉局部的轮廓信息,将图像中像素的梯度方向直方图作为特征[1-5]。该特征可以很好地描述出图像边缘,且对光照变化不敏感,是目前使用广泛的行人特征描述算法。SVM是一种建立在统计学习理论(SLT)中VC维理论和结构风险最小化(SRM)原则上的机器学习方法,是一种寻求最优分类超平面的分类算法。该方法是行人检测的传统方法。行人检测对于实时性和准确性的要求很高,且不同的环境也会对行人检测的效果造成影响。
Papageorgiou等[6]提出Haar小波的概念并将该方法应用于行人检测,为行人检测技术的发展奠定了基础。Chen等[7]提出由两部分组成的韦伯局部特征(WLD),充分利用人类视觉机制韦伯定理,降低了行人检测中明暗变化对检测结果的干扰,但缺点是不适用于复杂背景。Wu等[8]提出了中心变换直方图(CENTRIST)理论,较好地实现了光照变化较大、背景杂乱环境下的行人检测,但在实时性方面有所欠缺。目前的行人检测算法是提取行人Haar-like特征,以Adaboost-SVM为分类器,该算法实时性较好,但准确率不够高[9]。
本文在传统算法基础上对分类器进行改进,并针对分类器参数进行优化。以HOG算法作为特征提取算法,并采用主成成分分析(PCA)算法对特征向量进行降维。本文提出一种组合核函数,作为SVM分类器的核函数以提高识别率,引入松弛变量与惩罚因子
2 SVM算法简介
SVM是一种分类算法,分类函数为
将(1)式中
求最大几何间隔等价于求min
令
对于线性不可分的分类问题,如
面对大多数线性不可分问题,通过核函数转化到高维空间仍有可能出现如
故而加入松弛变量与惩罚因子,优化问题变为
式中
3 实验与分析
训练分类器的正样本为64 pixel×128 pixel的人体图片,样本数目为2400,负样本是从不包含人体的图片中随机裁取的,大小同样是64 pixel×128 pixel,样本数目为12000。测试集为500幅行人图片,分为5组进行测试,结果取5组的平均值。
3.1 特征提取
以HOG算法作为特征提取算法,如
图 4. 特征提取图。(a)灰度化图;(b)伽马校正图;(c)梯度图
Fig. 4. Feature extraction diagram. Results of (a) gray processing, (b) Gamma correction, and (c) gradient image
3.2 SVM检测方案
3.2.1 核函数
SVM的非线性变换是通过核函数完成的,核函数的选取决定了分类器映射的空间,只要满足Mercer条件[26]的函数都可以做核函数,满足Mercer条件的函数进行线性组合也满足Mercer条件。
SVM核函数分为全局核函数和局部核函数。
局部核函数例如高斯核函数
图 5. 核函数曲线图。(a)多项式核函数曲线图;(b)高斯核函数曲线
Fig. 5. Graph of kernel function. (a) Polynomial kernel function curve; (b) Gaussian kernel function curve
表 1. 识别率随d的变化
Table 1. Change of recognition rate with d
|
表 2. 识别率随σ的变化
Table 2. Change of recognition rate with σ
|
由
式中
由
将样本分为10组,记为A0~A9,每一组分别做一次测试集,其余9组做训练集,最终结果取10组的平均值。
表 3. 识别率随α1的变化
Table 3. Change of recognition rate with α1
|
3.2.2 松弛变量与惩罚因子
本文
图 8. 识别率随C变化折线图。(a)多项式核函数;(b)高斯核函数;(c)组合核函数
Fig. 8. Line chart of the change of recognition rate with C. (a) Polynomial kernel function; (b) Gaussian kernel function; (c) combined kernel function
3.2.3 参数优化
组合核函数包含多项式核函数参数
常用的方法包括GA、粒子群(PSO)算法,以及交叉验证(CV)算法等。其中GA[30-33]拥有很强的并行全局搜索能力,不易出现陷入局部极值点的情况,且可以与其他算法混合交叉使用,可扩展性极强。GA也是计算机科学人工智能领域中用于解决最优化的一种搜索启发式算法,是进化算法的一种。这种启发式通常用来生成有用的解决方案来优化和搜索问题。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择,以及杂交等。GA在适应度函数选择不当的情况下有可能收敛于局部最优,而不能达到全局最优。GA的基本运算过程如下:
1) 初始化。设置进化代数计数器
2) 个体评价。计算群体
3) 选择运算。将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。
4) 交叉运算。将交叉算子作用于群体,GA中起核心作用的就是交叉算子。
5) 变异运算。将变异算子作用于群体,即对群体中的个体串的某些基因座上的基因值作变动。群体
6) 终止条件判断。若
交叉算法简单易实施,运行时间短,局部性较强。其中
对参数二进制编码,初始种群数量
4 结果与讨论
根据优化结果取
图 9. 本文算法与传统算法识别率对比
Fig. 9. Comparison of the recognition rate between proposed algorithm and traditional algorithms
5 结论
为了达到行人检测对实时性的要求,采用HOG算法提取目标特征,PCA算法降低特征向量维度以缩短时间消耗。以SVM作为分类器,在传统算法的基础上,以组合核函数代替单一核函数,按比例组合高斯核函数与多项式核函数,结合K-CV与GA进行组合系数和参数的优化与选择,既突出了测试点附近的局部信息,又保留了测试点较远处的全局信息,并且得到了针对核函数的惩罚因子
[1] 王斌, 刘洋, 唐胜, 等. 融合多模型和帧间信息的行人检测算法[J]. 计算机辅助设计与图形学学报, 2017, 29(3): 444-449.
Wang B, Liu Y, Tang S, et al. Pedestrian detection with fusion of multi-models and intra-frame information[J]. Journal of Computer-Aided Design & Computer Graphics, 2017, 29(3): 444-449.
[2] 熊帮伟, 刘勇. HOG+SVM与C4两种行人检测技术比较[J]. 软件导刊, 2017, 16(2): 22-25.
Xiong B W, Liu Y. Comparison of HOG+SVM and C4 pedestrian detection technology[J]. Software Guide, 2017, 16(2): 22-25.
[3] 周炫余, 刘娟, 卢笑, 等. 一种联合文本和图像信息的行人检测方法[J]. 电子学报, 2017, 45(1): 140-146.
Zhou X Y, Liu J, Lu X, et al. A method for pedestrian detection by combining textual and visual information[J]. Acta Electronica Sinica, 2017, 45(1): 140-146.
[4] 岳鑫. 基于HOG特征和SVM分类器的行人检测研究[J]. 科技创新与应用, 2016( 5): 62- 63.
YueX. Research on pedestrian detection based on HOG feature and SVM classifier[J]. Innovation and Application of Science and Technology, 2016( 5): 62- 63.
[5] 徐渊, 许晓亮, 李才年, 等. 结合SVM分类器与HOG特征提取的行人检测[J]. 计算机工程, 2016, 42(1): 56-60, 65.
Xu Y, Xu X L, Li C N, et al. Pedestrian detection combining with SVM classifier and HOG feature extraction[J]. Computer Engineering, 2016, 42(1): 56-60, 65.
[9] OsunaE, FreundR, GirosiF. Training support vector machines: an application to face detection[C]// IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1997: 130- 136.
[10] 娄钰. 支持向量机算法研究[D]. 大连: 大连理工大学, 2007.
LouY. Studies on algorithm of support vector machine[D]. Dalian: Dalian University of Technology, 2007.
[11] 张莉. 基于SVM-AdaBoost算法的行人检测方法[J]. 工业仪表与自动化装置, 2016( 4): 117- 120.
ZhangL. A pedestrian detection method based on SVM-AdaBoost algorithm[J]. Industrial Instrumentation & Automation, 2016( 4): 117- 120.
[12] 邵福波, 董玉林, 胡运红. 支持向量机理论发展与应用综述[J]. 泰山学院学报, 2013, 35(6): 78-81.
Shao F B, Dong Y L, Hu Y H. An overview of the theory development and applications of support vector machine[J]. Journal of Taishan University, 2013, 35(6): 78-81.
[13] 李玉景. 支持向量机在模式识别领域中的应用研究[D]. 青岛: 青岛大学, 2008.
Li YJ. Application of support vector machine in the field of pattern recognition[D]. Qingdao: Qingdao University, 2008.
[14] 陈全胜, 赵杰文, 张海东, 等. 基于支持向量机的近红外光谱鉴别茶叶的真伪[J]. 光学学报, 2006, 26(6): 933-937.
[15] 黎静, 薛龙, 刘木华, 等. 基于支持向量机方法的水果表面农药污染分类研究[J]. 光学学报, 2009, 29(s2): 159-161.
[16] 裴利然, 姜萍萍, 颜国正. 基于支持向量机的跌倒检测算法研究[J]. 光学精密工程, 2017, 25(1): 182-187.
[17] 龙思源, 张葆, 宋策, 等. 基于改进的加速鲁棒特征的目标识别[J]. 中国光学, 2017, 10(6): 719-725.
[18] 段会川. 高斯核函数支持向量分类机超级参数有效范围研究[D]. 济南: 山东师范大学, 2012.
Duan HC. Research on super parameter effective range of support vector classifier based on Gauss kernel function[D]. Jinan: Shandong Normal University, 2012.
[19] 李红英. 支持向量分类机的核函数研究[D]. 重庆: 重庆大学, 2009.
Li HY. Research of kernels in support vector classifying machine[D]. Chongqing: Chongqing University, 2009.
[20] 王华忠, 俞金寿. 核函数方法及其模型选择[J]. 江南大学学报(自然科学版), 2006, 5(4): 500-504.
Wang H Z, Yu J S. Study on the kernel-based methods and its model selection[J]. Journal of Jiangnan University (Natural Science Edition), 2006, 5(4): 500-504.
[21] 曹蕾. 肺结节图像的分析与识别[D]. 广州: 南方医科大学, 2009.
CaoL. Analysis and identification of pulmonary nodule images[D]. Guangzhou: Southern Medical University, 2009.
[22] 郭劲智. 视频图像行人检测方法研究[D]. 广州: 华南理工大学, 2012.
Guo JZ. Research on the method of pedestrian detection in video images[D]. Guangzhou: South China University of Technology, 2012
[23] 徐岩, 韦镇余. 基于改进PCA和ELM的交通标志图像识别[J]. 激光与光电子学进展, 2017, 54(2): 021001.
[25] 苑玮琦, 曲晓峰, 柯丽, 等. 主成分分析重建误差掌纹识别方法[J]. 光学学报, 2008, 28(10): 1903-1909.
[27] 左森, 郭晓松, 万敬, 等. 多项式核函数SVM快速分类算法[J]. 计算机工程, 2007, 33(6): 27-29.
Zuo S, Guo X S, Wan J, et al. Fast classification algorithm for polynomial kernel support vector machines[J]. Computer Engineering, 2007, 33(6): 27-29.
[28] 张小云, 刘允才. 高斯核支撑向量机的性能分析[J]. 计算机工程, 2003, 29(8): 22-25.
Zhang X Y, Liu Y C. Performance analysis of support vector machines with Gauss kernel[J]. Computer Engineering, 2003, 29(8): 22-25.
[29] KohaviR. A study of cross-validation and bootstrap for accuracy estimation and model selection[C]// Proceedings of the 14 th international joint conference on Artificial intelligence 1995, 2: 1137- 1143.
[30] 刘鲭洁, 陈桂明, 刘小方, 等. 基于遗传算法的SVM参数组合优化[J]. 计算机应用与软件, 2012, 29(4): 94-96.
Liu Q J, Chen G M, Liu X F, et al. Genetic algorithm based SVM parameter composition optimization[J]. Computer Applications and Software, 2012, 29(4): 94-96.
[31] LarrañagaP, Bielza C. GeneticAlgorithm( GA)[M]. [S.l.]: Dictionary of Bioinformatics and Computational Biology, 2004.
[32] 高航, 薛凌云. 基于改进遗传算法的反向传播神经网络拟合LED光谱模型[J]. 激光与光电子学进展, 2017, 54(7): 072302.
[33] 邵明省, 李伟. 基于改进量子遗传算法的图像锐化研究[J]. 激光与光电子学进展, 2012, 49(1): 011101.
杨萌, 张葆, 宋玉龙. 基于优化核函数支持向量机在行人检测中的应用[J]. 激光与光电子学进展, 2018, 55(4): 041001. Meng Yang, Bao Zhang, Yulong Song. Application of Support Vector Machine Based on Optimized Kernel Function in People Detection[J]. Laser & Optoelectronics Progress, 2018, 55(4): 041001.