基于改进Grassberger熵随机森林分类器的目标检测 下载: 998次
1 引言
以感知与规避(SAA)技术为核心的无人机空域集成技术是未来空域安全的重要保障,SAA技术也是当前国际无人机技术研宄的前沿[1-2]。基于光学传感器的目标检测是无人机SAA系统一项基本而重要的研究内容。
Mejias等[3]采用形态学滤波预处理方法突出帧内目标,用隐性马尔可夫模型滤波法检测图像中的飞行器目标。Sapkota等[4]在多目标跟踪时采用高斯混合概率假设密度滤波器。然而,滤波方法适用于背景简单的远距离目标检测,远距离目标在图像中以点状出现,对无人机自主飞行安全的威胁程度较低。而近距离目标对无人机自主飞行安全的威胁程度高,图像中的目标轮廓清晰、形态各异。故对近距离目标的检测具有重要的现实意义。
近年来,基于机器学习的目标检测方法备受关注,深度学习[5-8]、支持向量机[9-10]和随机森林[11-12]等方法是机器学习常见的方法。其中,随机森林法是可以用来解决很多实际问题的一种数学方法,尤其在处理大数据和分类问题时性能优越[13-14],具有抗噪声能力强,计算效率高,易与无人机SAA系统硬件集成等优点。联合分类回归随机森林(JCRF)[15]不仅能预测目标,而且能回归目标边界框,对清晰可见的大尺度目标取得了较好的检测结果,但对弱小目标的检测不及大尺度目标准确,不适合用于近距离目标的应用场景。文献[ 16]中采用随机森林分类器对弱小目标进行分类,在每个分裂节点引入支持向量机进行二分类,对于多分类,把不同类别的样本随机标注为两类,再用支持向量机将其分为左孩子节点数据和右孩子节点数据。该方法取得了较好的分类结果,但是训练的多分类树不平衡。
对于传统的随机森林分类器模型,决策树的每个节点分裂时,从全部属性中等概率随机抽取属性子集,选择一个最优属性将该节点的样本分裂至左孩子节点和右孩子节点[13]。常用信息熵计算信息增益,采用信息增益度量每个属性划分的纯度,从而选择最优分裂属性。由于无人机SAA系统对目标检测的准确率要求更高,如果检测近距离目标失败,则可能会导致灾难性后果,如无人机与空域中的载人飞机相撞。因此,一个问题被提出:能否找到一种更优的信息熵计算信息增益,选择最优分裂属性,提高随机森林分类器的泛化能力,进而提高目标检测的准确率。
熵是德国物理学家克劳修斯在19世纪60年代提出的,它描述了在一组给定条件下系统处于什么状态。后来玻尔兹曼以微观粒子的分布解释了克劳修斯提出的熵,认为熵是系统在热力学状态下分子运动混乱程度大小的一种量度[17]。文献[ 18]中简单介绍了信息熵、JackKnife熵、贝叶斯熵、Grassberger熵与James Stein熵等。文献[ 19]中将图像划分为多个图像子块,提取每个图像子块的模糊熵特征,应用随机森林分类器进行分类。该方法不仅错分率低,而且耗时少,但是只提取图像块的模糊熵特征,而在随机森林分类器树分裂时应用信息熵。该过程并未对模糊熵及信息熵做出任何实质性的改进来提高随机森林分类器的分类性能。Sun等[20]对信息熵进行了改进,利用正弦函数估计样本的不确定性。应用改进的信息熵计算信息增益能提高决策树的分类能力和稳定性,然而只是对传统信息熵进行了改进。
本文对Grassberger熵进行改进,在训练随机森林分类器阶段,改进的Grassberger熵被用来计算信息增益,选择随机森林分类器节点分裂的最优分裂属性,将训练数据分为左孩子节点数据和右孩子节点数据,直至训练数据到达叶子节点。在预测阶段,在每个分裂节点对输入的待预测数据应用最优分裂属性分裂,最终结果根据存储在叶子节点上的训练数据进行决策。针对无人机SAA系统,利用机载光学传感器中获取的图像进行近距离目标检测的实验,基于光学数据集SenseAndAvoid测试了所提方法的性能,实验结果表明本文方法可以有效地检测目标,提高目标检测的准确率。
2 随机森林分类器模型
随机森林分类器是由一系列相互独立的树状分类器组成的分类器[13]。一棵决策树递归分裂样本
式中:
3 改进Grassberger熵的随机森林分类器
3.1 改进的Grassberger熵
由于Grassberger熵估计是一种计算效率高、偏差较低、估计量的值更接近真值的熵估计[22],因此采用Grassberger熵估计,并对其进行改进。改进的理论依据详见文献[ 23]。
Grassberger熵估计[22]的原型为
式中:
本文对Grassberger熵的函数
式中:
其次,由Digamma函数的性质
可得
由于Digamma函数的表示形式为
因此,改进的
(10)式是合理的,因为本文改进的
式中:
由文献[ 24]中的公式0.244可推得(11)式,公式0.244中的2式为
式中:
令(12)式中的
3.2 改进的Grassberger熵计算信息增益
对于随机森林分类器树的每个分裂节点,最关键的是寻找分裂函数的最优分裂属性
信息增益被定义为
此处的
式中:
3.3 改进的Grassberger熵的随机森林分类器的训练与预测
首先用带有类别标签的训练样本训练改进的Grassberger熵的随机森林分类器,其次采用训练好的随机森林分类器预测目标。改进的Grassberger熵的随机森林分类器的训练与预测过程如下:
1) 训练过程。每棵树被独立地训练,一棵决策树递归地分裂样本到左孩子节点和右孩子节点,直至样本到达叶子节点。给定随机森林分类器中树的第
训练停止的条件是训练样本已分裂至树的最大层数,或信息增益低于设定值,或训练样本的数目少于设定值。
2) 预测过程。输入未知类别的数据,这些数据经过分裂节点到达叶子节点。根据叶子节点存储训练样本的概率分布预测未知类别的待预测数据。叶子节点的概率为最大类别的样本数目与该叶子节点所有样本的比例。每棵树的输出是存储在该树的叶子节点训练样本的最大概率分布。一个输入的待预测数据由所有树的输出结果投票决定,待预测数据的类别为
概率为
式中:
其中
4 目标检测算法
本研究采用有监督方式,目标检测算法框架如
近年来,有一系列方法可以生成与类别无关且可能包含目标的子窗口。这些方法可概括为两类:分组方法(grouping methods)和滑窗评分方法(window scoring methods)[25]。
选用选择性搜索(SS)方法[26]生成与类别无关的子窗口,这种生成子窗口的方法比滑动窗口方法生成的子窗口数据量小。
对每个训练样本及与类别无关的子窗口计算10个特征通道,分别是1个归一化的梯度幅值、3个LUV颜色通道和6个梯度方向直方图。对每幅图像在特征提取前用高斯滤波器降噪。
5 实验与分析
首先,在SenseAndAvoid数据集上验证基于改进的Grassberger熵的随机森林分类器的目标检测算法的性能;其次,分析改进的Grassberger熵对随机森林分类器泛化能力的影响,分析树的数目及随机取样对目标检测准确率的影响。
5.1 SenseAndAvoid数据集
SenseAndAvoid数据集是本课题组进行无人机SAA系统实验时建立的,数据集的大部分图像来源于无人机机载光学传感器拍摄的图像。目前,SenseAndAvoid数据集包含3600幅训练图像和1250幅测试图像,这些图像具有尺度变化、光照变化、背景复杂及含有噪声等属性。所有图像都经过了人工标注。
训练改进的Grassberger熵的随机森林分类器时设置120棵树,每棵树的最大层数为15。训练样本由随机取样65%的负样本和所有正样本组成。正样本为每幅训练图像目标边界框以内的目标部分,随机取样32 pixel×32 pixel的图像块,提取每个图像块的1个归一化梯度幅值、3个LUV颜色通道和6个梯度方向直方图。负样本为目标边界框以外的背景部分,随机取样32 pixel×32 pixel的图像块,提取每个图像块的1个归一化梯度幅值、3个LUV颜色通道和6个梯度方向直方图。梯度幅值、LUV颜色通道及6个梯度方向直方图如
图 3. 特征通道示意图。(a)原图像;(b)梯度幅值;(c) LUV颜色通道;(d)梯度方向直方图
Fig. 3. Diagrams of feature channels. (a) Original image; (b) gradient magnitude; (c) LUV color channels; (d) histogram of oriented gradients
在预测阶段,对于每幅目标未知的待检测图像,首先用SS方法生成大约900个与类别无关且包含物体的子窗口,然后提取每个子窗口的1个归一化梯度幅值、3个LUV颜色通道和6个梯度方向直方图,通过改进Grassberger熵的随机森林分类器预测每个子窗口是否包含目标及包含目标的概率。变换后的色彩空间及生成可能包含目标的子窗口如
图 4. 生成的子窗口示意图。(a)原图像;(b) 检测结果;(c)子窗口
Fig. 4. Diagrams of generated proposal windows. (a) Original image; (b) detection result; (c) proposal windows
图 5. SAA数据集的检测结果。(a)变化背景的图像;(b)含有噪声的图像;(c)多尺度图像;(d)不同光照条件下的图像
Fig. 5. Detection results on SAA dataset. (a) Images under varied background; (b) images with noise; (c) multiple scale images; (d) images under different illumination conditions
不同方法的平均检测时间
Average detection time of different methods
Method | JCRF[ | SS[ | FGHF[ | TF[ | IGERF |
---|---|---|---|---|---|
Averagedetection time /s | 69.7 | 23.1 | 53.4 | 11.2 | 36.3 |
表 2. 不同方法的平均检测时间
Table 2. Average detection time of different methods
|
图 6. 不同方法在SenseAndAvoid数据集上的准确率-召回率曲线
Fig. 6. Precision-recall curves of different methods on SenseAndAvoid dataset
5.2 分析
在随机森林分类器树的分裂节点上设置不同的样本,用改进的Grassberger熵计算信息增益,选取信息增益最大的分裂属性,将该节点的样本分为左孩子节点数据和右孩子节点数据。实验表明,改进的Grassberger熵计算信息增益能较准确地分裂节点数据,能提高随机森林分类器的泛化能力。
对于SenseAndAvoid数据集,树的深度不变(
随机取样是一种控制过拟合和训练具有差异性树的方式。在训练树的过程,从总的训练样本中随机取样不同的子集,构成训练每棵树的样本,训练不同的树。
此外,训练随机森林分类器时,正样本和负样本的数量应该大致相同。如果正样本和负样本的数量相差太大,存储在随机森林分类器树叶子节点上的训练数据不平衡,会导致树不平衡,进而降低随机森林分类器的泛化能力。
6 结论
文中描述了改进的Grassberger熵估计、IGERF分类器及基于IGERF分类器的目标检测方法。改进的Grassberger熵可以有效地提高随机森林分类器的泛化能力和目标检测的准确率。实验结果表明,本文方法可以应用于无人机的SAA系统,从机载光学传感器获取的图像中检测近距离目标,对每个训练样本及子窗口提取LUV颜色通道、梯度幅值及方向低层特征。未来的研究中可以用深度玻尔兹曼机学习高层特征,以进一步提高目标检测的准确率。
[1] 王杰, 田宏安. 无人机融入非隔离空域感知与规避技术[J]. 指挥信息系统与技术, 2017, 8(1): 27-32.
[2] 毕红哲, 张洲宇, 申功璋, 等. 无人机感知与规避技术研究进展[J]. 电子测量与仪器学报, 2016, 30(5): 661-668.
[3] MejiasL, McNamara S, Lai J, et al. Vision-based detection and tracking of aerial targets for UAV collision avoidance[C]∥2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, October 18-22, 2010, Taipei, Taiwan, China. New York: IEEE, 2010: 87- 92.
[4] Sapkota KR, RoelofsenS, RozantsevA, et al. Vision-based Unmanned Aerial Vehicle detection and tracking for sense and avoid systems[C]∥2016 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), October 9-14, 2016, Daejeon, South Korea. New York: IEEE, 2016: 1556- 1561.
[5] 冯小雨, 梅卫, 胡大帅. 基于改进Faster R-CNN的空中目标检测[J]. 光学学报, 2018, 38(6): 0615004.
[6] 李佳妮, 张宝华. 特征匹配融合结合改进卷积神经网络的人脸识别[J]. 激光与光电子学进展, 2018, 55(10): 101504.
[7] GirshickR. Fast R-CNN[C]∥2015 IEEE International Conference on Computer Vision (ICCV), December 7-13, 2015, Santiago, Chile. New York: IEEE, 2015: 1440- 1448.
[8] RozantsevA, LepetitV, FuaP. Flying objects detection from a single moving camera[C]∥2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 7-12, 2015, Boston, MA, USA. New York: IEEE, 2015: 4128- 4136.
[10] MalisiewiczT, GuptaA, Efros AA. Ensemble of exemplar-SVMs for object detection and beyond[C]∥2011 International Conference on Computer Vision (ICCV), November 6-13, 2011, Barcelona, Spain. New York: IEEE, 2011: 89- 96.
[12] KontschiederP, FiterauM, CriminisiA, et al. Deep neural decision forests[C]∥2015 IEEE International Conference on Computer Vision (ICCV), December 7-13, 2015, Santiago, Chile. New York: IEEE, 2015: 1467- 1475.
[13] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[14] RoyA, TodorovicS. Monocular depth estimation using neural regression forest[C]∥2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 27-30, 2016, Las Vegas, NV, USA. New York: IEEE, 2016: 5506- 5514.
[15] SchulterS, LeistnerC, WohlhartP, et al. Accurate object detection with joint classification-regression random forests[C]∥2014 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 23-28, 2014, Columbus, OH, USA. New York: IEEE, 2014: 923- 930.
[16] Yao BP, KhoslaA, Li FF. Combining randomization and discrimination for fine-grained image categorization[C]∥2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 20-25 2011, Colorado Springs, CO, USA. New York: IEEE, 2011: 1577- 1584.
[17] 张继国, VijayP. Singh. 信息熵—理论与应用[M]. 北京: 中国水利水电出版社, 2012: 1- 69.
Zhang JG, Singh VP. Information entropy—theory and application[M]. Beijing: China Water & Power Press, 2012: 1- 69.
[18] A guide to discrete entropy estimators[Z/OL]. ( 2014-02-09)[2018-09-15]. http:∥memming.wordpress.com/2014/02/09/.
[19] 肖玉玲, 仵征, 朱煜. 结合分块模糊熵和随机森林的图像分类方法[J]. 电子技术应用, 2017, 43(7): 122-126.
[20] Sun HN, Hu XG. An improved learning algorithm of decision tree based on entropy uncertainty deviation[C]∥2012 IEEE 14th International Conference on Communication Technology, November 9-11, 2012, Chengdu, China. New York: IEEE, 2012: 799- 803.
[22] Grassberger P. Entropy estimates from insufficient samplings[EB/OL]. ( 2003-07-29)[2018-09-15]. https:∥arxiv.org/abs/physics/0307138.
[24] Gradshteyn IS, Ryshik IM. Tables of integrals, series, and products[M]. New Yrok: Academic Press, 1965: 13.
[27] TranA, ManzaneraA. Fast growing hough forest as a stable model for object detection[C]∥2016 Sixth International Conference on Image Processing Theory, Tools and Applications (IPTA), December 12-15, 2016, Oulu, Finland. New York: IEEE, 2016: 7820960.
[28] Garcia-HernandoG, Kim TK. Transition forests: learning discriminative temporal transitions for action recognition and detection[C]∥2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), July 21-26, 2017, Honolulu, HI, USA. New York: IEEE, 2017: 407- 415.
Article Outline
马娟娟, 潘泉, 梁彦, 胡劲文, 赵春晖, 郭亚宁. 基于改进Grassberger熵随机森林分类器的目标检测[J]. 中国激光, 2019, 46(7): 0704011. Juanjuan Ma, Quan Pan, Yan Liang, Jinwen Hu, Chunhui Zhao, Yaning Guo. Object Detection Based on Improved Grassberger Entropy Random Forest Classifier[J]. Chinese Journal of Lasers, 2019, 46(7): 0704011.