基于区域全卷积网络结合残差网络的火焰检测方法 下载: 1741次
1 引言
火灾是一种常见且容易发生的灾害,在各类工业控制过程中火灾对公众的生命与财产构成了重大威胁。由于火灾具有突发性而且危害大,所以构建准确有效的火焰识别算法对预防火灾拥有重要的意义。
传统的火焰检测算法大致可归纳为两类:基于传感器的火焰检测算法和基于图像的火焰检测算法。基于传感器的火焰检测算法是通过感温和感烟的方式进行火焰检测,如徐炀[1]构建了智能火灾自动报警系统,通过使用火灾报警控制器、感温感烟探测器等物理装置侦测周围温度和空气变换进行火焰检测;胡幸江[2]针对常规的感温感烟探测器等物理装置探测距离短、响应慢等缺点,提出使用多波段红外火焰探测器进行火焰检测。但是,这类方法对环境依赖性强、覆盖范围小、成本较高。随着高清摄像机、图像处理技术的不断发展,基于图像的火焰检测算法逐渐成为主流,张进华等[3]根据火焰的物体特性,利用火焰区域边缘点到中心质点的高度,并使用离散傅里叶变换排除非火焰区域;荣建忠等[4]和Chen等[5]利用RGB和HIS两个颜色空间获取疑似火焰区域,并通过判断其面积增长和中心稳定情况获取火焰的动态像素,引入并改进了统计地形特征的纹理描述方法,采用神经网络算法对火焰候选区域进行分类;李文辉等[6]使用日夜两用型红外摄像机,通过获取火焰在红外和可见光两种状态下的颜色模型进行火焰检测;严云洋等[7]通过RGB彩色空间建立了火焰的彩色模型,并提出了基于连通区域面积阈值化的单像素宽度目标轮廓特征的抽取方法。但是上述传统基于图像的火焰检测识别方法受制于手工设计火焰特征,随着场景变换和场景复杂程度加深,手工设计的火焰特征无法很好描述火焰目标并有效区分疑似火焰目标和火焰目标,造成识别精度的下降。
针对上述基于传统图像火焰检测算法的缺陷,本文提出一种通过训练特征提取网络自动提取火焰特征,并在该特征上使用区域全卷积网络(R-FCN)定位火焰目标,最后使用残差网络(ResNet)进行二次分类端到端的火焰检测算法。
2 R-FCN+ResNet的火焰检测模型介绍
如
2.1 特征提取网络模型结构
本文算法的特征提取网络为ResNet。其图像输入尺寸为600 pixel×1000 pixel,图像通道数为3,网络层数为50,并且已经在ImageNet数据集上做过预训练。
2.2 R-FCN模型介绍
R-FCN效仿R-CNN[10],采用流行的物体检测策略,分为两步:1) 由RPN[11]根据特征提取网络提供的特征谱图求出疑似火焰区域集合(ROIS); 2) 对RPN求出的ROIS逐个进行火焰识别(ROI为ROIS中任意一个疑似火焰区域)。
如
位置敏感ROI池化具体操作是将1个尺寸为
式中:
对位置敏感分数图生成的长度为
对向量做柔性最大值传输函数分类操作为
R-FCN选用的训练方式是梯度下降,代价函数为每个 ROI 的损失函数交叉熵损失与边界框回归损失的和,可表示为
式中:
2.3 二次分类模型描述
3 训练数据库建立
3.1 火焰区域全卷积网络训练数据库
由于R-FCN训练需要PASCAL VOC[12]格式的数据集,但是目前公开的PASCAL VOC的训练数据集的20类中没有火焰这一类。为了满足实验需求,通过网络和拍摄等途径收集相关视频,并将视频转换成图片格式,再根据PASCAL VOC的格式手工标注图片中的目标,训练数据如
表 1. 训练数据描述
Table 1. Training data description
|
所建数据集共21个场景,7861张图片。将原图中,红色不规则物体和灯光等目标标注为likefire,火焰目标标注为fire,未标注的区域默认为背景,
3.2 二次分类器ResNet火焰类别训练数据库
为了训练二次分类器,将用来训练R-FCN的数据中类标为likefire和fire的目标根据标注信息截取下来。并将其类标分别定义为likefire、fire,其数目分别为1000、9790。但是由于likefire和fire两个类别的数目不均衡,所以将likefire类别复制9份,最终likefire、fire的数目分别为9000和9790。
4 实验结果以及分析
为了验证算法的有效性,将与传统的基于图像的典型火焰检测算法进行对比实验。本文实验软件工具为Windows下Caffe[13]框架,训练和测试机器基本配置:GPU为Titan X,CPU为Inter Core i7,内存为8 G。
4.1 实验数据介绍
实验视频来源于Bilkent大学的公开火灾火焰视频库(http://Signal.ee.bilkent.edu.tr/VisiFire)分辨率为320 pixel×240 pixel,共6段视频,并且此视频不在训练集中。
图 2. 视频示意图。(a)视频1;(b)视频2;(c)视频3;(d)视频4;(e)视频5;(f)视频6
Fig. 2. Video schematic. (a) Video 1; (b) video 2; (c) video 3; (d) video 4; (e) video 5; (f) video 6
4.2 模型训练
R-FCN的训练集为实验建立的PASCAL VOC格式的火焰目标数据集,类标分别为likefire和fire,共7861张图片,类标个数分别为1000和9790。
训练二次分类器ResNet的训练集是从训练R-FCN数据中根据标注信息在原图中截取下来的图片。类标分别为likefire、fire。但是由于两个类别数目相差过大,故复制likefire将其数量扩充为原来的9倍,再用来训练二次分类器ResNet。
4.3 实验结果对比
表 2. 火焰视频检测结果
Table 2. Detection results of flame video
|
文献[ 14-16]都是传统基于图像的火焰识别算法,文献[ 14]利用了疑似火焰区域的周长变换、面积变换、质心位移、圆形度以及圆形度变化等形状变化的特征,这种算法火焰形状变换剧烈时效果比较突出,所以在视频3中检测效果比较好。但火焰稳定燃烧时火焰形状变化并不太剧烈,如视频1、2、4,所以文献[ 14]的方法表现不是很理想。文献[ 15]的方法是利用傅里叶描述子提取轮廓特征,但是若出现遮挡情况,其不能完整提取检测物体的轮廓特征而造成漏报,所以该方法在视频4中表现不是非常理想。而文献[ 16]虽然融合了圆形度、矩阵度和重心高度系数等形状结构特征,但是火焰的形状不可控,如果所设计的特征主要依赖于火焰的形状,漏检率和误检率也不稳定的。如视频3中,由于火焰受到风的影响而形状变化剧烈,圆形度、矩阵度和重心高度系数不稳定,所以文献[ 16]在视频3中效果不理想。
表 3. 非火焰视频检测结果
Table 3. Detection results of non-flame video
|
文献[ 14-16]都是通过手动设计火焰特征,并使用模式识别或者增加阈值限定做分类或者定位,但是这类方法的一个通病就是在一些特定场景的效果比较理想,但是在另一些特殊和复杂场景,其效果就不理想。这是因为火焰的形状、颜色等特征不固定,易受到环境的干扰,所以手动设计的特征并不能完全抓取不同场景下的所有火焰,必然会在某些场景下造成大量漏报。而手动设计特征的不唯一性,造成在复杂场景下很多非火焰物体的形态满足了手动设计的特征条件,必然造成大量误报。
但是R-FCN是基于特征谱图检测的,而特征谱图是由特征提取网络层提取出来,所以相对于原图必然会存在一些信息的丢失。故利用R-FCN对目标区域分类,不如直接使用残差网络在原图中进行分类更为有效。为了解决这个问题 ,本文算法在R-FCN基础上再次加入一个分类器进行二次分类,以降低误报率。具体做法是当R-FCN检测出火焰目标,并返回该目标在原图中的位置后,再将该位置的原图火焰截取下来送入二次分类器ResNet进行二次分类。由
为了验证R-FCN+ResNet算法在火焰检测应用领域的时效性,采用每秒帧数指标来衡量。实验结果可知,R-FCN+ResNet算法与R-FCN算法的每秒帧数指标分别为12和12.2,其数值基本持平,因此,该算法在确保低误报率的同时,提高了在火焰检测应用领域的实用性。
5 结论
通过深度学习R-FCN检测结合ResNet二次分类的方法,训练特征提取网络自动提取样本中火焰的特征特征谱图,在特征谱图上使用R-FCN检测出火焰在原图的位置,再将原图中火焰区域截取下来送入ResNet中进行二次分类以进一步降低误报率。实现了特征提取和火焰目标检测识别端到端的过程,避免了由于手工设计提取火焰特征而造成特征单一,及在特定情况和场景下无法有效检测并识别火焰的问题,确保算法模型的稳健性和可靠性。
[1] 徐炀. 智能火灾自动报警系统的构建[D]. 天津: 天津理工大学, 2013.
XuY. The structure of automatic fire alarm system based on virtual instrument[D]. Tianjin: Tianjin University of Technology, 2013.
[2] 胡幸江. 多波段红外火焰探测器系统研究与产品开发[D]. 杭州: 浙江大学, 2013.
Hu XJ. Research and product development of MIR flame detector system[D]. Hangzhou: Zhejiang University, 2013.
[3] 张进华, 庄健, 杜海峰, 等. 一种基于视频多特征融合的火焰识别算法[J]. 西安交通大学学报, 2006, 40(7): 811-814.
Zhang J H, Zhuang J, Du H F, et al. Flame detection algorithm based on video multi-feature fusion[J]. Journal of Xi'an Jiaotong University, 2006, 40(7): 811-814.
[4] 荣建忠, 姚卫, 高伟, 等. 基于多特征融合技术的火焰视频探测方法[J]. 燃烧科学与技术, 2013, 19(3): 227-233.
Rong J Z, Yao W, Gao W, et al. Fire video detection method based on muti-features fusion[J]. Journal of Combustion Science and Technology, 2013, 19(3): 227-233.
[5] Chen TH, Wu PH, Chiou YC. An early fire-detection method based on image processing[C]. International Conference on Image Processing, 2004, 3: 1707- 1710.
[6] 李文辉, 王莹, 赵瑞霖, 等. 使用日夜两用型红外摄像机进行火焰检测[J]. 湖南大学学报(自然科学版), 2012, 39(8): 73-80.
Li W H, Wang Y, Zhao R L, et al. Fire detection with day-night infrared camera[J]. Journal of Hunan University (Natural Science), 2012, 39(8): 73-80.
[7] 严云洋, 唐岩岩, 郭志波, 等. 融合色彩和轮廓特征的火焰检测[J]. 微电子学与计算机, 2011, 28(10): 137-141.
Yan Y Y, Tang Y Y, Guo Z B, et al. Fusion of flame color and its contour for fire detection[J]. Microelectronics & Computer, 2011, 28(10): 137-141.
[8] Dai JF, LiY, He KM, et al. R-FCN: Object detection via region-based fully convolutional networks[C]. Advances in Neural Information Processing Systems, 2016: 379- 387.
[9] He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition[C]// Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770- 778.
[12] EveringhamM, WinnJ. The PASCALvisual object classes challenge 2010 development kit contents[C]. International Conference on Machine Learning Challenges: Evaluating Predictive Uncertainty Visual Object Classification, 2011, 111( 1): 117- 176.
[13] Jia YQ, ShelhamerE, DonahueJ, et al. Caffe: Convolutional architecture for fast feature embedding[C]// Proceedings of the 22nd ACM International Conference on Multimedia, 2014: 675- 678.
[14] YangX, WangJ, HeS, et al. A SVM approach for vessel fire detection based on image processing[C]// Proceedings of International Conference on Modelling, Identification & Control, 2012: 150- 153.
[15] ZhangX, XuF, SongZ, et al. Video flame detection algorithm based on multi-feature fusion technique[C]. 24th Chinese Control and Decision Conference, 2012: 4291- 4294.
[16] 吴茜茵, 严云洋, 杜静, 等. 多特征融合的火焰检测算法[J]. 智能系统学报, 2015, 10(2): 240-247.
Wu X Y, Yan Y Y, Du J, et al. Fire detection based on fusion of multiple features[J]. Transactions on Intelligent Systems, 2015, 10(2): 240-247.
Article Outline
洪伟, 李朝锋. 基于区域全卷积网络结合残差网络的火焰检测方法[J]. 激光与光电子学进展, 2018, 55(4): 041011. Wei Hong, Chaofeng Li. Flame Detection Method Based on Regional Fully Convolutional Networks with Residual Network[J]. Laser & Optoelectronics Progress, 2018, 55(4): 041011.