基于流形正则化随机游走的图像显著性检测 下载: 915次
1 引言
随着物联网和移动智能成像设备的发展,互联网上的图像和视频信息爆炸式增加。在此大数据环境下,如何对海量信息实现快速分类处理显得尤为重要。在此背景下,视觉显著性检测技术应运而生,其目标是排除图像或视频中的背景信息,提取其中的显著目标或区域,从而降低图像理解等后续任务的复杂度。近年来,显著性检测已被广泛应用于图像/视频智能压缩[1]、图像自适应缩放[2]、目标识别[3-4]、图像拼接[5]等计算机视觉任务中。
从机器学习的样本标注角度对显著性检测模型进行分类,大致可分为有监督模型和无监督模型。其中有监督模型通过对训练样本的真值图进行学习得出显著目标检测器,其在样本真值标注、训练时间和硬件计算性能方面均有较高要求[6-7]。较之前者,无监督模型大都为基于底层视觉特征的自底向上检测方法[8-24],其运算速度快、无需预训练,因此灵活度较高。
近年来,基于图的自底向上显著性检测算法,通过引入图像中像素点之间的内在结构信息,取得了较好的检测效果[8-12,22]。此类算法受人类视觉注意机制启发,为解决计算复杂度问题,将图像分割为若干超像素,从而构造出图节点,再通过随机游走算法计算节点间的相似性。在此基础上,对大量图片进行统计可以发现,显著目标大都位于图像中心区域,而图像的边界区域为显著性目标的概率则较低,故而在图模型中加入背景先验有利于提高算法检测性能[9-12,22]。据此,Jiang等[9]基于随机游走算法,引入吸收马尔可夫链(AMC),在超像素构图中使用四边界节点作为吸收节点,计算图中其余节点到吸收节点的吸收时间作为显著值。但当图像中心区域为非显著目标时,利用该算法进行检测会给予较大显著值。为此,Sun等[11]在AMC的基础上进行改进(即MC15算法),将上边界和左边界超像素作为吸收节点,并引入三种改进策略以平滑显著目标内部和抑制背景。AMC和MC15算法均采用边界节点作为吸收节点,因此当显著目标出现在边界时,算法的查全率会大幅降低。同时,由于吸收时间计算方法的影响,中心背景区域的抑制仍未得到很好解决。Yang等[12]也将图像四周边界超像素作为初始背景查询节点,再进行基于背景和前景的流形排序获得最终显著图。该算法在第一级排序阶段也会将位于边界的显著目标误当作背景,但由于采用了流形正则化框架,在第二级排序中可修正此类错误。同时该算法采用局部正则图和流形正则化对相邻节点进行相似性约束,可有效抑制背景区域。受此启发,针对AMC算法未能充分抑制显著图的中心背景区域和丢失位于图像边界显著目标问题,本文运用全局图模型和AMC算法获得初始显著图,再构造局部正则图和引入流形正则化框架对初始结果进行优化。
2 算法原理
简单线性迭代聚类(SLIC)算法[25]相对于其他超像素分割算法具有运算速度快、内存占用少、像素块大小均匀、对图像中的边缘保留较好等优势,本文首先对输入图像采用SLIC超像素分割,在此基础上进行AMC的全局构图,形成吸收节点和暂态节点,计算暂态节点到吸收节点所需的时间作为该暂态节点的显著值,将各超像素的显著值赋予其所包含的像素点,得到初始显著图。再对超像素构建正则图,获得局部图的相似度矩阵。对初始显著图结果进行自适应阈值分割,大于阈值的超像素点作为前景种子节点,并运用流形正则框架计算出最终结果。整个算法的流程图如
2.1 全局图模型构建
待构建的全局图记为
式中
2.2 吸收马尔可夫链
对于暂态节点被吸收时间的计算,关键是获取图中各节点之间的转移概率矩阵
式中:
相似度矩阵中元素
式中
由
式中
2.3 初始显著图计算
对(4)式进行归一化操作,可得所有超像素点的初始显著值
由(5)式得到超像素显著值,将其赋值给图中对应的像素,可获得初始显著图。初始显著图结果如
图 3. 初始显著图和最终显著图效果对比。(a)输入图像;(b)初始显著图;(c)最终显著图;(d)真值图
Fig. 3. Comparison results between initial saliency maps and final saliency maps. (a) Input images; (b) initial saliency maps; (c) final saliency maps; (d) ground truth
2.4 局部图模型构建
考虑节点间的流形结构,构造
式中
2.5 流形正则化
文献[ 12]中定义流形正则化框架如下:
式中
式中
将(10)式代入(8)式可计算出各超像素点最终的显著值,扩散赋值给每个像素点,得到最终显著图。其结果如
3 实验
在微软亚洲研究院1K数据集(MSRA1K,又称ASD)[16]、微软亚洲研究院10K数据集(MSRA10K)[17]和图像分割评价数据集(SED)[18]上进行测试。实验中超像素个数选取250,权重系数
3.1 数据集
ASD数据集共包括1000张图片,该数据集上的真值图为像素级标注,虽然其中目标的种类变化多样,但大多数为单个目标,且目标与背景差异较为明显。使用简单显著性检测算法也能得到较好效果。MSRA10K数据集由MSRA-A和MSRA-B[19]中共选出10000张图片,并进行像素级标注,图片数目多使其具有很大挑战性。SED数据集共含有200张图片,分为SED1单目标和SED2双目标两个子集,各有100张。
3.2 评价指标
评价指标能够定量度量计算出的显著图与真值之间差异,可通过固定阈值和自适应阈值两种方式进行衡量[16]。固定阈值指分别计算0~255之间共256个阈值。自适应阈值将分割阈值定义为
式中
将二值分割后的显著图结果记为
式中参数
3.3 定量分析
改进算法与AMC算法在ASD、MSRA10K和SED数据集上的PR曲线对比如
图 5. 改进算法和AMC算法在三个数据集上的PR曲线对比。(a) ASD数据集;(b) SED数据集;(c) MSRA10K数据集
Fig. 5. PR curves of proposed method and AMC on three datasets. (a) ASD dataset; (b) SED dataset; (c) MSRA10K dataset
图 6. ASD数据集上各方法的(a) PR曲线和(b) F-measure值
Fig. 6. (a) PR curves and (b) F-measure values of all methods on ASD dataset
图 7. MSRA10K数据集上各方法的(a) PR曲线和(b) F-measure值
Fig. 7. (a) PR curves and (b) F-measure values of all methods on MSRA10K dataset
图 8. SED数据集上各方法的(a) PR曲线和(b) F-measure值
Fig. 8. (a) PR curves and (b) F-measure values of all methods on SED dataset
3.4 定性分析
4 结论
提出了基于流形正则化的随机游走显著性检测方法。构造的全局图模型利用AMC算法来计算图中节点在被吸收节点吸收前的全局吸收时间,并作为节点的显著值,故能够较准确地检测出场景中的显著目标。再针对全局图和AMC算法不能充分抑制背景区域和漏检边界显著目标的不足,引入局部正则图,挖掘相邻超像素间的流形结构以解决上述问题。在三个公开数据集上对其进行测试,实验结果表明,该方法与近几年的其他检测方法相比,在查准率、查全率和
[4] 陈洋, 范荣双, 王竞雪, 等. 结合相位一致和分水岭变换的高分辨率遥感影像分割方法[J]. 激光与光电子学进展, 2017, 54(9): 092803.
[5] Goferman S, Tal A, Zelnik-Manor L. Puzzle-like collage[J]. Computer Graphics Forum, 2010, 29(2): 459-468.
[6] Zhang PP, WangD, Lu HC, et al. Amulet: aggregating multi-level convolutional features for salient object detection[C]∥2017 IEEE International Conference on Computer Vision (ICCV), 2017: 202- 211.
[7] 吴迪, 唐勇奇, 林国汉, 等. 基于显著性局部定向模式和深度学习的鲁棒人脸识别[J]. 光电子·激光, 2016, 27(6): 655-661.
[9] Jiang BW, Zhang LH, Lu HC, et al. Saliency detection via absorbing markov chain[C]∥2013 IEEE International Conference on Computer Vision, 2013: 1665- 1672.
[10] Wei YC, WenF, Zhu WJ, et al. Geodesic saliency using background priors[C]∥European Conference on Computer Vision, 2012: 29- 42.
[12] YangC, Zhang LH, Lu HC, et al. Saliency detection via graph-based manifold ranking[C]∥2013 IEEE Conference on Computer Vision and Pattern Recognition, 2013: 3166- 3173.
[13] 成培瑞, 王建立, 王斌, 等. 基于多尺度区域对比的显著目标识别[J]. 中国光学, 2016, 9(1): 97-105.
[15] 方志明, 崔荣一, 金璟璇. 交通场景静态显著性区域检测[J]. 激光与光电子学进展, 2017, 54(5): 051501.
[16] AchantaR, HemamiS, EstradaF, et al. Frequency-tuned salient region detection[C]∥2009 IEEE Conference on Computer Vision and Pattern Recognition, 2009: 1597- 1604.
[18] AlpertS, GalunM, BasriR, et al. Image segmentation by probabilistic bottom-up aggregation and cue integration[C]∥2007 IEEE Conference on Computer Vision and Pattern Recognition, 2007: 1- 8.
[20] Tavakoli HR, RahtuE, HeikkiläJ. Fast and efficient saliency detection using sparse sampling and kernel density estimation[C]∥Scandinavian Conference on Image Analysis, 2011: 666- 675.
[22] Tu WC, He SF, Yang QX, et al. Real-time salient object detection with a minimum spanning tree[C]∥2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016: 2334- 2342.
[23] MargolinR, TalA, Zelnik-ManorL. What makes a patch distinct?[C]∥2013 IEEE Conference on Computer Vision and Pattern Recognition, 2013: 1139- 1146.
[24] PerazziF, KrähenbühlP, PritchY, et al. Saliency filters: contrast based filtering for salient region detection[C]∥2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012: 733- 740.
Article Outline
汪丽华, 涂铮铮, 王泽梁. 基于流形正则化随机游走的图像显著性检测[J]. 激光与光电子学进展, 2018, 55(12): 121005. Lihua Wang, Zhengzheng Tu, Zeliang Wang. Image Saliency Detection Based on Manifold Regularized Random Walk[J]. Laser & Optoelectronics Progress, 2018, 55(12): 121005.