结合同场景彩色图像的深度图超分辨率重建 下载: 887次
1 引言
准确、高分辨率的深度测量一直是计算机视觉领域的研究重点和热点,可用于物体识别、机器导航、自动辅助驾驶等。传统的计算机视觉方法是通过复杂的立体计算或者成本较高的激光距离测量技术来获取场景深度的 [ 1 - 2 ] 。
基于飞行时间(TOF)原理的三维测距相机,通过测量主动光线发射到物体表面后反射回来的时间差计算出物体表面的距离信息,可以实时地采集到物体表面的三维几何信息,受场景纹理和环境光照条件的影响非常小,是对传统三维信息获取方法的一种突破,势必促进相关领域的发展。但由于传感器硬件条件的限制,它们得到的深度图像分辨率非常低,并且受到成像噪声干扰,限制了TOF相机的市场推广与应用。
为提高深度图像分辨率,目前已经有一些关于深度图像超分辨率算法的研究 [ 3 - 14 ] 。主要有两种思路:1)只利用深度图像的超分辨率算法。最简单的深度图像超分辨率方法可通过图像插值实现,但插值后的深度图像在物体边缘区域十分模糊,无法满足许多后续应用的要求。利用序列深度图像的超分辨率重建方法 [ 6 - 7 ] ,需要多帧深度图像之间的亚像素位移信息,很难保证实时性,而且TOF相机采集深度的随机误差会对多帧图像之间的运动估计及配准产生比较大的影响。2)结合同场景高分辨率彩色图像的超分辨率算法。Yang等 [ 8 ] 利用双边滤波函数指导深度图的超分辨率重建。Diebel等 [ 9 ] 运用马尔科夫随机场建立彩色图像和深度图像之间的联系,通过构建的能量最优解实现深度图像的超分辨率重建。Lu等 [ 10 ] 采用了改进的马尔科夫随机场。Park等 [ 11 ] 引入非局部均值滤波的平滑约束能量项, 应用于TOF相机采集得到的深度图像。Kopf等 [ 12 ] 和He等 [ 13 ] 分别采用联合双边滤波函数和引导图像滤波函数指导深度图超分辨率重建。Ferstl等 [ 14 ] 在全局优化能量函数中采用二阶广义全变分(TGV)作为深度图像的高阶先验约束,在优化过程中,利用由彩色图像计算得到的张量引导深度图像的超分辨率重建。
本文在二阶TGV模型的基础上,充分利用低分辨率深度图插值放大后的深度边缘和同场景彩色图像的梯度信息,提出联合约束的二阶TGV深度超分辨率重建方法,该方法在有效抑制噪声的基础上,能够保持深度图在对象边界处的不连续性,获得较好的超分辨率重建质量。
2 二阶TGV深度图超分辨率重建模型
文献[
14
]利用高分辨率彩色图像的边缘线索提高深度图分辨率。设高分辨率深度图和彩色图分别表示为
式中
式中
式中
3 插值深度图和彩色图约束的二阶TGV深度图超分辨率重建
结合同场景彩色图像的深度图超分辨率重建,其理论基础是同场景的彩色图像和深度图像在颜色和深度上往往存在相似的不连续性
[
15
]
,但有时彩色图像和深度图的边缘也不是完全具有这种关系的,需要同时结合高分辨率彩色图像和深度图的深度边缘信息,对重建的高分辨率深度图进行引导优化,获得更好的效果。因此,提出采用传统的插值方法,获得与彩色图像一样分辨率的初始深度图,再利用初始高分辨率深度图提供的深度边缘信息,从以下两个方面对二阶TGV正则化项进行优化:1)计算扩散张量
3.1 低分辨率深度图的预处理
低分辨率深度图的预处理步骤主要是为了获得比较准确的深度梯度图,梯度图分辨率与彩色图像分辨率一致。首先将低分辨率深度图
TOF相机采集的深度图像具有噪声干扰,因此对深度图像进行边缘检测之前需要进行有效地抑制噪声。常用的边缘检测算子如 Canny、Sobel算子常常在检测边缘的同时加强噪声,而形态学边缘检测器不会放大噪声。形态学梯度算子的性能取决于结构元素的大小,尺度大的结构元素去噪能力强,但会模糊图像细节;尺度小的结构元素能保持图像的细节信息,但是去噪能力弱。所以,采用多尺度形态学的去噪和梯度计算方法。
形态学滤除噪声算法 [ 16 ] 如下:
式中
对滤除噪声后的图像,计算形态学梯度如下:
式中⊕表示膨胀运算,☉表示腐蚀运算。结合(5)和(6)式,可以得到多尺度形态学梯度为
经过上述预处理步骤,可以很好地抑制深度图像噪声,计算的形态学梯度为下一步有效提取深度边缘奠定良好的基础。
3.2 二阶TGV正则项的优化
同场景的彩色图像和深度图像在颜色和深度上往往存在相似的不连续性,但有时彩色图像和深度图的边缘也不是完全对应的。位于同样深度位置的物体有时也具有丰富的纹理和颜色变化,为了避免这种情况下出现错误的深度边缘,在二阶TGV正则项计算
式中
式中
另外,本文方法在二阶TGV正则项中引入由插值深度图像
从(10)式可以看出,当
优化后的二阶TGV深度图超分辨率重建的目标函数定义为
3.3 目标函数求解
利用原始对偶算法 [ 17 - 18 ] 对(11)式进行求解,根据Legendre-Fenchel对偶原理,(11)式的对偶形式为
式中
初始值选择为:
式中
3.4 算法实现
本文提出的插值深度图和彩色图像联合约束的二阶TGV深度图超分辨率重建方法,可以利用同场景的低分辨率深度图
1) 将
2) 初始化:
3) 根据(15)式进行第
4) 当
4 实验结果与分析
为了验证本文方法的有效性,对Middlebury2007数据集 [ 20 - 21 ] 进行实验分析,采用文献[ 14 ]提供的下采样倍数为4的含高斯噪声的art、moebius、books低分辨率深度图像,分辨率为344 pixel×272 pixel。同场景彩色图像分辨率为1376 pixel×1088 pixel,分别利用本文算法和最近邻插值、双线性插值、双三次插值、文献[ 9 ]方法、文献[ 11 ]方法、文献[ 14 ]方法重建高分辨率深度图。
文献[
9
]方法、文献[
11
]方法的实验结果图像和文献[
14
]方法的Matlab程序从网站下载,为了方便比较,本文方法和文献[
14
]方法的参数设置保持一致,采用文献中提供的参数值,
图 1. art实验结果。(a) RGB图;(b)低分辨率深度图;(c)最近邻插值;(d)双线性插值;(e)双三次插值;(f)文献[ 9 ]方法;(g)文献[ 11 ]方法;(h)文献[ 14 ]方法;(i)本文方法;(j)真实深度图
Fig. 1. Experimental results of art. (a) RGB image; (b) low resolution depth image; (c) nearest interpolation;(d) bilinear interpolation; (e) bicubic interpolation; (f) Ref. [9] method; (g) Ref. [11] method;(h) Ref. [14] method; (i) proposed method; (j) true depth image
图 2. moebius实验结果。(a) RGB图;(b)低分辨率深度图;(c)最近邻插值;(d)双线性插值;(e)双三次插值;(f)文献[ 9 ]方法;(g)文献[ 11 ]方法;(h)文献[ 14 ]方法;(i)本文方法;(j)真实深度图
Fig. 2. Experimental results of moebius. (a) RGB image; (b) low resolution depth image; (c) nearest interpolation;(d) bilinear interpolation; (e) bicubic interpolation; (f) Ref. [9] method; (g) Ref. [11] method;(h) Ref. [14] method; (i) proposed method; (j) true depth image
图 3. books实验结果。(a) RGB图;(b)低分辨率深度图;(c)最近邻插值;(d)双线性插值;(e)双三次插值;(f)文献[ 9 ]方法;(g)文献[ 11 ]方法;(h)文献[ 14 ]方法;(i)本文方法;(j)真实深度图
Fig. 3. Experimental results of books. (a) RGB image; (b) low resolution depth image; (c) nearest interpolation;(d) bilinear interpolation; (e) bicubic interpolation; (f) Ref. [9] method; (g) Ref. [11] method;(h) Ref. [14] method; (i) proposed method; (j) true depth image
从
为了客观分析超分辨率重建的结果,采用均方根误差
式中
表 1. 均方根误差比较
Table 1. Comparison of root-mean-square error
|
5 结论
在优化文献[
14
]二阶TGV模型正则化项基础上,提出了一种插值深度图和彩色图像联合约束的二阶TGV深度超分辨率重建方法。利用多尺度形态学预处理,获取插值深度图的梯度信息,然后将插值深度图和高分辨率彩色图像两者的梯度信息联合,构造二阶TGV正则项,通过原始对偶算法求解完成深度图的超分辨率重建。实验结果表明,该方法可以获得质量较好的高分辨率深度图像。其中,
[1] 王琪龙, 李建勇, 沈海阔. 双目视觉-激光测距传感器目标跟踪系统[J]. 光学学报, 2016, 36(9): 0912002.
王琪龙, 李建勇, 沈海阔. 双目视觉-激光测距传感器目标跟踪系统[J]. 光学学报, 2016, 36(9): 0912002.
[2] 李熙, 汤儒峰, 李祝莲, 等. 基于二值图像的卫星激光测距数据处理[J]. 中国激光, 2014, 41(12): 1208005.
李熙, 汤儒峰, 李祝莲, 等. 基于二值图像的卫星激光测距数据处理[J]. 中国激光, 2014, 41(12): 1208005.
Li Xi, Tang Rufeng, Li Zhulian, et al. Laser ranging data processing based on the analysis of the binary image[J]. Chinese J Lasers, 2014, 41(12): 1208005.
Li Xi, Tang Rufeng, Li Zhulian, et al. Laser ranging data processing based on the analysis of the binary image[J]. Chinese J Lasers, 2014, 41(12): 1208005.
[3] SchuonS , TheobaltC , DavisJ , et al . High-quality scanning using time-of-flight depth super-resolution[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition , 2008 : 1 - 7 .
SchuonS , TheobaltC , DavisJ , et al . High-quality scanning using time-of-flight depth super-resolution[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition , 2008 : 1 - 7 .
[4] YangY , WangZ . Range image super-resolution via guided image filter[C]. International Conference on Internet Multimedia Computing and Service , 2012 : 200 - 203 .
YangY , WangZ . Range image super-resolution via guided image filter[C]. International Conference on Internet Multimedia Computing and Service , 2012 : 200 - 203 .
[5] 邸维巍, 张旭东, 胡良梅, 等. 彩色图约束的二阶广义总变分深度图超分辨率重建[J]. 中国图象图形学报, 2014, 19(8): 1162-1167.
邸维巍, 张旭东, 胡良梅, 等. 彩色图约束的二阶广义总变分深度图超分辨率重建[J]. 中国图象图形学报, 2014, 19(8): 1162-1167.
Di Weiwei, Zhang Xudong, Hu Liangmei, et al. Depth image super-resolution based on second-order total generalized variation constrained by color image[J]. Journal of Image and Graphics, 2014, 19(8): 1162-1167.
Di Weiwei, Zhang Xudong, Hu Liangmei, et al. Depth image super-resolution based on second-order total generalized variation constrained by color image[J]. Journal of Image and Graphics, 2014, 19(8): 1162-1167.
[6] CuiY , SchuonS , ChanD , et al . 3D shape scanning with a time-of-flight camera[C]. Computer Vision and Pattern Recognition , 2010 : 1173 - 1180 .
CuiY , SchuonS , ChanD , et al . 3D shape scanning with a time-of-flight camera[C]. Computer Vision and Pattern Recognition , 2010 : 1173 - 1180 .
[7] SchuonS , TheobaltC , DavisJ , et al . LidarBoost: depth superresolution for ToF 3d shape scanning[C]. Computer Vision and Pattern Recognition , 2009 : 343 - 350 .
SchuonS , TheobaltC , DavisJ , et al . LidarBoost: depth superresolution for ToF 3d shape scanning[C]. Computer Vision and Pattern Recognition , 2009 : 343 - 350 .
[8] YangQ , YangR , DavisJ , et al . Spatial-depth super resolution for range images[C]. Computer Vision and Pattern Recognition , 2007 : 1 - 8 .
YangQ , YangR , DavisJ , et al . Spatial-depth super resolution for range images[C]. Computer Vision and Pattern Recognition , 2007 : 1 - 8 .
[9] DiebelJ , ThrunS . An application of markov random fields to range sensing[C]. Advances in Neural Information Processing Systems , 2005 : 291 - 298 .
DiebelJ , ThrunS . An application of markov random fields to range sensing[C]. Advances in Neural Information Processing Systems , 2005 : 291 - 298 .
[10] LuJ , MinD , Pahwa RS , et al . A revisit to MRF-based depth map super-resolution and enhancement[C]. IEEE International Conference on Acoustics, Speech and Signal Processing , 2011 : 985 - 988 .
LuJ , MinD , Pahwa RS , et al . A revisit to MRF-based depth map super-resolution and enhancement[C]. IEEE International Conference on Acoustics, Speech and Signal Processing , 2011 : 985 - 988 .
[11] ParkJ , KimH , Tai YW , et al . High quality depth map upsampling for 3D-TOF cameras[C]. IEEE International Conference on Computer Vision , 2012 : 1623 - 1630 .
ParkJ , KimH , Tai YW , et al . High quality depth map upsampling for 3D-TOF cameras[C]. IEEE International Conference on Computer Vision , 2012 : 1623 - 1630 .
[12] KopfJ , Cohen MF , LischinskiD , et al . Joint bilateral upsampling[C]. ACM Transactions on Graphics , 2007 .
KopfJ , Cohen MF , LischinskiD , et al . Joint bilateral upsampling[C]. ACM Transactions on Graphics , 2007 .
[13] HeK , SunJ , TangX . Guided image filtering[C]. European Conference on Computer Vision , 2010 : 1 - 14 .
HeK , SunJ , TangX . Guided image filtering[C]. European Conference on Computer Vision , 2010 : 1 - 14 .
[14] FerstlD , ReinbacherC , RanftlR , et al . Image guided depth upsampling using anisotropic total generalized variation[C]. IEEE International Conference on Computer Vision , 2013 : 993 - 1000 .
FerstlD , ReinbacherC , RanftlR , et al . Image guided depth upsampling using anisotropic total generalized variation[C]. IEEE International Conference on Computer Vision , 2013 : 993 - 1000 .
[15] TorralbaA , FreemanW . Properties and applications of shape recipes[C]. Computer Vision & Pattern Recognition , 2003 .
TorralbaA , FreemanW . Properties and applications of shape recipes[C]. Computer Vision & Pattern Recognition , 2003 .
[16] 张利红, 梁英波, 吴定允, 等. 基于改进多尺度形态学的带钢缺陷图像边缘检测[J]. 激光与红外, 2014, 44(3): 330-334.
张利红, 梁英波, 吴定允, 等. 基于改进多尺度形态学的带钢缺陷图像边缘检测[J]. 激光与红外, 2014, 44(3): 330-334.
Zhang Lihong, Liang Yingbo, Wu Dingyun, et al. Strip steel surface defects imaging edge inspection based on improved multi-scale morphology[J]. Laser & Infrared, 2014, 44(3): 330-334.
Zhang Lihong, Liang Yingbo, Wu Dingyun, et al. Strip steel surface defects imaging edge inspection based on improved multi-scale morphology[J]. Laser & Infrared, 2014, 44(3): 330-334.
[17] Chambolle A, Pock T. A first-order primal-dual algorithm for convex problems with applications toimaging[J]. Journal of Mathematical Imaging and Vision, 2011, 40(1): 120-145.
Chambolle A, Pock T. A first-order primal-dual algorithm for convex problems with applications toimaging[J]. Journal of Mathematical Imaging and Vision, 2011, 40(1): 120-145.
[18] Esser E, Zhang X, Chan T. A general framework for a class of first order primal-dual algorithms for convex optimization in imagingscience[J]. Siam Journal on Imaging Sciences, 2010, 3(4): 1015-1046.
Esser E, Zhang X, Chan T. A general framework for a class of first order primal-dual algorithms for convex optimization in imagingscience[J]. Siam Journal on Imaging Sciences, 2010, 3(4): 1015-1046.
[19] PockT , ChambolleA . Diagonal preconditioning for first order primal-dual algorithms in convex optimization[C]. IEEE International Conference on Computer Vision , 2011 : 1762 - 1769 .
PockT , ChambolleA . Diagonal preconditioning for first order primal-dual algorithms in convex optimization[C]. IEEE International Conference on Computer Vision , 2011 : 1762 - 1769 .
[20] HirschmullerH , ScharsteinD . Evaluation of cost functions for stereo matching[C]. Computer Vision and Pattern Recognition , 2007 : 1 - 8 .
HirschmullerH , ScharsteinD . Evaluation of cost functions for stereo matching[C]. Computer Vision and Pattern Recognition , 2007 : 1 - 8 .
[21] ScharsteinD , PalC . Learning conditional random fields for stereo[C]. Computer Vision and Pattern Recognition , 2007 : 1 - 8 .
ScharsteinD , PalC . Learning conditional random fields for stereo[C]. Computer Vision and Pattern Recognition , 2007 : 1 - 8 .
Article Outline
王宇, 朴燕, 孙荣春. 结合同场景彩色图像的深度图超分辨率重建[J]. 光学学报, 2017, 37(8): 0810002. Yu Wang, Yan Piao, Rongchun Sun. Depth Image Super-Resolution Construction Combined with High-Resolution Color Image of the Same Scene[J]. Acta Optica Sinica, 2017, 37(8): 0810002.