激光与光电子学进展, 2020, 57 (6): 061007, 网络出版: 2020-03-06   

融合扩张卷积网络与SLAM的无监督单目深度估计 下载: 1189次

Unsupervised Monocular Depth Estimation by Fusing Dilated Convolutional Network and SLAM
作者单位
上海工程技术大学电子电气工程学院, 上海 201600
图 & 表

图 1. 网络框架示意图

Fig. 1. Illustration of the network framework

下载图片 查看原文

图 2. 标准卷积与扩张卷积滤波器对比图。(a)标准卷积滤波器;(b)扩张率为2的扩张卷积滤波器;(c)扩张率为3的扩张卷积滤波器

Fig. 2. Comparison of standard convolution and dilated convolution filters. (a) Standard convolution filter; (b) dilated convolution filter with dilation ratio of 2; (c) dilated convolution filter with dilation ratio of 3

下载图片 查看原文

图 3. 扩张卷积与标准卷积的可视化过程对比图。(a)标准卷积可视化过程;(b)扩张率为2的扩张卷积可视化过程;(c)扩张率为3的扩张卷积可视化过程

Fig. 3. Visualization process comparison of dilated convolution and standard convolution. (a) Visualization process of standard convolution; (b) visualization process of dilated convolution with dilation ratio of 2; (c) visualization process of dilated convolution with dilation ratio of 3

下载图片 查看原文

图 4. ORB-SLAM算法优化全局相机姿态总体流程

Fig. 4. Flow chart of optimizing global camera pose by ORB-SLAM algorithm

下载图片 查看原文

图 5. 三维空间点在图像平面上的投影过程

Fig. 5. Projection process of three-dimensional space points onto the image plane

下载图片 查看原文

图 6. 不同损失变化曲线。(a)重建损失;(b)平滑损失;(c)总体损失

Fig. 6. Curves for different losses. (a) Reconstruction loss; (b) smooth loss; (c) total loss

下载图片 查看原文

图 7. KITTI Odometry数据集中不同序列的相对相机姿态轨迹。(a) 00;(b) 01;(c) 09;(d) 02;(e) 03;(f) 10

Fig. 7. Camera pose trajectories for different sequences in the KITTI Odometry dataset. (a) 00; (b) 01; (c) 09; (d) 02; (e) 03; (f) 10

下载图片 查看原文

图 8. 深度预测的定性比较。(a) RGB输入图像;(b) Garg等[11]的方法;(c) sfmlearner方法[4];(d)本文方法;(e) ground truth

Fig. 8. Qualitative comparison of depth prediction. (a) RGB input image; (b) method of Garg et al.[11]; (c) sfmlearner method[4]; (d) our method; (e) ground truth

下载图片 查看原文

图 9. 深度细节可视化比较。(a)(c)输入图像;(b)(d)输出图像

Fig. 9. Visualization comparison of depth details. (a)(c) Input images; (b)(d) output images

下载图片 查看原文

表 1KITTI Odometry数据集09和10序列的RMSE比较

Table1. RMSE comparison of 09 and 10 sequences in the KITTI Odometry dataset

MethodSequence 09Sequence 10
terror /%rerror per100 m /(°)terror /%rerror per100 m /(°)
Luo et al.[20]3.721.606.062.22
Zhou et al.[4]18.773.2114.333.30
Li et al.[21]7.013.6110.634.65
Zhanet al.[13] (Tem)11.933.9112.453.46
Zhan et al.[13](New YorkUniversitydatasets)11.923.6012.623.43
Ours1.700.501.430.52

查看原文

表 2深度估计模型的TUM评估结果比较

Table2. Comparison of TUM evaluation results for depth estimation model

MethodSupervisedDataErrorAccuracy
ASRlg Rδ1 /%δ2 /%δ3 /%
Method in Ref. [5]KITTI0.2141.6056.5630.29267.388.495.7
Method in Ref. [6]KITTI0.2031.5486.3070.28270.289.095.8
Method in Ref. [7]KITTI0.2021.6146.5230.27567.889.596.5
Method in Ref. [22] (photo)×KITTI0.2111.9806.1540.26473.289.895.9
Method in Ref. [22] (photo+ad)×KITTI0.2201.9766.3400.27370.886.793.4
Method in Ref. [4]×KITTI0.2081.7686.8560.28367.888.595.7
Method in Ref. [4](without explainability masks)×KITTI0.2212.2267.5270.29467.688.595.4
Ours×KITTI0.1891.5926.4320.26871.491.196.3

查看原文

戴仁月, 方志军, 高永彬. 融合扩张卷积网络与SLAM的无监督单目深度估计[J]. 激光与光电子学进展, 2020, 57(6): 061007. Renyue Dai, Zhijun Fang, Yongbin Gao. Unsupervised Monocular Depth Estimation by Fusing Dilated Convolutional Network and SLAM[J]. Laser & Optoelectronics Progress, 2020, 57(6): 061007.

本文已被 2 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!