1 江西理工大学 理学院,江西赣州34000
2 江西理工大学 电气工程与自动化学院,江西赣州341000
多视图立体重建(Multi-view stereo Reconstruction,MVS Reconstruction)的目标是根据一组已知摄像机参数的多视角图像来重建场景的三维模型,是近年来三维重建的一类主流方法。本文针对最新的近百个基于深度学习的MVS方法做了较为系统的算法评估对比。首先,对现有的基于监督学习的MVS方法,按照特征提取、代价体构建、代价体正则化和深度回归的重建流程对各算法进行梳理,重点对代价体构建和正则化这两阶段的改进策略进行归纳总结,对于无监督的MVS方法,主要分析各算法损失项的设计,并按照其训练方式进行分类;其次,总结了MVS方法常用的实验数据集及其对应的性能评价指标,进一步研究特征金字塔结构、注意力机制、由粗到精等策略的引入对MVS网络性能的影响;此外,介绍了MVS方法的具体应用场景,包括数字孪生、自动驾驶、机器人技术、遗产保护、生物科学等领域;最后,提出关于MVS改进方向的建议,并对多视图三维重建未来的技术难点与研究方向进行探讨。
多视图立体 三维重建 深度学习 深度估计 单应性变换 multi-view stereo 3D reconstruction deep learning depth estimation homography transformation 光学 精密工程
2023, 31(16): 2444
红外与激光工程
2021, 50(S2): 20200520
融合视觉传感器和激光雷达可以实现优于单一传感器的同时定位与建图(SLAM)系统,现有的视觉和激光雷达融合算法仍然存在计算复杂度高、系统精度及稳定性受错误的深度匹配影响等问题。为了更加高效、鲁棒地融合视觉和激光雷达的信息,充分利用图像和激光点云中的地平面信息,提出了高效的视觉辅助激光雷达SLAM算法。首先,从激光点云中分割出地面点云用于提取图像中的地面ORB特征点,并通过单应性变换中的交比不变性校验特征匹配,从而高效鲁棒地利用单应性矩阵分解实现绝对尺度相机运动估计。然后,将得到的相机运动估计以李群SE(3)形式进行插值,用于校正激光雷达在自身运动过程中产生的点云畸变。最后,单目相机的运动估计作为初值用于激光里程计的位姿优化。公共数据集KITTI和实际环境的测试结果表明,本文算法可以有效利用相机运动估计对激光点云畸变进行校正,实时准确地实现里程计和建图。
遥感 同时定位与建图 激光雷达 单目相机 单应性变换 交比不变性 光学学报
2020, 40(24): 2428002
云南师范大学旅游与地理科学学院, 云南 昆明 650500
提出一种加速分割特征算法与快速视网膜关键点描述子(FREAK)结合的图像配准算法。首先对图像建立尺度空间,并在此基础上利用加速分割特征优化算法检测图像特征点,结合Harris算法对特征点进行过滤,保留强角点用于图像配准;其次结合 FREAK对检测的特征点进行描述,计算其特征向量,采用汉明距离替代传统的欧氏距离进行图像匹配,并采用随机采样一致性方法精炼匹配点来避免由于噪声和物体位置移动等原因产生的误匹配。从配准精度和配准时间两个方面,对本文方法与尺度不变特征变换算法、二进制稳健独立基本特征算法及原始FREAK算法进行对比实验,结果表明,本文方法具有配准速度快、准确性高、稳定性好等特点。
图像处理 加速分割特征优化算法 视网膜的特征点描述法 单应性变换 图像配准 激光与光电子学进展
2019, 56(1): 011006