激光与光电子学进展, 2019, 56 (3): 031202, 网络出版: 2019-07-31   

基于图优化的多相机系统高精度自主定位方法 下载: 1220次

High-Precision Autonomous Positioning Method of Multi-Camera System Based on Graph Optimization
作者单位
天津大学精密测试技术及仪器国家重点实验室, 天津 300072
摘要
多相机系统的自主定位技术是通过多个相机对空间中的特征点进行观测而恢复出系统自身的空间位姿,借助多相机的大视场克服复杂现场环境影响,提高测量精度。针对多相机系统结构复杂、位姿恢复难度大、耗时长的问题,提出一种使用基于图优化模型的自主定位方法。在求解高效透视n点定位问题得到近似估计位姿的基础上,借助图优化框架对多相机系统与空间控制点的观测问题进行建模,进而将位姿恢复问题等价为最小化重投影误差非线性优化问题。借助近景摄影三坐标测量系统(VSTARS)搭建的控制场和直线导轨搭建的多相机系统,测量和模拟实验结果表明,该方法具有较高的测量精度和较快的运行速度。
Abstract
The autonomous positioning technology of a multi-camera system can restore the spatial position and pose of the system by using the multiple cameras to observe the feature points in space, which can overcome the influence of the complicated environment and improve the precision of measurement by using the large field of view of multiple cameras. Aiming at the problem of the complex structure of a multi-camera system, posture recovery is rather difficult and time-consuming, a self-positioning method based on the graphic optimization model is proposed. On the basis of solving the efficient perspective-n-point-positioning problem to obtain the approximate position and pose of a multi-camera system, a graph optimization framework is used to model the observation problem of the multi-camera system and the spatial control points. Thus, the problem of the position and pose recovery is equivalent to the problem of the minimization reprojection error nonlinear optimization. Using a control field build by a video-simultaneous triangulation and resection system (VSTARS) and a multi-camera system build by a linear guideway, the results of the measurement and simulation experiment show that this method possesses a high measurement accuracy and a fast running speed.

1 引言

随着大型高端装备制造领域,机器人、AR眼镜、头盔等智能工具的大量应用,在复杂制造环境下实现自主精确定位以实现有效导航、保证安全运行逐渐成为研究的重要目标。在现有自主定位方法中,基于视觉的自主定位方法以摄像机为主要传感器,具有适应性好、精度高、成本可控等突出优点,是当前的主流发展方向[1]。目前视觉定位方法主要借助单目、双目和RGBD相机实现[2-3],依赖场景中先验特征信息和相机成像模型形成空间约束条件,求解透视n点定位(PnP)问题[4],构造优化方程实现坐标解算。在实际的测量过程中能观察到的特征信息(控制点)数量严重影响自主定位系统的精度和稳健性[5],但现有基于单目或双目等测量方法受限于相机视场只能获得前方一定角度范围内的图像,无法获取充分的特征信息,精度难以满足测量要求[6-7]

相比于上述方法,由采用全方位视觉传感的方式可以获取全周图像信息,有效扩大视场。本文采用多个数字相机组成的多相机自主定位系统,通过大视场内多个相对位姿固定的相机与同样位置信息已知的高精度空间控制点形成覆盖空间的强稳健性约束条件,可以很好地实现系统自身的高精度定位[8],是解决现场自主定位问题的一种有效手段。且相对于全景镜头,多相机自主定位系统成像具有较小的图像畸变,可以达到较高的测量精度。

多相机自主定位的难点在于系统结构复杂难以处理。多相机的位姿需要统一到系统坐标系下,且需要考虑多相机间不同的内部参数影响[9]。崔承刚等[10]使用重投影误差和辅助相机内参的罚函数来优化系统位姿,但这种方法模型相对简单,无法很好的表征和解决多相机系统模型下的测量问题,且精度不高,罚函数的使用与雅克比矩阵的直接计算也使得计算时长被大大增加。为解决上述问题,本文提出一种基于图优化(G2O)[11]的多相机自主定位方法,将多相机测量问题建模为由“顶点”和“边”构成的图模型,在框架内通过非线性优化的方法进行迭代求解。相比于高效透视n点定位(EPnP)方法,图优化算法在定位过程中综合考虑了多个相机之间的约束关系,并借助李群的扰动模型进行雅可比矩阵求解,可以有效提高运算速度、测量精度和定位的稳健性。

2 基于图优化的定位算法

2.1 多相机定位系统坐标映射模型

多相机的视觉定位问题的核心目标是恢复出多相机系统坐标系在世界坐标系下的三维坐标。为实现对目标问题的准确建模,需要对空间点到像素点投影的坐标映射关系建立完整的数学模型[12]。多相机映射模型如图1所示。

图 1. 多相机系统坐标映射模型

Fig. 1. Coordinate mapping model of multi-camera system

下载图片 查看所有图片

考虑某空间点相对于世界坐标系W的坐标为Pi= XiYiZiT,记Pi在多相机系统参考坐标系下的坐标为P'i= X'iY'iZ'iTPiP'i之间的变换关系为

P'i=RtPi+tt,(1)

式中Rttt为世界坐标系到多相机系统坐标系位姿变换矩阵Mt的旋转矩阵和平移矩阵,并用欧氏变换群SE(3)来表示,对应的李代数记为ξ,指数映射为exp(ξ^),其中^符号代表从向量到反对称矩阵的变换。(1)式使用齐次坐标可以表示为

X'iY'iZ'i1=exp(ξ^)XiYiZi1(2)

Mj为相机j的相机坐标系相对于多相机系统坐标系的位姿变换矩阵,Kj为相机j的内参矩阵。点P'i经过Mj变换后坐标为Pij= XijYijZijT,经过Kj的投影变换后投影坐标为pij= uijvijT。三者之间具体的变换关系如下

XijYijZij1=MjX'iY'iZ'i1=Rjtj01X'iY'iZ'i1sijuijvij1=KjXijYijZij=fx0u00fyv0001XijYijZij,(3)

式中sij为值与Zij相等的系数。

2.2 面向多相机定位的图优化算法设计

2.2.1 图优化定位算法

图优化算法由Lu等[13]最先提出,并用于求解定位与地图构建问题(SLAM)中的光束平差(BA)。在视觉或激光定位问题的求解过程中,通过保留所有的观测数据帧以及帧间的空间约束关系,并将约束看作是随机观测,利用最大似然的方法估计得到位姿。这种思想可以通过图的方式形象表现出来,使用图顶点表示待求解的位姿或其他变量,使用顶点间的边来描述空间的约束关系,从而将位姿估计问题转化为图的优化问题,即通过调整图中顶点的位置使其更好地满足边的约束关系。

基于图优化定位算法主要包括图优化目标函数的建立、图优化初值的获取、图优化模型的建立三部分,如图2所示。目标函数的建立主要考虑的是找到与待求目标相关联的优化目标从而构建优化函数。图优化作为非线性算法,为避免陷入局部最优,需要目标函数以合适的起点执行下降,这就需要获取最优初值。在确定了目标函数和初值后,需要将整体求解问题以完整的图优化模型的方式构建出来,包括顶点、边、优化方式等,从而完成图优化的整体框架搭建。算法在建立的图优化框架基础上进行目标函数的迭代下降,完成目标的空间位置恢复。

图 2. 图优化算法流程

Fig. 2. Algorithm flow of graph optimization

下载图片 查看所有图片

2.2.2 面向多相机定位的图优化算法设计

1) 多相机定位的图优化目标函数建立[14]

图优化框架下的求解是通过优化一个通用的非线性函数,使得重投影误差之和为最小,从而获得高精度的相机位姿参数。图优化的光束平差采用重投影误差的平方形式(二范式)度量误差并作为待优化函数g,找出使g最小时的Mt

gMt=minMt12eMt2,(4)

式中e为重投影误差值。图优化框架借助高斯牛顿法,Levenberg-Marquardt(LM)方法等作为下降策略,不断寻找梯度并下降,进而实现收敛,因此需要计算对应的雅克比矩阵。

由(1)~(5)式可知,多相机系统位姿定位主要求解的是重投影误差最小的非线性优化问题,单次定位涉及m个相机以及可以被相机观测到的n个点。位姿求解可以整体表示为

ξ*=argminξ12c=1nd=1mecd2=argminξ12c=1nd=1mzcd-hdξ,Pc2,(5)

式中:ecd为当前相机d观测空间中Pc的误差大小;zcd为相机d观测空间中Pc的观测值;hdξ,Pc为观测模型,表示在系统位姿ξ下相机d观测Pc的估计坐标值。

为了求解(4)式,就需要对函数g(Mt)进行非线性优化。以ξ作为待优化变量,Δξ为增量,将目标函数更新为

12gξ+Δξ212e+JΔξ,(6)

式中:雅克比矩阵J为整个代价函数在当前状态下对系统坐标系的偏导。由于下降策略需要的增量线性方程的矩阵H都由雅克比矩阵J得到,为了能够对问题进行优化,就需要对雅克比矩阵进行推导计算。为了简化优化、提高速度,假设投影像素坐标pij已经执行了预去畸变处理。由(2)~(3)式可知:

sijpi=KjPijPij=MjP'iP'i=exp(ξ^)Pi(7)

为了求解雅克比矩阵,可以对ξ^左乘扰动量δξ,然后求误差e的变化关于扰动量的导数。由链式法可以得到:

J=eδξ=limδξ0eδξξδξ=ePijPijP'iP'iδξ,(8)

式中:⊕为李代数的左乘扰动;第二项为经过相机坐标系变换后的点Pij对变换前点的导数,由(1)式可知,经过求导后只剩下Rj;第三项为P'i关于李代数的导数。假设李代数ξ对应的变换为T,给T左乘扰动ΔT=exp(δξ^),根据欧氏变换群左乘扰动的性质可知:

P'iδξ=TPiδξ=I-P^'i,(9)

式中^ 为从向量到反对称矩阵的变换,最终得到了2行6列的矩阵J,其具体表示形式为

J2×6=-fxZij0-fxXijZij20fyZij-fyYijZij22×3Rj3×31000Z'i-Y'i010-Z'i0X'i001Y'i-X'i03×6(10)

2) 多相机定位的图优化初值获取

图优化框架下的位姿求解需要获取多相机系统坐标系的位姿初始估计值[15]。多相机系统坐标系的建立是通过选取多个相机镜头后一点建立的约定系统坐标系,故而无法通过激光跟踪仪、外部粘贴点等方法获取。考虑多相机系统下的相机j,利用Pipij之间的匹配关系,通过求解EPnP直接恢复出当前相机相对于世界坐标系的位姿变换关系。令Ep为EPnP测量方法的求解函数,Ej为恢复得到的相机j相对于世界坐标系的位姿变换矩阵,Pj-allpj-all分别为相机j观测到的全部空间控制点和像素坐标点。为最优化系统坐标系初始位姿,对多相机系统下全部m个相机,以重投影误差为评定函数,选择误差最小相机作为最优参考相机k

Ej=Ep(Pj-all,pj-all,Kj),(11)k=argminjc=1nKjEjPc-pc2(12)

借助外参标定得到相机k相对于系统坐标系之间的位姿变换关系为Mk,可以得到系统坐标系初始位姿Mt0

Mt0=EkMk(13)

3) 多相机定位的图优化模型建立

图优化算法借助可扩展的框架对问题进行迭代求解,在求解过程中需要将目标问题在框架下建立模型。对于多相机系统的测量问题,需要将问题建模成由顶点和边构成的图,其中顶点代表可变或固定参数,边连接对应的顶点代表误差函数。多相机系统的模型如图3所示。

图 3. 多相机系统的图优化求解模型

Fig. 3. Graph optimization model of multi-camera system

下载图片 查看所有图片

多相机自主定位系统的模型构建步骤为[14]

1) 建立世界坐标系w

2) 添加多相机系统坐标系顶点,以系统坐标系相对于世界坐标系转换矩阵Mt表示系统空间位姿,并以Mt0为位姿初始值。

3) 添加相机坐标系顶点,以相机坐标系相对于系统坐标系的位姿变换矩阵Mj来表示相机位姿,该位姿由相机间外参标定获得。

4) 添加相机内参顶点,以相机内参矩阵Kj表示相机对空间点的投影属性。

5) 添加空间三维控制点顶点,以Pi坐标值来表示空间点在世界坐标系下的位置,并认为该坐标高度可靠。

6) 建立四元边,以Eij表示相机jPi的观测误差边,该边依次连接系统坐标系顶点、单次观测对应的相机位姿顶点、空间控制点顶点,以及相机内参顶点,并建立重投影误差函数、线性增加函数。

7) 通过已经求得的雅克比矩阵J构建下降方向,选取LM法进行梯度下降,确定最大迭代次数和停止迭代的条件。

3 实验验证

为了验证所述算法,利用实验室已有的多相机测量头盔、直线导轨、VSTARS控制场等硬件设施进行实验。如图4所示,头盔上安装有3D打印制作的刚性结构件,三相机和采集用可编程逻辑阵列(FPGA)模块被固定在该刚性结构件上。使用易思维(ISV)开发的采集程序进行三相机的高精度并行采集。相邻相机之间光轴呈角约为60°。

图 4. 多相机测量装置。(a)多相机系统;(b)高精度直线导轨

Fig. 4. Multi-camera measuring system. (a) Multi-camera system; (b) high precision linear guide rail

下载图片 查看所有图片

表 1. 外参标定结果

Table 1. Camera external parameter calibration results

ParameterControl field(1-2)Turntable(1-2)Error(1-2)Control field(2-3)Turntable(2-3)Error(2-3)
α /(°)-1.8412-1.7787-0.0625-1.9852-1.7353-0.2499
β /(°)31.689731.14770.542029.736830.4546-0.7178
γ /(°)-1.9087-1.7975-0.1112-2.0064-1.9747-0.0317
Tx /mm-87.9742-88.12840.1542-88.5344-88.45450.0799
Ty /mm-0.4989-0.3567-0.1422-0.5677-0.3674-0.2003
Tz /mm-19.1267-19.56700.4403-20.1275-20.42340.2959

查看所有表

相机利用高精度转台的角度基准实现高精度标定,采用LM优化算法,得到相机内外参,在此对标定环境无特殊要求。三相机内参测量结果得到的重投影误差分别为0.1700,0.1598 ,0.14987 pixel,相机间外参及误差如表1所示。

在约5 m×6 m的空间内使用VSTARS搭建由反光控制点构成的空间控制场[16],其中大型编码点被VSTARS用于定位反光控制点,小型反光点作为实际高精度控制点,如图5所示。VSTARS测量系统相对精度可达0.05×104,即10 m范围的测量精度达到0.044 mm。实验过程中使用两个1000 W碘钨灯照射空间反光点以提高反光强度,实验室环境在10 m以内多次进行反光点的标定,并进行软件内部的误差分析,测量精度可以达到μm级精度,为二维精度。

多相机系统被固定放置在滑动导轨上,相机光轴近似平行于地面。多个相机同时观测空间中的控制点,并借助由图优化框架搭建好的多相机系统测量模型进行多相机系统的位姿计算。由于测量的世界坐标系设定为VSTARS构建的系统坐标系,因此空间控制点的坐标以相对于世界坐标系的位置来表示。

图 5. 测量现场环境。(a)空间VSTARS控制场;(b)实际测量现场

Fig. 5. Experiment environment. (a) Spatial VSTARS control field; (b) actual experiment environment

下载图片 查看所有图片

使用直线导轨来模拟多相机测量系统在实验环境下空间位姿的改变,通过多次移动导轨和测量获取一系列多相机系统在世界坐标系下的位姿数据。假设初始时刻下系统坐标系的空间位姿为T0,滑动导轨移动固定的距离,再次计算得到系统坐标系位姿为T1,则T0T1的位姿变换矩阵T01T01=T0T1-1。假设T01中平移部分为 t1t2t3T,则两系统坐标系位姿之间的直线距离长度d=t12+t22+t32

4 分析与讨论

单次测量以重投影误差平方和作为迭代的目标优化函数,以步进长度和重投影误差平方作为迭代收敛的初始值,在导轨4等分位置的4次图优化测量情况如图6所示。

图 6. 图优化测量下降曲线

Fig. 6. Recesstion curve of graph optimization

下载图片 查看所有图片

图6中横坐标为迭代次数,蓝色折线表示当前迭代的重投影误差平方和,红色折线为当前迭代的非线性优化步进距离。由图可知,重投影误差和步进距离稳定下降,算法的收敛性良好。

使用高精度直线导轨的直线长度作为测量结果的评定基准,以每3次实验为一组进行测量验证,单组测量数据使用3次测量的平均值,分析图优化的多相机测量模型与EPnP得到的结果,最终测量结果如表2所示。

由直线导轨上多相机系统的多次重复性的实验结果可知,基于图优化的非线性测量方法相对于基于EPnP测量方法,测量误差可以稳定下降,下降区间为30%~70%。多组测量数据的结果基本可以保持在0.5 mm以下,测量结果精度稳定。此外图优化的测量方法耗时较少,算法基本上能满足实时测量的要求。

表 2. 直线导轨验证性实验的误差分析

Table 2. Error analysis of the verifying experiments of linear guide rail

Experimentnumber nActual lengthLR /mmEPnP averagelength La /mmAverage EPnPerror Ea /mmG2O averagelength Lb /mmAverage G2Olength Eb /mmAvaragetime T /ms
1-3200199.190.81200.290.292.83
4-6200200.720.72200.490.494.04
7-9400400.950.95599.350.354.05
10-12400399.300.70400.510.513.24
13-15600601.051.05600.480.482.97
16-18600600.750.75599.700.303.23

查看所有表

5 结论

多相机测量系统的空间定位具有极大地视场范围和较强的适应能力,相对于单相机而言,其精度更高。但多相机系统的结构较为复杂,测量和计算的难度大,耗时长。本文提出的基于图优化的多相机空间自主定位方法,是多相机系统对于空间点观测的测量进行建模,从而估计出多相机系统位姿,实验结果表明,多相机定位精度小于0.6 mm,运行时间少于5 ms。

图优化的多相机系统位姿测量模型能够很好地描述多相机系统定位的测量模型,经实验验证该方法具有精度高、速度快等优点。但随着系统结构和现场环境的复杂化、待优化变量也在不断增加,图优化框架下建立的模型必将更加复杂,以期望能够更为合理的描述问题,提高精度。然而模型复杂程度的增加,诸如雅克比矩阵等部分的计算也会为测量难度带来较大的挑战,对于测量实时性的要求定会带来一定的影响,因此以后将继续深入研究,以期望能更好地解决复杂环境及系统下的多相机系统的位姿测量问题。

参考文献

[1] 刘礼. 基于视觉的室内高效定位研究[D]. 成都: 电子科技大学, 2015: 2- 6.

    LiuL. Research on visual based efficient indoor positioning[D]. Chengdu: University of Electronic Science and Technology of China, 2015: 2- 6.

[2] 刘康. 室内视觉定位与导航综述[J]. 黑龙江科技信息, 2017( 8): 7.

    LiuK. An overview of indoor vision positioning and navigation[J]. Heilongjiang Science and Technology Information, 2017( 8): 7.

[3] 曲磊, 王康如, 陈利利, 等. 基于RGBD图像和卷积神经网络的快速道路检测[J]. 光学学报, 2017, 37(10): 1010003.

    Qu L, Wang K R, Chen L L, et al. Fast road detection based on RGBD images and convolutional neural network[J]. Acta Optica Sinica, 2017, 37(10): 1010003.

[4] 陈鹏, 王晨骁. IEPnP: 一种基于EPnP的相机位姿迭代估计算法[J]. 光学学报, 2018, 38(4): 0411001.

    Chen P, Wang C X. IEPnP: an iterative camera pose estimation algorithm based on EPnP[J]. Acta Optica Sinica, 2018, 38(4): 0411001.

[5] Shi S D, Yang L H, Lin J R, et al. Omnidirectional angle constraint based dynamic six-degree-of-freedom measurement for spacecraft rendezvous and docking simulation[J]. Measurement Science and Technology, 2017, 29(4): 045005.

[6] 赵天云, 郭雷, 张利川. 基于单目视觉的空间定位算法[J]. 西北工业大学学报, 2009, 27(1): 47-51.

    Zhao T Y, Guo L, Zhang L C. A new algorithm of spatial positioning based on mono-vision[J]. Journal of Northwestern Polytechnical University, 2009, 27(1): 47-51.

[7] 狄红卫, 柴颖, 李逵. 一种快速双目视觉立体匹配算法[J]. 光学学报, 2009, 29(8): 2180-2184.

    Di H W, Chai Y, Li K. A fast binocular vision stereo matching algorithm[J]. Acta Optica Sinica, 2009, 29(8): 2180-2184.

[8] Urban S, Wursthorn S, Leitloff J, et al. Multicol bundle adjustment: a generic method for pose estimation, simultaneous self-calibration and reconstruction for arbitrary multi-camera systems[J]. International Journal of Computer Vision, 2017, 121(2): 234-252.

[9] 祝海江, 徐晓波, 周靖林. 基于球面透视投影旋转矩阵的鱼眼图像匹配[J]. 光学学报, 2013, 33(2): 0215001.

    Zhu H J, Xu X B, Zhou J L. Fisheye image matching based on rotation matrix under spherical perspective projection[J]. Acta Optica Sinica, 2013, 33(2): 0215001.

[10] 崔承刚, 杨晓飞. 基于内部罚函数的进化算法求解约束优化问题[J]. 软件学报, 2015, 26(7): 1688-1699.

    Cui C G, Yang X F. Interior penalty rule based evolutionary algorithm for constrained optimization[J]. Journal of Software, 2015, 26(7): 1688-1699.

[11] 梁明杰, 闵华清, 罗荣华. 基于图优化的同时定位与地图创建综述[J]. 机器人, 2013, 35(4): 500-512.

    Liang M J, Min H Q, Luo R H. Graph-based SLAM: a survey[J]. Robot, 2013, 35(4): 500-512.

[12] 邾继贵, 于之靖. 视觉测量原理与方法[M]. 北京: 机械工业出版社, 2012: 78- 94.

    Zhu JG, Yu ZJ. The principles and methods of visual measurement[M]. Beijing: China Machine Press, 2012: 78- 94.

[13] LuF, Milios EE. Optimal global pose estimation for consistent sensor data registration[C]∥Proceedings of 1995 IEEE International Conference on Robotics and Automation, 1995, 1: 93- 100.

[14] 高翔, 张涛, 等. 视觉SLAM十四讲: 从理论到实践[M]. 北京: 电子工业出版社, 2017: 245- 269.

    GaoX, ZhangT, et al.Visual SLAM fourteen lectures: from theory to practice[M]. Beijing: Electronic Industry Press, 2017: 245- 269.

[15] 张宁, 常雷, 徐熙平. 基于机器视觉的三维重建技术研究[J]. 激光与光电子学进展, 2012, 49(5): 051001.

    Zhang N, Chang L, Xu X P. Research on the technology of three-dimensional reconstruction based on machine vision[J]. Laser & Optoelectronics Progress, 2012, 49(5): 051001.

[16] 黄桂平, 钦桂勤, 卢成静. 数字近景摄影大尺寸三坐标测量系统V-STARS的测试与应用[J]. 宇航计测技术, 2009, 29(2): 5-9,22.

    Huang G P, Qin G Q, Lu C J. Testing and application of the digital close-range photogrammetry for the large scale 3D measurement V-STARS[J]. Journal of Astronautic Metrology and Measurement, 2009, 29(2): 5-9,22.

刘博文, 杨凌辉, 牛志远, 徐秋宇, 张正吉, 王金旺. 基于图优化的多相机系统高精度自主定位方法[J]. 激光与光电子学进展, 2019, 56(3): 031202. Bowen Liu, Linghui Yang, Zhiyuan Niu, Qiuyu Xu, Zhengji Zhang, Jinwang Wang. High-Precision Autonomous Positioning Method of Multi-Camera System Based on Graph Optimization[J]. Laser & Optoelectronics Progress, 2019, 56(3): 031202.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!