作者单位
摘要
北京工业大学 信息学部, 北京 100124
由于原始TSDF(Truncated Signed Distance Function, TSDF)模型仅考虑相邻时间上的关联, 误差将不可避免的累积到下一时刻, 无法构建全局一致的地图。为了实时精确的建立大场景稠密3D地图, 对TSDF模型进行了改进。首先, 构筑相机位姿模型和加权融合3D点截断信息的TSDF模型, 用于准确表示创建物体的表面。其次, 提出一种改进的回环检测方法, 并将其与随机蕨类彩色图像编码化相结合, 进而优化TSDF模型, 即混合优化位姿模型。最后, 使用g2o图优化库解算约束函数, 建立数据集间的优化边。实验结果表明: 混合优化位姿模型能识别曾到达区域, 特别在较大场景下使用可以得到更加准确的相机轨迹和地图。采用TUM数据集中的fr1/xyz、fr1/room、fr1/desk对所提算法进行检验, 结果表明该方法能够使相机轨迹的均方根误差分别下降0.59 cm, 3.14 cm, 0.94 cm。在室内环境和公开数据集上的实验结果证明了所提算法的有效性和准确性。
随机蕨类 闭环优化 图优化 random ferns Truncated Signed Distance Function(TSDF) TSDF closed-loop optimization pose graph optimization 
光学 精密工程
2018, 26(6): 1497
作者单位
摘要
北京工业大学 信息学部, 北京 100124
为了提高对视频序列中人体行为的识别能力, 建立了基于局部特征的动作识别框架。通过时空特征提取及编码和SVM分类器参数优化两部分对该框架所涉及算法进行了研究。首先, 采用Harris3D检测器获取时空兴趣点(STIP), 以方向梯度直方图(HOG)和光流方向直方图(HOF)对STIP进行描述, 并引入Fisher向量实现对特征描述子的编码; 由于固定参数下SVM动作分类模型存在泛化能力不足的问题, 将粒子群算法应用于各动作分类器参数寻优过程中, 针对种群多样性逐代变化的特点, 构建粒子聚集度模型, 并利用其动态调节各代粒子的变异概率; 最后, 利用KTH和HMDB51数据集对所提方法进行验证。结果表明, 所提自适应变异粒子群算法(AMPSO)能够有效避免种群陷入局部最优, 具备较强的全局寻优能力; 在KTH和HMDB51数据集上的识别准确率分别为87.50%和26.41%, 优于其余2种识别方法。实验证明, AMPSO算法收敛性能良好且整体识别框架具有较高的实用性和准确性。
人体行为识别 自适应变异粒子群算法 时空兴趣点 特征编码 支持向量机 human action recognition Adaptive Mutation Particle Swarm Optimization (AMP Space Time Interest Points (STIP) feature coding Support Vector Machine (SVM) 
光学 精密工程
2017, 25(6): 1669
作者单位
摘要
1 北京工业大学 信息学部, 北京 100124
2 河南科技学院 机电学院, 河南 新乡 453003
针对由于待检测目标局部区域显著性差异过大造成的细微区域检测失败问题, 在贝叶斯理论框架下, 提出一种基于元胞自动机多尺度优化的显著性检测方法。首先结合暗通道先验信息和区域对比度在同一张图片的5个超像素尺度空间内分别构建原始显著性图; 接着, 利用元胞自动机建立动态更新机制, 通过影响因子矩阵和置信度矩阵优化每个元胞下一状态的影响力, 获得对应5个优化显著性图; 最后在基于贝叶斯理论的融合算法框架下得到最终的显著性图。在两个复杂度不同的标准图像数据库上将本文方法与10种主流显著性提取方法进行视觉效果和客观定量数据对比, 结果显示, 本文算法效果优于现有10种显著性提取方法, 其中在公认最具挑战的DUT-OMRON数据库的综合指标F-measure 值为0.631 4, 平均绝对误差(MAE)为0.132 5, ROC曲线下面积(AUC)为0.892 8, 表明本文算法具有较高的准确性和鲁棒性。
元胞自动机 视觉显著性 多尺度超像素 暗通道 贝叶斯理论 cellular automation visual saliency multi-scale superpixel dark channel Bayesian theory 
光学 精密工程
2017, 25(5): 1312
贾松敏 1,2文林风 1,2,*王丽佳 1,2,3
作者单位
摘要
1 北京工业大学 信息学部, 北京 100124
2 计算智能与智能系统北京市重点实验室, 北京 100124
3 河北工业职业技术学院 信息工程与自动化系, 河北 石家庄 050091
针对移动机器人跟踪人体目标时目标因角度大幅变化引起外观改变造成的跟踪无效, 提出了多模板回归加权均值漂移跟踪方法。该方法通过建立目标的多模板模型, 应用均值漂移算法实现目标跟踪。首先, 根据前一帧均值漂移结果和当前帧头肩粗定位结果确定目标模板集, 使其包含目标人体的位姿和角度改变。然后, 采用多模板回归加权均值漂移实现目标的精确定位。在多模板均值漂移中引入回归模型实现颜色纹理特征与目标模型相似度之间的映射, 从而控制模板数量, 保证目标检测的实时性。最后, 分别在视频图像和机器人目标跟踪平台上对所提方法进行实验验证。结果显示, 图像处理平均时间为86.4 s/frame, 满足机器人跟踪的实时性要求。该方法解决了目标特征在跟踪过程中发生变化的问题, 提高了机器人跟踪时对目标人体特征变化的鲁棒性。
机器人目标跟踪 行人跟踪 多模板均值漂移 回归模型 视频图像 person tracking mean shift multi-template regression model video image 
光学 精密工程
2016, 24(9): 2339
作者单位
摘要
1 北京工业大学电子信息与控制工程学院, 北京 100124
2 河南科技学院机电学院, 河南 新乡 453003
提出了一种基于单目视觉的移动机器人定位算法。该方法根据地平面假设,采用基于KLT 的角点检测与跟踪方法,运用基于平面的单应性关系,建立移动机器人位姿估计模型。在随机抽样一致性算法框架下,求解上述模型,实现移动机器人的初定位。在此基础上,引入角点特征的三角形结构估算平面参数差异,结合M-estimation 算法,有效地去除了非地面特征信息,提高了移动机器人的定位精度。室内环境下实验结果验证了所提算法的有效性与可行性。
机器视觉 移动机器人 单目视觉 单应性 位姿估计 
光学学报
2015, 35(5): 0515002
作者单位
摘要
北京工业大学电子信息与控制工程学院, 北京 100124
提出一种基于光流反馈的单目视觉三维(3D)重建方法,实现对场景快速、准确的3D 立体化建模。由帧间光流场建立更为稳健的同名像点匹配关系,同时运用五点算法估计摄像机的相对位姿,以构建稀疏点云和初始网格。从运动视觉分析的角度寻求多视重构的求解方法,将重建模型反馈至重建过程,用各视图像的偏差驱动模型变形。将粗略、不准确的原始网格曲面经过致密的非刚性变形,调整至精确的曲面。在统一计算设备架构下,利用图形处理器对光流算法进行并行加速,显著提高了重构算法运行的实时性。室内真实场景下的重建结果证明了所提算法的可行性与准确性。
机器视觉 三维重建 光流 场景流 统一计算设备架构 
光学学报
2015, 35(5): 0515001
作者单位
摘要
1 北京工业大学 电子信息与控制工程学院, 北京 100124
2 河南科技学院 机电学院, 河南 新乡 453003
由于仅考虑颜色等视觉对比信息的视觉显著性提取模型不符合人眼生物学过程,本文提出了一种基于混合模型的改进显著性区域提取(ISRE)方法.该混合模型由显著性滤波算法和改进脉冲耦合神经网络(PCNN)算法构成.首先,利用显著性滤波器算法获得原图像的初始显著性图(OSM)和亮度特征图(IFM),用IFM作为PCNN的输入神经元;然后,进一步对PCNN点火脉冲输入进行改进,即对PCNN内部神经元与OSM的二值化显著性图进行点乘,确定最终点火脉冲输入,以获得更加准确的点火范围;最后,通过改进后的PCNN多次迭代,完成显著性二值化区域提取.基于1 000 张标准图像数据库进行的实验结果显示:在视觉效果和客观定量数据比对两方面,本算法均优于现有的5种显著性提取方法,平均查准率为0.891,平均召回率为0.808,综合指标F值为0.870.在真实环境实验中,所提算法获得了精确的提取效果,进一步验证了本算法具有较高的准确性和执行效率.
混合模型 特征提取 改进显著性区域提取 脉冲耦合神经网络(PCNN) 点火脉冲 二值化 hybrid model feature extraction Improved Salient Region Extraction(ISRE) Pulse Coupled Neural Network(PCNN) ignition pulse binarization 
光学 精密工程
2015, 23(3): 819
作者单位
摘要
北京工业大学电子信息与控制工程学院, 北京 100124
提出一种基于单目视觉的致密场景重建方法,以实现对环境快速,准确地三维立体化建模。该方法针对自由式手持单目相机,在并行跟踪与地图创建(PTAM)算法框架下准确地实现相机的自定位。在此基础上,选取关键帧处图像序列,构造变分模式下深度估计模型;运用离散空间采样法获取初始深度图,借助于原始对偶算法实现该深度模型的优化,并结合相机投影模型估计待求解场景的三维模型。在统一计算设备架构(CUDA)下,利用图形处理器(GPU)进一步实现了深度估计算法的并行优化,显著提高了算法处理的实时性。真实场景下实验结果验证了所提算法的有效性与可行性。
变分 三维重建 深度图 并行跟踪与地图创建 图形处理器 
光学学报
2014, 34(4): 0415002
作者单位
摘要
1 北京工业大学 电子信息与控制工程学院, 北京 100124
2 河北工业职业技术学院 信息工程与自动化系, 河北 石家庄 050000
为了提高移动机器人目标跟踪系统在复杂环境中的跟踪性能, 提出在双层定位机制下采用基于自适应核函数的Mean Shift算法实现目标跟踪。利用射频识别器件(RFID)检测携带标签的目标, 实现外层粗定位并确定感兴趣区域(ROI); 在内层则根据对视差图的ROI的处理结果确定初始搜索窗口, 然后应用基于自适应核函数的Mean Shift算法在从立体相机获得的左图中应用基于自适应核函数的Mean Shift算法实现对目标的精确定位。自适应核函数由目标的区域特征与Epanechnikov函数相融合构成, 克服了目标边缘处背景像素对目标颜色概率分布的影响。与传统的Mean Shift算法相比, 所提方法在同色背景干扰下仍能准确跟踪目标。另外, RFID限定了图像搜索范围, 节省了运算开支, 图像处理的平均时间为62.11 ms/frame, 满足实时跟踪的要求。实验结果表明, 该方法可实现移动机器人在同色背景干扰、遮挡、目标快速移动等情况下的目标跟踪。
移动机器人 行人跟踪 双层定位机制 自适应核函数 Mean Shift算法 射频识别器件 mobile robot person tracking coarse to fine localization mechanism adaptive kernel function Mean Shift algorithm Radio Frequency Identification Device(RFID) 
光学 精密工程
2013, 21(9): 2364
作者单位
摘要
北京工业大学电子信息与控制工程学院, 北京 100124
提出将高斯平滑后的数据项和非局部中值滤波相结合的光流算法,以实现降噪并提高光流估计的稳健性和精度。该方法的数据项使用稳健的L1范数,通过高斯滤波对数据项平滑处理,抑制噪声干扰,并借助原始-对偶算法改善变分光流的求解效率;为进一步提高光流场的估计精度,引入了非局部中值滤波的全局优化策略;为提高算法对较大位移量估计的适应性,运用了由粗到精的金字塔方法。采用Middlebury光流数据库图像和真实场景图像对改进的TV-L1光流估计算法进行了实验验证。结果表明,提出的改进变分光流算法具有较强的稳健性,其光流估计精度优于传统的TV-L1模型算法。
机器视觉 变分光流 非局部中值滤波 数据项 原始对偶 
光学学报
2013, 33(10): 1015002

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!