安全提示

光学精密工程

2018, 26(6): 1497

采用自适应变异粒子群优化SVM的行为识别

张国梁 ^*贾松敏张祥银徐涛

作者单位

摘要

北京工业大学信息学部, 北京 100124

为了提高对视频序列中人体行为的识别能力, 建立了基于局部特征的动作识别框架。通过时空特征提取及编码和SVM分类器参数优化两部分对该框架所涉及算法进行了研究。首先, 采用Harris3D检测器获取时空兴趣点(STIP), 以方向梯度直方图(HOG)和光流方向直方图(HOF)对STIP进行描述, 并引入Fisher向量实现对特征描述子的编码; 由于固定参数下SVM动作分类模型存在泛化能力不足的问题, 将粒子群算法应用于各动作分类器参数寻优过程中, 针对种群多样性逐代变化的特点, 构建粒子聚集度模型, 并利用其动态调节各代粒子的变异概率; 最后, 利用KTH和HMDB51数据集对所提方法进行验证。结果表明, 所提自适应变异粒子群算法(AMPSO)能够有效避免种群陷入局部最优, 具备较强的全局寻优能力; 在KTH和HMDB51数据集上的识别准确率分别为87.50%和26.41%, 优于其余2种识别方法。实验证明, AMPSO算法收敛性能良好且整体识别框架具有较高的实用性和准确性。

人体行为识别自适应变异粒子群算法时空兴趣点特征编码支持向量机 human action recognition Adaptive Mutation Particle Swarm Optimization (AMP Space Time Interest Points (STIP) feature coding Support Vector Machine (SVM)

光学精密工程

2017, 25(6): 1669

元胞自动机多尺度优化的显著性细微区域检测

徐涛 ^1,2贾松敏 ¹张国梁 ¹

作者单位

摘要

¹ 北京工业大学信息学部, 北京 100124

² 河南科技学院机电学院, 河南新乡 453003

针对由于待检测目标局部区域显著性差异过大造成的细微区域检测失败问题, 在贝叶斯理论框架下, 提出一种基于元胞自动机多尺度优化的显著性检测方法。首先结合暗通道先验信息和区域对比度在同一张图片的5个超像素尺度空间内分别构建原始显著性图; 接着, 利用元胞自动机建立动态更新机制, 通过影响因子矩阵和置信度矩阵优化每个元胞下一状态的影响力, 获得对应5个优化显著性图; 最后在基于贝叶斯理论的融合算法框架下得到最终的显著性图。在两个复杂度不同的标准图像数据库上将本文方法与10种主流显著性提取方法进行视觉效果和客观定量数据对比, 结果显示, 本文算法效果优于现有10种显著性提取方法, 其中在公认最具挑战的DUT-OMRON数据库的综合指标F-measure 值为0.631 4, 平均绝对误差(MAE)为0.132 5, ROC曲线下面积(AUC)为0.892 8, 表明本文算法具有较高的准确性和鲁棒性。

元胞自动机视觉显著性多尺度超像素暗通道贝叶斯理论 cellular automation visual saliency multi-scale superpixel dark channel Bayesian theory

光学精密工程

2017, 25(5): 1312

基于多模板回归加权均值漂移的人体目标跟踪

贾松敏 ^1,2文林风 ^1,2,*王丽佳 ^1,2,3

作者单位

摘要

¹ 北京工业大学信息学部, 北京 100124

² 计算智能与智能系统北京市重点实验室, 北京 100124

³ 河北工业职业技术学院信息工程与自动化系, 河北石家庄 050091

针对移动机器人跟踪人体目标时目标因角度大幅变化引起外观改变造成的跟踪无效, 提出了多模板回归加权均值漂移跟踪方法。该方法通过建立目标的多模板模型, 应用均值漂移算法实现目标跟踪。首先, 根据前一帧均值漂移结果和当前帧头肩粗定位结果确定目标模板集, 使其包含目标人体的位姿和角度改变。然后, 采用多模板回归加权均值漂移实现目标的精确定位。在多模板均值漂移中引入回归模型实现颜色纹理特征与目标模型相似度之间的映射, 从而控制模板数量, 保证目标检测的实时性。最后, 分别在视频图像和机器人目标跟踪平台上对所提方法进行实验验证。结果显示, 图像处理平均时间为86.4 s/frame, 满足机器人跟踪的实时性要求。该方法解决了目标特征在跟踪过程中发生变化的问题, 提高了机器人跟踪时对目标人体特征变化的鲁棒性。

机器人目标跟踪行人跟踪多模板均值漂移回归模型视频图像 person tracking mean shift multi-template regression model video image

光学精密工程

2016, 24(9): 2339

基于地面特征的移动机器人单目视觉里程计算法

下载：533次

王可 ^1,*贾松敏 ¹李秀智 ¹徐涛 ^1,2

作者单位

摘要

¹ 北京工业大学电子信息与控制工程学院, 北京 100124

² 河南科技学院机电学院, 河南新乡 453003

提出了一种基于单目视觉的移动机器人定位算法。该方法根据地平面假设，采用基于KLT 的角点检测与跟踪方法，运用基于平面的单应性关系，建立移动机器人位姿估计模型。在随机抽样一致性算法框架下，求解上述模型，实现移动机器人的初定位。在此基础上，引入角点特征的三角形结构估算平面参数差异，结合M-estimation 算法，有效地去除了非地面特征信息，提高了移动机器人的定位精度。室内环境下实验结果验证了所提算法的有效性与可行性。

机器视觉移动机器人单目视觉单应性位姿估计

光学学报

2015, 35(5): 0515002

基于光流反馈的单目视觉三维重建

下载：730次

李秀智 ^*杨爱林秦宝岭贾松敏邱欢

作者单位

摘要

北京工业大学电子信息与控制工程学院, 北京 100124

提出一种基于光流反馈的单目视觉三维(3D)重建方法，实现对场景快速、准确的3D 立体化建模。由帧间光流场建立更为稳健的同名像点匹配关系，同时运用五点算法估计摄像机的相对位姿，以构建稀疏点云和初始网格。从运动视觉分析的角度寻求多视重构的求解方法，将重建模型反馈至重建过程，用各视图像的偏差驱动模型变形。将粗略、不准确的原始网格曲面经过致密的非刚性变形，调整至精确的曲面。在统一计算设备架构下，利用图形处理器对光流算法进行并行加速，显著提高了重构算法运行的实时性。室内真实场景下的重建结果证明了所提算法的可行性与准确性。

机器视觉三维重建光流场景流统一计算设备架构

光学学报

2015, 35(5): 0515001

采用脉冲耦合神经网络的改进显著性区域提取方法

贾松敏 ¹徐涛 ^1,2,*董政胤 ¹李秀智 ¹

作者单位

摘要

¹ 北京工业大学电子信息与控制工程学院, 北京 100124

² 河南科技学院机电学院, 河南新乡 453003

由于仅考虑颜色等视觉对比信息的视觉显著性提取模型不符合人眼生物学过程,本文提出了一种基于混合模型的改进显著性区域提取(ISRE)方法.该混合模型由显著性滤波算法和改进脉冲耦合神经网络(PCNN)算法构成.首先,利用显著性滤波器算法获得原图像的初始显著性图(OSM)和亮度特征图(IFM),用IFM作为PCNN的输入神经元;然后,进一步对PCNN点火脉冲输入进行改进,即对PCNN内部神经元与OSM的二值化显著性图进行点乘,确定最终点火脉冲输入,以获得更加准确的点火范围;最后,通过改进后的PCNN多次迭代,完成显著性二值化区域提取.基于1 000 张标准图像数据库进行的实验结果显示:在视觉效果和客观定量数据比对两方面,本算法均优于现有的5种显著性提取方法,平均查准率为0.891,平均召回率为0.808,综合指标F值为0.870.在真实环境实验中,所提算法获得了精确的提取效果,进一步验证了本算法具有较高的准确性和执行效率.

混合模型特征提取改进显著性区域提取脉冲耦合神经网络(PCNN) 点火脉冲二值化 hybrid model feature extraction Improved Salient Region Extraction(ISRE) Pulse Coupled Neural Network(PCNN) ignition pulse binarization

光学精密工程

2015, 23(3): 819

基于变分模型的单目视觉三维重建方法

贾松敏 ^*王可李秀智徐涛

作者单位

摘要

北京工业大学电子信息与控制工程学院, 北京 100124

提出一种基于单目视觉的致密场景重建方法，以实现对环境快速，准确地三维立体化建模。该方法针对自由式手持单目相机，在并行跟踪与地图创建(PTAM)算法框架下准确地实现相机的自定位。在此基础上，选取关键帧处图像序列，构造变分模式下深度估计模型；运用离散空间采样法获取初始深度图，借助于原始对偶算法实现该深度模型的优化，并结合相机投影模型估计待求解场景的三维模型。在统一计算设备架构(CUDA)下，利用图形处理器(GPU)进一步实现了深度估计算法的并行优化，显著提高了算法处理的实时性。真实场景下实验结果验证了所提算法的有效性与可行性。

变分三维重建深度图并行跟踪与地图创建图形处理器

光学学报

2014, 34(4): 0415002

采用改进Mean Shift算法的移动机器人行人跟踪

王丽佳 ^1,2,*贾松敏 ¹王爽 ¹李秀智 ¹

作者单位

摘要

¹ 北京工业大学电子信息与控制工程学院, 北京 100124

² 河北工业职业技术学院信息工程与自动化系, 河北石家庄 050000

为了提高移动机器人目标跟踪系统在复杂环境中的跟踪性能, 提出在双层定位机制下采用基于自适应核函数的Mean Shift算法实现目标跟踪。利用射频识别器件(RFID)检测携带标签的目标, 实现外层粗定位并确定感兴趣区域(ROI); 在内层则根据对视差图的ROI的处理结果确定初始搜索窗口, 然后应用基于自适应核函数的Mean Shift算法在从立体相机获得的左图中应用基于自适应核函数的Mean Shift算法实现对目标的精确定位。自适应核函数由目标的区域特征与Epanechnikov函数相融合构成, 克服了目标边缘处背景像素对目标颜色概率分布的影响。与传统的Mean Shift算法相比, 所提方法在同色背景干扰下仍能准确跟踪目标。另外, RFID限定了图像搜索范围, 节省了运算开支, 图像处理的平均时间为62.11 ms/frame, 满足实时跟踪的要求。实验结果表明, 该方法可实现移动机器人在同色背景干扰、遮挡、目标快速移动等情况下的目标跟踪。

移动机器人行人跟踪双层定位机制自适应核函数 Mean Shift算法射频识别器件 mobile robot person tracking coarse to fine localization mechanism adaptive kernel function Mean Shift algorithm Radio Frequency Identification Device(RFID)

光学精密工程

2013, 21(9): 2364

改进的TV-L1平滑光流估计

李秀智 ^*尹晓琳贾松敏谭君赵冠荣

作者单位

摘要

北京工业大学电子信息与控制工程学院, 北京 100124

提出将高斯平滑后的数据项和非局部中值滤波相结合的光流算法，以实现降噪并提高光流估计的稳健性和精度。该方法的数据项使用稳健的L1范数，通过高斯滤波对数据项平滑处理，抑制噪声干扰，并借助原始-对偶算法改善变分光流的求解效率；为进一步提高光流场的估计精度，引入了非局部中值滤波的全局优化策略；为提高算法对较大位移量估计的适应性，运用了由粗到精的金字塔方法。采用Middlebury光流数据库图像和真实场景图像对改进的TV-L1光流估计算法进行了实验验证。结果表明，提出的改进变分光流算法具有较强的稳健性，其光流估计精度优于传统的TV-L1模型算法。

机器视觉变分光流非局部中值滤波数据项原始对偶