激光与光电子学进展, 2020, 57 (2): 021006, 网络出版: 2020-01-03   

基于视频的实时多人姿态估计方法 下载: 1447次

Real-Time Multi-Person Video-Based Pose Estimation
作者单位
西安工业大学电子信息工程学院, 陕西 西安 710021
图 & 表

图 1. 对称空间变换网络结构图

Fig. 1. Structural diagram of symmetric space transformation network

下载图片 查看原文

图 2. 实时多人姿态估计模型

Fig. 2. Real-time multi-person pose estimation model

下载图片 查看原文

图 3. 姿态估计网络模型

Fig. 3. Pose estimation network model

下载图片 查看原文

图 4.

(a)、(e)、(i)、(m)为Mask R-CNN模型姿态估计结果,图4(b)、(f)、(j)、(n)为CMU-Pose模型姿态估计结果,图4(c)、(g)、(k)、(o)为RMPE模型姿态估计结果,图4(d)、(h)、(l)、(p)本文设计模型姿态估计结果。

在尺度变化场景中,人体尺度较小时[图4(a)]未能正确检测到人体关键点,人体腿部及胳膊处关键点检测均出现错误。由于图像最中间五个目标紧密连接,只成功检测到最左边边上人体关键点,且人体目标脚踝关键点检测错误,如图4所示。在目标距离较近时姿态估计出现错误,如

Fig. 4.

下载图片 查看原文

图 4. 不同场景下各模型结果对比。 (a)~(d)尺度变化。(e) ~(h)密集人群;(i) ~(l)遮挡; (m) ~(p)复杂姿态

Fig. 4. Comparison of results in different scenarios for each model. (a)-(d) Scale change; (e)-(h) dense population; (i)-(l) occlusion; (m)-(p) complex pose

下载图片 查看原文

表 1算法模型及环境配置

Table1. Algorithm model and environment configuration

ModelFrameworkProgramminglanguage
CMU-Pose[10]CaffePython3.6.2
MaskR-CNN[11]TensorFlow1.3.0+Keras2.2.6Python3.6.2
RMPE[14]Pytorch0.4.0Python3.6.2
Proposed modelPytorch0.4.0Python3.6.2

查看原文

表 2各姿态估计模型性能对比

Table2. Comparison of performance of each pose estimation model

ModelAPAP@0.5AP@0.75APmAPl
CMU-Pose61.884.967.557.168.2
Mask R-CNN63.187.368.757.871.4
RMPE72.389.279.168.078.6
Proposed model74.192.580.570.679.5

查看原文

表 3各人体检测算法参数规模对比

Table3. Comparison of parameters of each human detection algorithm

ModelData setRunning speed /(frame·s-1)Parametersize /MBCalculatedamount /109
YOLOv3[15]MS COCO5123765.86
Proposed modelMS COCO6419544.32

查看原文

表 4不同输入下模型AP-AR值

Table4. AP-AR values of model under different inputs

InputAPAP@0.5AP@0.75APmAPlARAR@0.5AR@0.75ARmARl
256 pixel×192 pixel71.291.478.368.575.274.392.280.971.378.9
384 pixel×288 pixel74.192.580.570.679.576.893.282.573.082.6

查看原文

闫芬婷, 王鹏, 吕志刚, 丁哲, 乔梦雨. 基于视频的实时多人姿态估计方法[J]. 激光与光电子学进展, 2020, 57(2): 021006. Yan Fenting, Wang Peng, Lü Zhigang, Ding Zhe, Qiao Mengyu. Real-Time Multi-Person Video-Based Pose Estimation[J]. Laser & Optoelectronics Progress, 2020, 57(2): 021006.

本文已被 4 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!