作者单位
摘要
1 上海理工大学 光电信息与计算机工程学院,上海 200093
2 上海理工大学 机械工程学院,上海 200093
为了提高人体姿态估计的准确度和检测速度,提出了一种基于深度残差网络的多人姿态估计算法。首先使用现有的先进目标检测算法检测出人体位置,再在人体边界框内作单人姿态估计。对现有模型的残差块进行改造, 降低了模型的参数量,加入多尺度监督模块和多尺度回归模块辅助训练,提高了模型的学习效率,并采用新的坐标提取方法进一步提高了模型的泛化能力和推理速度,在流行的MPII、COCO数据集上进行了训练和测试。MPII测试集上PCKh@0.5获得了92.1%的得分,2017 COCO test-dev集上mAP获得了72.4的得分,比Simple Baseline基准模型提高了2.4%。使用一张GTX1080Ti 显卡对平均每帧有5个人体实例的图片进行推理时,运行速度达到26帧,推理速度极具竞争力。这充分证明了所提出的算法有效提高了人体关键点的识别精度和速度。
多人姿态估计 编解码 多尺度监督 多尺度回归 multi-person pose estimation encoding and decoding multi-scale supervision multi-scale regression 
光学仪器
2021, 43(2): 39
作者单位
摘要
西安工业大学电子信息工程学院, 陕西 西安 710021
针对图像和视频中多人姿态估计存在人体边界框定位不准确、困难关键点检测精度有待提高等问题,设计了一套基于自顶向下框架的实时多人姿态估计模型。首先将深度可分离卷积加入目标检测算法中,提高人体检测器运行速度;然后基于特征金字塔网络结合上下文语义信息,采用在线难例挖掘算法解决困难关键点检测精度低的问题;最后结合空间变换网络与姿态相似度计算,剔除冗余姿态,改善边界框定位准确性。本文提出模型在2017MS COCO Test-dev数据集上的平均检测精度比Mask R-CNN模型提升了14.84%,比RMPE模型提升了2.43%,帧频达到 22 frame/s。
图像处理 多人姿态估计 空间变换网络 语义信息 姿态距离 
激光与光电子学进展
2020, 57(2): 021006

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!