科技动态

使用多摄像机技术实现多人姿态检测方法

发布:HPLSElaser阅读:555时间:2017-7-30 22:21:36

卡内基梅隆大学机器人研究所(Carnegie Mellon University’s Robotics Institute)的研究人员已经开发出一种使用视频分析技术实时了解多人面部表情和手部位置等身体姿势和动作的方法。该新方法是由一个用于行为捕捉的多视角系统完成的,被命名为“Panoptic Studio”,它由嵌有500台摄像机的两层圆顶组成。

使用计算机实时跟踪彼此接触的多个人是十分困难的。研究小组采用自底向上方法的设计方法,首先将场景中的所有身体部位如手臂,腿部,脸部等进行定位,然后将这些部位与具体的人体相关联。

手部检测可能是一个更大的挑战,因为相机不太可能同时看到手的所有部分。研究人员Hanbyul Joo表示,即使在一张图像中仅看到手的一部分,通常在不同的角度的另一个图像中,能将手的图像补充完整。这就是研究人员利用多相机系统Panoptic Studio的原因。


卡内基梅隆大学的研究人员已经开发了检测多人的身体姿势,包括面部表情和手部位置的方法。这使得计算机不仅可以识别人的身体,而且能够对其定位并检测它们的移动。图片来源:卡内基梅隆大学。

Joo说:“一个相机就能为一个人的手标记500个位置。但是因为手太小,大多数相机无法进行标记,但是我们使用了31台高清摄像机,构建出一个庞大的数据库。”

Yaser Sheikh教授称,用于跟踪二维人体形态和运动的新方法可以为人机交互开辟新的方式,例如通过手势与计算机通信。

检测人与人之间肢体语言的交流将使得能够机器人在社交场合中服务。一辆自动驾驶汽车能够对一名行人即将进入街道的肢体动作进行预警。用计算机检测人的行为也不失为一种行为诊断和医学康复的新方法。

在体育运动分析中,实时姿态检测将使计算机不仅能够跟踪现场的每一位运动员在场上的位置,而且还要知道玩家的手臂、腿部和头部等的具体位置。

Panoptic Studio目前正在通过联合训练来提高对人类躯干、面部和手部的检测能力。随着研究工作从二维模型进展到三维模型,设备自动检测图像的能力将至关重要。

为了鼓励更多的研究人员参与研究和应用,该团队已经公开了用于多人检测和手势识别的计算机代码。Sheikh表示,目前有包括汽车公司在内的20多个商业团体表达了对该技术许可的兴趣。

Sheikh表示,当美国国家科学基金会支持建立Panoptic Studio时,没有人清楚它会带来什么影响。

他补充称:“由于10年前美国国家科学基金会(NSF)的授权,现在我们能够突破许多技术障碍,同时我们也共享了Panoptic Studio的代码和捕获的数据。”

多人检测和手势识别方法的研究将在2017年7月21日至26日在美国夏威夷火奴鲁鲁举行的2017年计算机视觉与模式识别会议上进行展示。

来源: https://www.photonics.com/Article.aspx?AID=62240

本文受译者委托,享有该文的专有出版权,其他出版单位或网站如需转载,请与本站联系,联系email:mail@opticsjournal.net。否则,本站将保留进一步采取法律手段的权利。

> 免责声明
网站内容来源于互联网、原创,由网络编辑负责审查,目的在于传递信息,提供专业服务,不代表本网站及新媒体平台赞同其观点和对其真实性负责。如对文、图等版权问题存在异议的,请于20个工作日内与我们取得联系,我们将协调给予处理(按照法规支付稿费或删除),联系方式:021-69918579。网站及新媒体平台将加强监控与审核,一旦发现违反规定的内容,按国家法规处理,处理时间不超过24小时。 最终解释权归《中国激光》杂志社所有。

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!