作者单位
摘要
西安工业大学电子信息工程学院, 陕西 西安 710021
针对图像和视频中多人姿态估计存在人体边界框定位不准确、困难关键点检测精度有待提高等问题,设计了一套基于自顶向下框架的实时多人姿态估计模型。首先将深度可分离卷积加入目标检测算法中,提高人体检测器运行速度;然后基于特征金字塔网络结合上下文语义信息,采用在线难例挖掘算法解决困难关键点检测精度低的问题;最后结合空间变换网络与姿态相似度计算,剔除冗余姿态,改善边界框定位准确性。本文提出模型在2017MS COCO Test-dev数据集上的平均检测精度比Mask R-CNN模型提升了14.84%,比RMPE模型提升了2.43%,帧频达到 22 frame/s。
图像处理 多人姿态估计 空间变换网络 语义信息 姿态距离 
激光与光电子学进展
2020, 57(2): 021006
作者单位
摘要
北京航空航天大学仪器科学与光电工程学院, 北京 100191
针对遥感图像中的目标检测问题,采用基于卷积神经网络的目标检测框架对目标进行提取,针对该网络制作了包含三类遥感图像中常见目标的目标检测数据集。为了解决遥感图像目标旋转角度较大的问题,将空间变换网络融入超快区域卷积神经网络,提出了一种具有旋转不变性自学习能力的目标检测模型。通过与传统的目标检测方法进行对比分析,探究了不同方法对遥感图像目标检测的实际效果。相对于传统的目标检测方法,融合了空间变换网络的卷积神经网络所提取的特征具有更好的旋转不变特性,从而能够达到更高的检测精度。
图像处理 卷积神经网络 空间变换网络 目标检测 深度学习 
激光与光电子学进展
2019, 56(5): 051002

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!