红外与激光工程
2022, 51(7): 20210586
1 东南大学自动化学院,江苏 南京 210096
2 东南大学复杂工程系统测量与控制教育部重点实验室,江苏 南京 210096
3 东南大学深圳研究院,广东 深圳 518063
样本采样和检测框优化是目标检测任务中的两项重要技术。为了解决正负样本分配不合理的问题,获取更优的图像分类特征和检测框,提出一个精确且高效的单阶无锚框目标检测算法,算法由基于语义的定位、自适应特征增强和高效的检测框优化3个模块组成。首先,定位模块提出基于语义的样本采样方法,根据目标的语义特征区分前/背景区域,合理选择正样本和负样本,优先选择语义信息量较大的前景区域作为正样本;其次,特征增强模块利用目标语义概率图和检测框偏移逐像素调整图像分类特征,增大前景特征所占比重,根据目标大小自适应调整特征编码范围;最后,采用并联的方式优化检测框,对优化前后的检测框计算分类损失,几乎无成本地提升了定位性能,保证了特征对齐性和一致性。在MS COCO数据集下,提出的目标检测算法取得了平均精度为42.8% 的检测精度,单张图像的检测时间达到78 ms,实现了检测精度与速度的平衡。
机器视觉 目标检测 正负样本采样 检测框优化 特征增强 激光与光电子学进展
2022, 59(18): 1815015
安徽工程大学电气工程学院, 安徽 芜湖 241000
提出了一种基于改进卷积神经网络的交通标志检测方法。预训练模型产生否定;使用难分类负样本采集将负样本输入到网络中,提高模型的判别能力;使用多尺度训练过程中的特征级联策略来进一步提升模型的性能。利用TensorFlow框架在德国交通标志检测数据集上对所提方法的有效性进行了仿真。研究结果表明,与现有技术相比,所提方法能够获得更快的检测速率,处理每幅图像仅需0.016 s。
图像处理 卷积神经网络 交通标志检测 特征拼接 难分类负样本采集 多尺度训练 激光与光电子学进展
2019, 56(7): 071003
暨南大学理工学院光电工程系,广东 广州 510632
为提升TLD 目标跟踪算法的处理速度,以达到在更高分辨率视频中跟踪目标的实时性要求,在TLD 算法框架的基础上,提出了一种基于动态捕获区域的TLD 目标跟踪算法(DC-TLD)。算法采用前一帧目标位置作为当前帧目标位置的预测值,减小了目标位置的预测误差。研究了检测区域负样本出现需满足的条件,分析了检测区域大小对算法鲁棒性的影响。针对样本的访问方式,提出基于索引的访问方法,极大地减少了访问时间。实验结果表明,该方法不仅有效降低了TLD 算法的样本检测时间,而且提高了算法的鲁棒性。
目标跟踪 动态捕获区域 负样本 索引访问 target tracking TLD tracking-learning-detection dynamic capture negative sample index access