鞠默然 1,2,3,4,5罗江宁 6王仲博 1,2,3,4,5罗海波 1,2,4,5,*
作者单位
摘要
1 中国科学院沈阳自动化研究所, 辽宁 沈阳110016
2 中国科学院机器人与智能制造创新研究院, 辽宁 沈阳 110016
3 中国科学院大学, 北京 100049
4 中国科学院光电信息处理重点实验室, 辽宁 沈阳 110016
5 辽宁省图像理解与视觉计算重点实验室, 辽宁 沈阳 110016
6 麦吉尔大学, 加拿大 魁北克 H3A 0G4
基于串联(concat)操作的特征融合方法仅仅融合了相邻尺度的特征,并没有充分利用来自其他尺度的输出特征。并且,串联操作只是在通道维度上将不同尺度的特征连接,不能反映不同通道间特征的相关性和重要性。针对这些问题,提出了一种基于注意力机制的特征融合算法。该算法利用注意力机制来融合不同尺度的特征,通过对每个通道的特征进行权重分配来学习不同通道间特征的相关性。将基于注意力机制的特征融合算法与YOLO V3相结合,构建多尺度目标检测器,并利用Focal loss和GIOU loss来设计检测器的损失函数。在PASCAL VOC和KITTI数据集上对不同算法进行对比实验,实验结果表明,多尺度目标检测器具有更高的检测精度和较快的检测速度。
机器视觉 卷积神经网络 特征融合 注意力机制 YOLO V3 
光学学报
2020, 40(13): 1315002
鞠默然 1,2,3,4,5,*罗海波 1,2,4,5王仲博 1,2,3,4,5何淼 1,2,3,4,5[ ... ]惠斌 1,2,4,5
作者单位
摘要
1 中国科学院沈阳自动化研究所, 辽宁 沈阳110016
2 中国科学院机器人与智能制造创新研究院, 辽宁 沈阳 110016
3 中国科学院大学, 北京 100049
4 中国科学院光电信息处理重点实验室, 辽宁 沈阳 110016
5 辽宁省图像理解与视觉计算重点实验室, 辽宁 沈阳 110016
针对图像中小目标检测率低、虚警率高等问题,提出了一种YOLO V3的改进方法,并将其应用于小目标的检测。由于小目标所占的像素少、特征不明显,提出对原网络输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与第2个残差块输出的特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层。为了获取更多的小目标特征信息,在YOLO V3网络结构Darknet53的第2个残差块中增加2个残差单元。利用K-means聚类算法对目标候选框的个数和宽高比维度进行聚类分析。用改进的YOLO V3算法和原YOLO V3算法在VEDAI数据集上进行对比实验,结果表明改进后的YOLO V3算法能有效检测小目标,对小目标的召回率和检测的平均准确率均值都有明显的提升。
机器视觉 小目标检测 YOLO V3 VEDAI数据集 K-means聚类算法 
光学学报
2019, 39(7): 0715004

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!