光学 精密工程
2023, 31(19): 2910
针对当前红外场景下多尺度车辆检测精度欠佳且算法模型复杂度高的问题,提出了基于Shuffle-RetinaNet的红外车辆检测算法。该算法以RetinaNet网络为基础,并选用ShuffleNetV2作为特征提取网络。提出双分支注意力模块,通过双分支结构和自适应融合方法增强网络对红外图像中目标关键特征的提取能力;优化特征融合网络,集成双向交叉尺度连接和快速归一化融合,增强目标多尺度特征的表达能力;设置校准因子增强分类和回归之间的任务交互,提高目标分类和定位的准确性。该算法在自建红外车辆数据集上的检测精度达到92.9%,参数量为11.74×106,浮点计算量为24.35×109,同时在公开红外数据集FLIR ADAS上也展现出较好的检测性能。实验结果表明:该算法具有较高的检测精度,且模型复杂度低,在红外车辆检测领域具有较高的应用价值。
目标检测 红外车辆 通道注意力模块 多尺度特征融合 校准因子 激光与光电子学进展
2023, 60(24): 2410006
河海大学计算机与信息学院,江苏 南京 210098
针对现有深度学习算法在进行医学图像配准时出现的模型对噪声敏感、精度较低等问题,提出一种基于结构光和CT图像的点云配准算法,旨在提高配准精度、算法鲁棒性的同时,避免图像采集过程中X射线带来的辐射。首先,向术中患者体表投射编码后的结构光,并使用主成分分析方法获取主轴矫正后术中患者的体表点云;然后,对术前患者进行CT扫描并进行三维重建及采样获取术前患者的体表点云。最后,构建一种基于特征重用和注意力机制的动态图卷积网络模型结合图像迭代配准算法进行人体背部点云配准。整个过程较好地融合了两种模态的信息,且具有无辐射、精度较高、用时较短等优点。
多模态点云配准 注意力机制 多尺度特征融合 主轴矫正 激光与光电子学进展
2023, 60(22): 2210007
1 广东工业大学计算机学院,广东 广州 510006
2 云南电网有限责任公司输电分公司,云南 昆明 650011
为了有效地检测复杂场景下施工人员的安全帽佩戴情况,减少安全隐患,提出一种改进的YOLOv4安全帽检测算法(SMD-YOLOv4)。首先采用SE-Net注意力模块强化模型主干网络提取有效特征的能力;然后使用密集空洞空间金字塔池化(DenseASPP)代替网络中的空间金字塔池化(SPP)以减少信息丢失,优化全局上下文信息的提取;最后在PANet部分增加特征融合的尺度并引入深度可分离卷积,使网络在获得复杂背景下小目标细节信息的同时不降低网络推理速度。实验结果表明:在自建实验数据集下,SMD-YOLOv4算法的平均精度均值(mAP)达97.34%,较目前具有代表性的Faster R-CNN、SSD、YOLOv5、YOLOx和YOLOv4算法,分别高出了26.41个百分点、6.44个百分点、3.25个百分点、1.49个百分点和3.19个百分点,能满足实时检测的需要。
目标检测 YOLOv4 安全帽检测 注意力机制 多尺度特征融合 DenseASPP 激光与光电子学进展
2023, 60(12): 1210011
1 西南科技大学信息工程学院, 四川 绵阳 621010
2 西南科技大学特殊环境机器人技术四川省重点实验室, 四川 绵阳 621010
针对红外与可见光图像在融合后容易出现伪影, 小目标轮廓不清晰等问题, 提出一种基于多尺度特征与注意力模型相结合的红外与可见光图像融合算法。通过 5次下采样提取源图像不同尺度的特征图, 再将同一尺度的红外与可见光特征图输入到基于注意力模型的融合层, 获得增强的融合特征图。最后把小尺度的融合特征图进行 5次上采样, 再与上采样后同一尺度的特征图相加, 直到与源图像尺度一致, 实现对特征图的多尺度融合。实验对比不同融合框架下融合图像的熵、标准差、互信息量、边缘保持度、小波特征互信息、视觉信息保真度以及融合效率, 本文方法在多数指标上优于对比算法, 且融合图像目标细节明显轮廓清晰。
图像融合 多尺度特征融合 注意力模型 红外图像 image fusion, multi-scale feature fusion, attentio
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室,上海 201800
2 中国科学院大学,北京 100049
由于尺寸有限、外观和几何线索较少以及缺少大规模小目标数据集,从图像中检测小目标仍然是计算机视觉领域中一个具有挑战性的难题。针对这个问题,提出一种自适应特征增强的目标检测网络(YOLO-AFENet)来改善小目标的检测精度。首先,通过引入特征融合因子,设计改进的自适应双向特征融合模块,充分利用各个尺度的特征图,提高网络的特征表达能力;其次,结合网络自身的特点,提出空间注意力生成模块,通过学习图像中感兴趣区域的位置信息以提高网络的特征定位能力。在UAVDT数据集上实验结果表明:所提YOLO-AFENet的平均精度(AP)比改进前的YOLOv5提高了6.3个百分点,同时也优于其他目标检测网络。
图像处理 目标检测 小目标 多尺度特征融合 空间注意力 UAVDT 激光与光电子学进展
2023, 60(6): 0610004
昆明理工大学信息工程与自动化学院,云南 昆明 650500
针对轻量化网络在目标检测中检测精度低的问题,提出了一种以MobileNet为基础网络的轻量级目标检测网络MobileNet-RFB-ECA。针对目标多尺度特性,采用基于轻量化扩充感受野模块(RFB)的特征金字塔网络结构增强网络对目标多尺度特性的适应性。与此同时,针对复杂注意力模块导致计算量大的问题,在主干特征提取网络添加有效通道注意力机制模块(ECA),提高卷积神经网络的性能。实验结果表明,相较于MobileNet,所提MobileNet-RFB-ECA在PASCAL VOC数据集和KITTI数据集上检测精度分别提高了4.2个百分点和15.4个百分点,模型大小分别为50.3 MB和48.5 MB,平均检测速度为34 frame·s-1。
图像处理 目标检测 轻量化神经网络 多尺度特征融合 MobileNet RFB-Net模型 有效注意力机制 激光与光电子学进展
2023, 60(4): 0410024