张国立 1,2常帅 1,2,*宋延嵩 1,2刘天赐 1,2
作者单位
摘要
1 长春理工大学光电工程学院,吉林 长春 130022
2 长春理工大学空间光电技术研究所,吉林 长春 130022
目前多光谱行人检测算法大多对可见光与红外图像融合方法展开研究,但是充分融合多光谱图像所需的参数量巨大,会导致检测速度降低。针对这一问题,提出了一种基于时效性较高的YOLOv5s的多光谱行人检测算法。为了保证算法的检测速度,选用可见光与红外光通道方向上的合并方法作为网络的输入,并通过对传统算法的改进来提升检测精度。首先,用可变形卷积替换部分标准卷积,增强了网络对不规则形状的特征目标的提取能力;其次,用多尺度残差注意力模块替换网络中的空间金字塔池化模块,减弱了背景对行人目标的干扰,提升了检测精度;最后,通过改变连接方式,增加大尺度特征拼接层,提升了网络的检测最小尺度,提升了网络对小目标的检测效果。实验结果表明,改进后的算法在检测速度上有明显优势,并比原算法的mAP@0.5和mAP@0.5∶0.95分别提升了5.1和1.9个百分点。
行人检测 可变形卷积 注意力机制 小目标检测 YOLOv5s 
激光与光电子学进展
2024, 61(10): 1037004
毕程程 1,2,3黄妙华 1,2,3,*刘若璎 1,2,3王量子 1,2,3
作者单位
摘要
1 武汉理工大学现代汽车零部件技术湖北省重点实验室,湖北 武汉 430070
2 武汉理工大学汽车零部件技术湖北省协同创新中心,湖北 武汉 430070
3 武汉理工大学湖北省新能源与智能网联车工程技术研究中心,湖北 武汉 430070
为解决行人检测任务中低能见度场景下单模态图像漏检率高和现有双模态图像融合检测速度低等问题,提出了一种基于双模态图像关联式融合的轻量级行人检测网络。网络模型基于YOLOv7-Tiny设计,主干网络嵌入关联式融合模块RAMFusion用以提取和聚合双模态图像互补特征;将特征提取部分的1×1卷积替换为带有空间感知能力的坐标卷积;引入Soft-NMS改善结群行人漏检问题;嵌入注意力机制模块来提升模型检测精度。在公开的红外与可见光行人数据集LLVIP上的消融实验表明:与其他融合方法相比,所提方法行人漏检率降低、检测速度显著提高;与YOLOv7-Tiny相比,改进后的模型检测精度提高了2.4%,每秒检测帧数达到124 frame/s,能够满足低能见度行人实时检测需求。
行人检测 红外与可见光图像 关联式融合 轻量化网络 注意力机制 YOLOv7-Tiny 
激光与光电子学进展
2024, 61(8): 0837014
作者单位
摘要
1 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105
2 辽宁工程技术大学 矿业学院,辽宁 阜新 123000
针对道路交通中目标所处环境复杂,存在模型对关键特征提取不充分、目标定位准确率低的问题,选取SSD模型为基本框架展开了特征提取方式、关键信息增强和非局部性特征定位的研究。首先,为针对性地解决道路交通场景下目标多尺度的问题,提出跳跃式反向特征金字塔结构,生成更具判别力的特征;其次,为解决不同语义层次的信息对特征融合过程贡献度不同的问题,设计基于注意力机制的自适应特征融合模块,在通道层面非先验地增强关键特征表达能力;最后,引入十字交叉注意力模块,提升模型对目标的位置敏感度。实验结果表明,与原始SSD模型相比,在保证实时性的情况下,改进方法的精度均值在PASCAL VOC子数据集上提升了2.6%,在自制道路交通数据集上提升了3.9%。综合考量,改进算法可广泛适用于道路车辆与行人检测任务中。
深度学习 车辆与行人检测 特征金字塔 注意力机制 特征融合 deep learning vehicle and pedestrian detection feature pyramid attention mechanism feature fusion 
液晶与显示
2023, 38(12): 1707
作者单位
摘要
1 西安工业大学电子信息工程学院,陕西 西安 710021
2 西安工业大学本科生院,陕西 西安 710021
3 北京微电子技术研究所,北京 100000
针对现有利用可见光与红外模态融合的行人目标检测算法在全天候环境下漏检率高的问题,提出一种基于光照感知权重融合的多模态行人目标检测算法。首先,使用引入高效通道注意力(ECA)机制模块的ResNet50作为特征提取网络,分别提取两个模态的特征;其次,对现有光照加权感知融合策略进行改进,通过设计一种新的光照感知加权融合机制获取可见光与红外模态的对应权重,并进行加权融合得到融合特征,从而降低算法的检测漏检率;最后,将从特征网络最后一层提取的多模态特征和生成的融合特征共同送入到检测网络,完成行人目标检测。实验结果表明,所提算法在KAIST数据集下具有良好的检测性能,在全天候下对行人目标的检测漏检率为11.16%。
多模态图像融合 注意力机制 光照感知权重融合 行人检测 
激光与光电子学进展
2023, 60(16): 1610008
作者单位
摘要
新疆大学 电气工程学院,新疆维吾尔自治区乌鲁木齐830017
针对街道等多人流量场景图像中人员密集、姿态变化多、人体遮挡严重造成的行人检测漏检问题,提出一种多分支无锚框网络(MBAN)行人检测方法。首先,在检测模型主干网络后加入多分支网络结构用以检测行人的多个关键区域局部特征;然后,设计了关键区域之间的距离损失函数引导分支网络对行人的局部检测位置进行差异化学习,接下来为了提高分支网络对行人局部特征空间信息的理解能力,在Resnet50网络尾部加入四个上采样块构成沙漏结构(Hourglass);最后,设计了一种局部特征选择网络自适应抑制多分支输出的非最优值,消除预测时的冗余特征框。实验结果表明MBAN方法对多人流量场景行人检测的mAP值、F1值、Prec和Recall分别达到85.22%,0.87,80.07%和94.39%,证明该方法对密集人群检测能力较强,与其他行人检测算法相比有较高的召回率。
无锚框网络 多分支网络 行人检测 局部特征 特征提取 特征选择 non-anchor frame network multi-branch network pedestrian detection local features feature extraction feature selection 
光学 精密工程
2023, 31(10): 1532
作者单位
摘要
南昌航空大学信息工程学院, 江西 南昌 330063
针对传统视觉背景提取(visual background extractor, ViBe)算法在进行行人检测时会产生鬼影的缺点, 本文提出了一种基于改进的 ViBe和 YOLO v3算法的行人检测方法。利用改进的 YOLO v3算法 YOLO v3-SPP(spatial pyramid pooling)对 ViBe算法的初始化策略进行改进以消除鬼影。运用 YOLO v3-SPP算法对首帧图像进行行人检测, 使用本文提出的行人消除方法将检测出的行人进行消除, 并将输出图像代替 ViBe算法的首帧, 从而达到消除鬼影的目的。经过分析和实验验证, 结果表明该算法能够有效解决鬼影问题。
图像处理 行人检测 视觉背景提取 鬼影消除 YOLO v3算法 image processing, pedestrian detection, visual bac 
红外技术
2023, 45(2): 137
作者单位
摘要
内蒙古大唐国际托克托发电有限责任公司, 呼和浩特 010206
为了提高车间监控系统智能化程度和工作场景中行人检测精度,提出了一种基于计算机视觉技术的行人检测方法。采用基于高级语义信息的无锚框特征检测技术,将检测任务简化为中心点和尺度的回归预测。特征提取模块通过四阶段降采样卷积网络,得到多尺度的图像特征并融合。头探测模块分成两路卷积,并行处理特征图,获得中心点热力图和尺度信息,输出检测结果。结果表明,在CityPersons数据集R子集上,MR-2达到11.61%,加入偏移量预测分支后MR-2提升了0.6%。这证明了该人员检测方法的性能优良。
目标检测 行人检测 计算机视觉技术 无锚框检测 语义信息 object detection pedestrian detection computer vision technique anchor free detection semantic information 
微电子学
2022, 52(5): 898
作者单位
摘要
河北工业大学 人工智能与数据科学学院,天津 300401
行人被严重遮挡导致无法提取有效特征是行人检测中出现漏检的一个主要原因。为了解决该问题,提出一种语义增强引导特征重建的遮挡行人检测算法。首先,利用空间和通道之间的依赖性设计了语义特征增强模块,建立全局上下文信息用以增强遮挡行人特征。其次,为关注行人的可见区域,通过自适应特征重建模块生成语义分割图,自适应调整通道的有效权重,增强行人和背景的可判别性。最后,通过多层次级联语义特征增强和自适应特征重建两个模块得到多层次特征图,融合多特征用以最终的行人解析。实验结果表明,该方法在具有挑战性的行人检测基准CityPersons和Caltech上,对严重遮挡目标的漏检率分别实现了47.28%和44.04%,在遮挡行人的检测上相较于其他方法具有较好的鲁棒性。
行人检测 语义特征增强 特征重建 语义分割 pedestrian detection semantic feature enhancement feature reconstruction semantic segmentation 
红外与激光工程
2022, 51(9): 20210924
作者单位
摘要
西安科技大学 电气与控制工程学院,陕西西安710054
针对红外行人图像中待检测目标存在多尺度及部分遮挡导致传统算法难以准确检测的问题,提出一种动态特征优化机制下的跨尺度红外行人检测算法。为解决复杂环境中行人目标特征难以有效表达进而造成目标检测精度低的问题,提出一种动态特征优化机制,通过设计亮度感知模块及EG-Chimp优化模型在增强输入图像局部对比度的同时抑制背景信息;搭建了CSPDarkNet特征提取网络,并在其基础上构建CSFF-BiFPN特征金字塔结构以及跨尺度特征融合模块,以提高检测网络对多尺度及部分遮挡行人目标的检测精度;为进一步精确定位行人目标,引入CIOU损失函数加速网络收敛,从而提升检测性能。选取9种经典检测算法在KAIST数据集上进行对比测试,实验结果表明,本文算法能够对复杂环境中的多尺度及部分遮挡红外行人目标进行准确检测,检测精度可达90.7%,验证了所提出检测网络的优势。
红外行人检测 跨尺度 动态特征优化 亮度感知 特征融合 infrared pedestrian detection cross scale dynamic feature optimization luminance perception feature fusion 
光学 精密工程
2022, 30(19): 2390
郝帅 1高山 1马旭 1,*安倍逸 1[ ... ]王峰 3
作者单位
摘要
1 西安科技大学 电气与控制工程学院,西安 710054
2 西安科技大学 安全科学与工程学院,西安 710054
3 渭南师范学院 物理与电气工程学院,陕西 渭南 714000
针对红外行人图像中受多尺度、部分遮挡以及环境干扰导致传统算法难以准确检测问题,提出一种红外图像行人检测算法。以CSPdarknet53作为主干特征提取网络,在输入端引入Focus模块以减少主干网络下采样过程中小尺度目标特征信息丢失;通过构建跨尺度特征聚合模块来融合主干网络不同残差层输出的全局特征和多尺度局部特征,提高网络多尺度特征聚合能力,提升网络检测精度;针对红外图像受自身成像机理以及复杂背景影响造成行人目标特征难以有效表达的问题,通过构建分层注意力映射模块来增强行人特征表达能力。为了验证所提出算法的优势,选取4种经典对比算法,并在3种公共数据集上进行测试验证。实验结果表明,该算法可以实现复杂环境下多尺度红外行人的准确检测,其平均准确率和召回率分别可达95.37%和92.99%。
红外行人检测 多尺度 Focus模块 空间金字塔 注意力机制 Infrared pedestrian detection Multi-scale Focus module Spatial pyramid Attention mechanism 
光子学报
2022, 51(6): 0610006

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!