付惠琛 1,2高军伟 1,2,*车鲁阳 1,2
作者单位
摘要
1 青岛大学 自动化学院,山东 青岛 266071
2 山东省工业控制技术重点实验室,山东 青岛 266071
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。
图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling 
液晶与显示
2024, 39(2): 217
作者单位
摘要
1 西安电子科技大学空间科学与技术学院,西安 710126
2 北京航空航天大学电子信息工程学院,北京 100191
3 北京空间机电研究所先进光学遥感技术北京市重点实验室,北京 100094
4 西安航天天绘数据技术有限公司,西安 710100
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %,且减少了36.1 %的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。
道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images 
航天返回与遥感
2024, 45(1): 111
作者单位
摘要
武汉工程大学智能机器人湖北省重点实验室, 武汉 430000
针对遥感地物图像具有背景复杂且种类众多的特点, 利用传统算法进行分割会导致边缘模糊、信息丢失及分割精度低的问题, 提出了一种基于改进DeepLabV3+网络的语义分割算法。首先, 在主干网络中引入改进后的特征提取网络CHRNet; 其次, 使用非下采样轮廓波变换(NSCT)算法重构空洞空间金字塔池化(ASPP)模块中的全局池化操作; 最后, 在模型编码和解码阶段添加无参数的注意力机制SimAM, 加强模块间的特征传递, 提高特征利用率。实验表明, 在PASCAL VOC2012和WHDLD数据集上, 改进算法的平均交并比(MIoU)分别达到了81.56%和64.2%, 较原有算法分别提升了约4.61和2.8个百分点, 改进算法在保证分割速率的同时, 提升了分割精度。
遥感图像 非下采样轮廓波变换 空洞空间金字塔池化 注意力机制 remote sensing image DeepLabV3+ DeepLabV3+ Non-Subsampled Contourlet Transform Atrous Spatial Pyramid Pooling attention mechanism 
电光与控制
2023, 30(11):
作者单位
摘要
1 天津大学微电子学院,天津 300072
2 天津大学智能与计算学部,天津 300072
3 天津市成像与感知微电子技术重点实验室,天津 300072
针对无人机航摄图像中目标尺寸差异大导致的感受野难以同时兼顾不同尺寸物体分割效果的问题,提出了利用两路分支分别提取浅层和深层信息的双路特征融合网络(DSFA-Net)。在编码器中,浅层分支利用三个串行ConvNeXt模块提取高通道数的浅层特征以保留更多空间细节;深层分支利用坐标注意力空洞空间金字塔池化(CA-ASPP)模块为特征图重新分配权重,使网络更加关注尺寸各异的分割目标,获得深层多尺度特征。在解码过程中,网络利用双边引导融合模块为两层特征建立通信以进行分辨率融合,提高层级特征的利用率。所提方法在AeroScapes和Semantic Drone航摄图像数据集上进行了实验,其平均交并比分别达到83.16%和72.09%、平均像素准确率分别达到90.75%和80.34%。与主流的语义分割方法相比,所提方法对于具有较大尺寸差异的目标,分割能力更强,更适用于无人机航摄图像场景下的语义分割任务。
语义分割 特征融合 双路网络 坐标注意力空洞空间金字塔池化 多尺度特征提取 
激光与光电子学进展
2023, 60(24): 2428005
左蒙 1,2,3,4刘意杨 1,2,3,*崔好 1,2,3白洪飞 2
作者单位
摘要
1 中国科学院网络化控制系统重点实验室,辽宁 沈阳 110016
2 中国科学院沈阳自动化研究所,辽宁 沈阳 110016
3 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110169
4 中国科学院大学,北京 100049
近年来,三维点云语义分割方法取得了很大的进展,代表性的方法为基于稀疏卷积的方法,但是稀疏卷积会带来全局上下文信息丢失的问题。基于此,提出一种基于稀疏卷积和注意力机制的点云语义分割方法。将注意力机制引入稀疏卷积网络,增强网络对全局上下文信息的获取能力。但是注意力机制计算量较大,限制了所提方法的适用场景。进一步将空间金字塔采样引入注意力机制中,在减少计算量的同时扩展其使用场景。实验结果表明,所提方法在Scannet V2数据集上取得了71.825%的平均交并比(MIOU),在S3DIS数据集上的MIOU达到70.5%,优于对比方法,验证了其有效性。
机器视觉 点云语义分割 稀疏卷积 注意力机制 空间金字塔采样 
激光与光电子学进展
2023, 60(20): 2015002
付惠琛 1,2高军伟 1,2,*车鲁阳 1,2
作者单位
摘要
1 青岛大学 自动化学院,山东 青岛 266071
2 山东省工业控制技术重点实验室,山东 青岛 266071
佩戴好口罩是居民预防新冠和配合国家疫情防控的有效方式。针对口罩佩戴是否正确、拍摄角度不同以及被遮挡等问题,提出了一种改进的YOLOv7算法。该算法以YOLOv7为基础,在网络的Head区引入卷积注意力机制,使得特征网络在对口罩区域的处理中更具有针对性,从而增强特征网络对口罩区域的学习能力;对Backbone区结构进行优化,对ConvNeXt网络结构进行改进,并引入网络中代替部分卷积,提高模型的检测精度和鲁棒性,增强预测精确度的同时不会引入大量额外的计算。对Head层的空间金字塔池化进行改进,提高了训练速度并且加快模型收敛。实验结果表明,在复杂及遮挡的情况下,改进后的YOLOv7的损失函数大幅下降,在测试集上的mAP为93.8%,相比于原始YOLOv7算法提高了3.6%。各个类别的检测精度均有提升,没佩戴口罩、正确佩戴口罩、不正确佩戴口罩类别的精度分别提升6.8%、2.1%、1.7%。本文算法的错检情况明显减少,泛化能力有显著提升。
图像处理 目标检测 YOLOv7算法 卷积注意力机制 空间金字塔池化 image processing object detection YOLOv7 algorithm convolutional attention mechanism space pyramid pooling 
液晶与显示
2023, 38(8): 1139
作者单位
摘要
1 河北工程大学 数理科学与工程学院, 河北 邯郸 056038
2 河北博夏光电信息科技有限公司, 河北 邯郸 056000
3 计算光学成像与光电检测技术创新中心, 河北 邯郸 056038
数字全息显微术能够测量定量光场信息, 但全息相位重建通常需要经过频谱滤波、模拟衍射、相位展开、畸变补偿等步骤, 且在滤波时人工选取滤波窗口的尺寸误差会很大程度上影响成像质量。提出了一种基于改进DeepLabV3+网络的一步数字全息相位重建方法, 在DeepLabV3+网络的基础上引入MobileNetV2结构进行改进。使用MobileNetV2提取全息图特征; 通过空洞空间金字塔池融合多尺度特征; 采用双线性插值的方法进行上采样, 以得到高精度的定量相位重建结果。实验结果表明, 与使用PhaseNet重建相比, 方法在结构相似性指数上提高了6.5%, 能够准确高效地实现数字全息高精度定量相位重建。
数字全息 相位重建 空洞空间金字塔 深度学习 digital holography phase reconstruction atrous spatial pyramid pooling deep learning 
光学技术
2023, 49(1): 17
张秀再 1,2,*邱野 1张晨 1
作者单位
摘要
1 南京信息工程大学电子与信息工程学院,江苏 南京 210044
2 南京信息工程大学江苏省大气环境与装备技术协同创新中心,江苏 南京 210044
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性。针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集,标注对应标签,进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框。实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著。
行人目标检测 YOLOv5s 注意力机制 改进空洞空间金字塔池化 
激光与光电子学进展
2023, 60(6): 0610013
唐璐 1,1,2,2万良 1,1,2,">*王婷婷 1,1,2,2李树胜 1,1,2,2
作者单位
摘要
1 贵州大学计算机科学与技术学院,贵州 贵阳 550025
2 贵州大学计算机软件与理论研究所,贵州 贵阳 550025
在图像的语义分割任务中,不同对象之间像素值存在差异,导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题,提出一种图像语义分割方法(DECANet)。首先,引入通道注意力网络模块,通过对所有通道的依赖关系进行建模提高网络的表达能力,选择性地学习并强化通道特征,提取有用信息,抑制无用信息。其次,利用改进的空洞空间金字塔池化(ASPP)结构,对提取到的图像卷积特征进行多尺度融合,减少图像细节信息丢失,且在权重参数不改变的情况下提取语义像素位置信息,加快模型的收敛速度。最后,DECANet在PASCAL VOC2012和Cityscapes数据集上的平均交并比分别达81.08%和76%,与现有的先进网络模型相比,检测性能更优,可以有效地捕获局部细节信息,减少图像语义像素分类错误。
图像语义分割 注意力机制 空洞空间金字塔池化 多尺度融合 
激光与光电子学进展
2023, 60(4): 0410002
李利荣 1,2,*陈鹏 1张云良 1张开 1[ ... ]巩朋成 1,2
作者单位
摘要
1 湖北工业大学电气与电子工程学院,湖北 武汉 430064
2 新能源及电网装备安全监测湖北省工程研究中心,湖北 武汉 430064
针对输电线路绝缘子缺陷检测准确率低和检测速度慢的问题,提出了一种基于多尺度特征编码和双重注意力融合的输电线路绝缘子缺陷检测方法。首先,为了使检测模型适应缺陷绝缘子特征尺度的多样性,编码网络采用Res2Net50提取更细粒度的特征,并在之后嵌入空洞空间金字塔池化模块实现多个尺度捕捉绝缘子及其缺陷的特征;其次,为了减少解码网络中特征信息的缺失,将主干网络的不同层特征与efficient channel attention注意力模块串联,并分别与经过squeeze and excitation注意力模块的各反卷积特征相加形成双重注意力融合。实验结果表明,所提方法的均值平均精度值约为95.35%,每秒传输帧数约为65.95,与其他方法相比,该方法对无人机绝缘子缺陷的准确检测具有一定的参考价值。
图像处理 绝缘子缺陷检测 空洞空间金字塔池化 多尺度特征编码 双重注意力融合 
激光与光电子学进展
2022, 59(24): 2410008

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!