相同关键词【池化】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 青岛大学自动化学院，山东青岛 266071

² 山东省工业控制技术重点实验室，山东青岛 266071

人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题，本文提出了一种改进的YOLOv7-POSE算法，并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础，对原始网络模型添加了分类的功能，在Backbone主干网络中引入CA卷积注意力机制，提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核，提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构，提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU，提高了坐标回归的精度。设计了两组对照实验，实验结果证明，改进后的YOLOv7-POSE在验证集上的mAP为95.7%，相比于原始YOLOv7算法提高了4%，各类运动动作识别准确率显著上升，在实际推理中的关键点错检、漏检等情况明显减少，关键点位置估计误差明显降低。

图像处理关键点检测姿态估计注意力机制空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling

PDF全文 Full Text

液晶与显示

2024, 39(2): 217

遥感数据处理与应用

融合空洞空间金字塔池化和注意力的轻量化遥感影像道路提取

刘志恒 ¹岳子腾 ^2,*周绥平 ¹江澄 ³[ ... ]陈雪梅 ⁴

作者单位

摘要

¹ 西安电子科技大学空间科学与技术学院，西安 710126

² 北京航空航天大学电子信息工程学院，北京 100191

³ 北京空间机电研究所先进光学遥感技术北京市重点实验室，北京 100094

⁴ 西安航天天绘数据技术有限公司，西安 710100

针对高分辨率遥感影像中道路形状结构错综复杂，出现窄小型道路提取错误或漏分的问题，提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先，在原始高分辨率网络（HRNet）基础上，通过引入空洞空间金字塔池化模块，实现多尺度道路信息融合；再引入挤压激励通道注意力机制，增强网络特征表征质量；最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化，以降低模型计算复杂度。在公开数据集上进行了模型性能测试，实验结果表明，文章所提算法的准确率、精确率、召回率、F1分数和平均交并比，相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %，且减少了36.1 %的参数数量；相比其他网络，该算法突出了细小道路的特征，道路预测结果连续性、完整性好，并且模型小易于部署在实时检测设备中，有效改善了道路提取任务中错分和缺失的情况，是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。

道路提取空间金字塔池化通道注意力机制可分离卷积高分辨率网络遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images

PDF全文 Full Text

航天返回与遥感

2024, 45(1): 111

仪器，测量与计量

基于改进PointPillars的激光雷达三维目标检测

田枫刘超刘芳 ^*姜文文 [ ... ]赵玲

作者单位

摘要

东北石油大学计算机与信息技术学院，黑龙江大庆 163318

针对目前基于点云的三维目标检测算法中小目标检测效果差的问题，提出了基于改进PointPillars模型的三维目标检测方法。首先，改进了PointPillars模型中的pillar特征网络，提出了一个新的pillar编码模块，在编码网络中引入了平均池化和注意力池化，充分考虑了每个pillar模块的局部详细几何信息，提高了每个pillar模块的特征表示能力，从而提升了模型的小目标检测性能。其次，基于ConvNeXt改进了骨干网络中的二维卷积下采样模块，使模型在网络特征提取阶段能够提取丰富的上下文语义信息和全局特征，从而增强了算法的特征提取能力。在公开数据集KITTI上进行验证，实验结果表明，所提方法具有更高的检测精度，相较于原网络，改进后的算法的平均检测精度提升了3.63个百分点，证明了该方法的有效性。

三维目标检测 PointPillars 小目标检测注意力池化 ConvNeXt

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0812007

遥感与传感器

结合上下文信息与多层特征融合的遥感道路提取

陈果 ^1,2胡立坤 ^1,2,*

作者单位

摘要

¹ 广西大学电气工程学院，广西南宁 530004

² 广西大学先进测控与智能电力研究中心，广西南宁 530004

现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案，但由于其缺乏对全局信息的关注，模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度，提出一种结合上下文信息与多层特征融合的context＆multilayer features-UNet（CMF-UNet），该模型利用金字塔特征聚合模块融合多层特征，并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证，结果表明，所提方法能够有效提升道路分割精度，相较于原U-Net，CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点，在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。

图像处理 U-Net模型多尺度上下文注意力机制条带池化

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0428007

基于非下采样轮廓波变换的遥感地物分割算法

闵锋彭伟明况永刚毛一新郝琳琳

作者单位

摘要

武汉工程大学智能机器人湖北省重点实验室, 武汉 430000

针对遥感地物图像具有背景复杂且种类众多的特点, 利用传统算法进行分割会导致边缘模糊、信息丢失及分割精度低的问题, 提出了一种基于改进DeepLabV3+网络的语义分割算法。首先, 在主干网络中引入改进后的特征提取网络CHRNet; 其次, 使用非下采样轮廓波变换(NSCT)算法重构空洞空间金字塔池化(ASPP)模块中的全局池化操作; 最后, 在模型编码和解码阶段添加无参数的注意力机制SimAM, 加强模块间的特征传递, 提高特征利用率。实验表明, 在PASCAL VOC2012和WHDLD数据集上, 改进算法的平均交并比(MIoU)分别达到了81.56%和64.2%, 较原有算法分别提升了约4.61和2.8个百分点, 改进算法在保证分割速率的同时, 提升了分割精度。

遥感图像非下采样轮廓波变换空洞空间金字塔池化注意力机制 remote sensing image DeepLabV3+ DeepLabV3+ Non-Subsampled Contourlet Transform Atrous Spatial Pyramid Pooling attention mechanism

PDF全文 Full Text

电光与控制

2023, 30(11):

图像处理与仿真

基于 CSE-YOLOv5的遥感图像目标检测方法

沈凌云 ¹郎百和 ²宋正勋 ³温智滔 ¹

作者单位

摘要

¹ 太原工业学院电子工程系, 山西太原 030008

² 长春理工大学电子信息工程学院, 吉林长春 130022

³ 长春理工大学电子信息工程学院, 吉林长春 130022教育部学科创新引智基地(D17017), 吉林长春 130022

针对复杂任务场景中, 目标检测存在的多尺度特征学习能力不足、检测精度与模型参数量难以平衡的问题, 提出一种基于 CSE-YOLOv5(CBAM-SPPF-EIoU-YOLOv5, CSE-YOLOv5)模型的目标检测方法。模型以 YOLOv5主干网络框架为基础, 在浅层引入卷积块注意力机制层, 以提高模型细化特征提取能力并抑制冗余信息干扰。在深层设计了串行结构空间金字塔快速池化层, 改进了统计池化方法, 实现了由浅入深地融合多尺度关键特征信息。此外, 通过改进损失函数与优化锚框机制, 进一步增强多尺度特征学习能力。实验结果显示, CSE-YOLOv5系列模型在公开数据集 RSOD、DIOR和 DOTA上表现出良好的性能。 mAP@0.5的平均值分别为 96.8%、92.0%和 71.0%, 而 mAP@0.5:0.95的平均值分别为 87.0%、78.5%和 61.9%。此外, 该模型的推理速度满足实时性要求。与 YOLOv5系列模型相比, CSE-YOLOv5模型的性能显著提升, 并且在与其他主流模型的比较中展现出更好的检测效果。

遥感图像目标检测注意力机制金字塔快速池化多尺度目标 remote sensing images, target detection, attention

PDF全文 Full Text

红外技术

2023, 45(11): 1187

遥感与传感器

面向无人机航摄图像语义分割的双路特征融合网络

李润增 ¹史再峰 ^1,3,*孔凡宁 ¹赵向阳 ¹罗韬 ²

作者单位

摘要

¹ 天津大学微电子学院，天津 300072

² 天津大学智能与计算学部，天津 300072

³ 天津市成像与感知微电子技术重点实验室，天津 300072

针对无人机航摄图像中目标尺寸差异大导致的感受野难以同时兼顾不同尺寸物体分割效果的问题，提出了利用两路分支分别提取浅层和深层信息的双路特征融合网络（DSFA-Net）。在编码器中，浅层分支利用三个串行ConvNeXt模块提取高通道数的浅层特征以保留更多空间细节；深层分支利用坐标注意力空洞空间金字塔池化（CA-ASPP）模块为特征图重新分配权重，使网络更加关注尺寸各异的分割目标，获得深层多尺度特征。在解码过程中，网络利用双边引导融合模块为两层特征建立通信以进行分辨率融合，提高层级特征的利用率。所提方法在AeroScapes和Semantic Drone航摄图像数据集上进行了实验，其平均交并比分别达到83.16%和72.09%、平均像素准确率分别达到90.75%和80.34%。与主流的语义分割方法相比，所提方法对于具有较大尺寸差异的目标，分割能力更强，更适用于无人机航摄图像场景下的语义分割任务。

语义分割特征融合双路网络坐标注意力空洞空间金字塔池化多尺度特征提取

PDF全文 Full Text

激光与光电子学进展

2023, 60(24): 2428005

研究论文

基于改进YOLOv7的口罩佩戴检测

付惠琛 ^1,2高军伟 ^1,2,*车鲁阳 ^1,2

作者单位

摘要

¹ 青岛大学自动化学院，山东青岛 266071

² 山东省工业控制技术重点实验室，山东青岛 266071

佩戴好口罩是居民预防新冠和配合国家疫情防控的有效方式。针对口罩佩戴是否正确、拍摄角度不同以及被遮挡等问题，提出了一种改进的YOLOv7算法。该算法以YOLOv7为基础，在网络的Head区引入卷积注意力机制，使得特征网络在对口罩区域的处理中更具有针对性，从而增强特征网络对口罩区域的学习能力；对Backbone区结构进行优化，对ConvNeXt网络结构进行改进，并引入网络中代替部分卷积，提高模型的检测精度和鲁棒性，增强预测精确度的同时不会引入大量额外的计算。对Head层的空间金字塔池化进行改进，提高了训练速度并且加快模型收敛。实验结果表明，在复杂及遮挡的情况下，改进后的YOLOv7的损失函数大幅下降，在测试集上的mAP为93.8%，相比于原始YOLOv7算法提高了3.6%。各个类别的检测精度均有提升，没佩戴口罩、正确佩戴口罩、不正确佩戴口罩类别的精度分别提升6.8%、2.1%、1.7%。本文算法的错检情况明显减少，泛化能力有显著提升。

图像处理目标检测 YOLOv7算法卷积注意力机制空间金字塔池化 image processing object detection YOLOv7 algorithm convolutional attention mechanism space pyramid pooling

PDF全文 Full Text

液晶与显示

2023, 38(8): 1139

图像处理

改进YOLOv5s算法的地铁场景行人目标检测

下载：620次

张秀再 ^1,2,*邱野 ¹张晨 ¹

作者单位

摘要

¹ 南京信息工程大学电子与信息工程学院，江苏南京 210044

² 南京信息工程大学江苏省大气环境与装备技术协同创新中心，江苏南京 210044

地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题，很大程度影响了行人目标检测的准确性。针对上述问题，本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集，标注对应标签，进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络，将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道，削弱冗余特征信道；利用改进空洞空间金字塔池化模块，在不丢失图像信息的前提下获得多尺度、多感受野的融合特征，有效捕获图像全局上下文信息；设计了一种改进非极大值抑制算法，对目标预测框进行后处理，保留检测目标最优预测框。实验结果表明：提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度，尤其对小行人目标和密集行人目标的检测，效果提升更为显著。

行人目标检测 YOLOv5s 注意力机制改进空洞空间金字塔池化

PDF全文 Full Text

激光与光电子学进展

2023, 60(6): 0610013

成像光谱

基于小目标类别注意力机制与特征融合的AF-ICNet非结构化场景语义分割方法

艾青林 ^1,*张俊瑞 ¹吴飞青 ²

作者单位

摘要

¹ 浙江工业大学特种装备制造与先进加工技术教育部/浙江省重点实验室，杭州 310023

² 浙大宁波理工学院信息科学与工程学院，宁波 315100

针对非结构化道路分割难度大、小目标检测精度较低等问题，构建基于小目标类别注意力机制与特征融合的AF-ICNet轻量级实时语义分割网络。采用空洞空间卷积池化金字塔融合不同尺度特征感受野以增强网络的全局感知能力。嵌入CA注意力机制，建立通道信息和空间位置信息以增强网络对非结构化道路小目标类别语义特征的提取能力。针对类别分布不均衡问题，改进权重交叉熵损失函数。利用AF-ICNet模型对Cityscapes与IDD数据集进行训练，在Cityscapes测试图像中分割的MIoU达到了71.5%，在IDD测试图像中分割的MIoU达到了62.5%。搭建实验测试系统进行实景测试，测试结果表明，AF-ICNet有效提升了非结构化道路及小目标类别的分割精度，并满足测试的实时性要求。

小目标类别语义分割 AF-ICNet CA注意力机制空洞空间卷积池化金字塔损失函数 Semantic segmentation of small target category AF-ICNet CA attention mechanism Atrous spatial pyramid pooling Loss function

PDF全文 Full Text

光子学报

2023, 52(1): 0110001

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索