相同关键词【pooling】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 青岛大学自动化学院，山东青岛 266071

² 山东省工业控制技术重点实验室，山东青岛 266071

人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题，本文提出了一种改进的YOLOv7-POSE算法，并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础，对原始网络模型添加了分类的功能，在Backbone主干网络中引入CA卷积注意力机制，提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核，提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构，提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU，提高了坐标回归的精度。设计了两组对照实验，实验结果证明，改进后的YOLOv7-POSE在验证集上的mAP为95.7%，相比于原始YOLOv7算法提高了4%，各类运动动作识别准确率显著上升，在实际推理中的关键点错检、漏检等情况明显减少，关键点位置估计误差明显降低。

图像处理关键点检测姿态估计注意力机制空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling

PDF全文 Full Text

液晶与显示

2024, 39(2): 217

仪器，测量与计量

基于改进PointPillars的激光雷达三维目标检测

田枫刘超刘芳 ^*姜文文 [ ... ]赵玲

作者单位

摘要

东北石油大学计算机与信息技术学院，黑龙江大庆 163318

针对目前基于点云的三维目标检测算法中小目标检测效果差的问题，提出了基于改进PointPillars模型的三维目标检测方法。首先，改进了PointPillars模型中的pillar特征网络，提出了一个新的pillar编码模块，在编码网络中引入了平均池化和注意力池化，充分考虑了每个pillar模块的局部详细几何信息，提高了每个pillar模块的特征表示能力，从而提升了模型的小目标检测性能。其次，基于ConvNeXt改进了骨干网络中的二维卷积下采样模块，使模型在网络特征提取阶段能够提取丰富的上下文语义信息和全局特征，从而增强了算法的特征提取能力。在公开数据集KITTI上进行验证，实验结果表明，所提方法具有更高的检测精度，相较于原网络，改进后的算法的平均检测精度提升了3.63个百分点，证明了该方法的有效性。

三维目标检测 PointPillars 小目标检测注意力池化 ConvNeXt

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0812007

遥感与传感器

结合上下文信息与多层特征融合的遥感道路提取

陈果 ^1,2胡立坤 ^1,2,*

作者单位

摘要

¹ 广西大学电气工程学院，广西南宁 530004

² 广西大学先进测控与智能电力研究中心，广西南宁 530004

现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案，但由于其缺乏对全局信息的关注，模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度，提出一种结合上下文信息与多层特征融合的context＆multilayer features-UNet（CMF-UNet），该模型利用金字塔特征聚合模块融合多层特征，并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证，结果表明，所提方法能够有效提升道路分割精度，相较于原U-Net，CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点，在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。

图像处理 U-Net模型多尺度上下文注意力机制条带池化

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0428007

基于非下采样轮廓波变换的遥感地物分割算法

闵锋彭伟明况永刚毛一新郝琳琳

作者单位

摘要

武汉工程大学智能机器人湖北省重点实验室, 武汉 430000

针对遥感地物图像具有背景复杂且种类众多的特点, 利用传统算法进行分割会导致边缘模糊、信息丢失及分割精度低的问题, 提出了一种基于改进DeepLabV3+网络的语义分割算法。首先, 在主干网络中引入改进后的特征提取网络CHRNet; 其次, 使用非下采样轮廓波变换(NSCT)算法重构空洞空间金字塔池化(ASPP)模块中的全局池化操作; 最后, 在模型编码和解码阶段添加无参数的注意力机制SimAM, 加强模块间的特征传递, 提高特征利用率。实验表明, 在PASCAL VOC2012和WHDLD数据集上, 改进算法的平均交并比(MIoU)分别达到了81.56%和64.2%, 较原有算法分别提升了约4.61和2.8个百分点, 改进算法在保证分割速率的同时, 提升了分割精度。

遥感图像非下采样轮廓波变换空洞空间金字塔池化注意力机制 remote sensing image DeepLabV3+ DeepLabV3+ Non-Subsampled Contourlet Transform Atrous Spatial Pyramid Pooling attention mechanism

PDF全文 Full Text

电光与控制

2023, 30(11):

遥感与传感器

面向无人机航摄图像语义分割的双路特征融合网络

李润增 ¹史再峰 ^1,3,*孔凡宁 ¹赵向阳 ¹罗韬 ²

作者单位

摘要

¹ 天津大学微电子学院，天津 300072

² 天津大学智能与计算学部，天津 300072

³ 天津市成像与感知微电子技术重点实验室，天津 300072

针对无人机航摄图像中目标尺寸差异大导致的感受野难以同时兼顾不同尺寸物体分割效果的问题，提出了利用两路分支分别提取浅层和深层信息的双路特征融合网络（DSFA-Net）。在编码器中，浅层分支利用三个串行ConvNeXt模块提取高通道数的浅层特征以保留更多空间细节；深层分支利用坐标注意力空洞空间金字塔池化（CA-ASPP）模块为特征图重新分配权重，使网络更加关注尺寸各异的分割目标，获得深层多尺度特征。在解码过程中，网络利用双边引导融合模块为两层特征建立通信以进行分辨率融合，提高层级特征的利用率。所提方法在AeroScapes和Semantic Drone航摄图像数据集上进行了实验，其平均交并比分别达到83.16%和72.09%、平均像素准确率分别达到90.75%和80.34%。与主流的语义分割方法相比，所提方法对于具有较大尺寸差异的目标，分割能力更强，更适用于无人机航摄图像场景下的语义分割任务。

语义分割特征融合双路网络坐标注意力空洞空间金字塔池化多尺度特征提取

PDF全文 Full Text

激光与光电子学进展

2023, 60(24): 2428005

研究论文

基于改进YOLOv7的口罩佩戴检测

付惠琛 ^1,2高军伟 ^1,2,*车鲁阳 ^1,2

作者单位

摘要

¹ 青岛大学自动化学院，山东青岛 266071

² 山东省工业控制技术重点实验室，山东青岛 266071

佩戴好口罩是居民预防新冠和配合国家疫情防控的有效方式。针对口罩佩戴是否正确、拍摄角度不同以及被遮挡等问题，提出了一种改进的YOLOv7算法。该算法以YOLOv7为基础，在网络的Head区引入卷积注意力机制，使得特征网络在对口罩区域的处理中更具有针对性，从而增强特征网络对口罩区域的学习能力；对Backbone区结构进行优化，对ConvNeXt网络结构进行改进，并引入网络中代替部分卷积，提高模型的检测精度和鲁棒性，增强预测精确度的同时不会引入大量额外的计算。对Head层的空间金字塔池化进行改进，提高了训练速度并且加快模型收敛。实验结果表明，在复杂及遮挡的情况下，改进后的YOLOv7的损失函数大幅下降，在测试集上的mAP为93.8%，相比于原始YOLOv7算法提高了3.6%。各个类别的检测精度均有提升，没佩戴口罩、正确佩戴口罩、不正确佩戴口罩类别的精度分别提升6.8%、2.1%、1.7%。本文算法的错检情况明显减少，泛化能力有显著提升。

图像处理目标检测 YOLOv7算法卷积注意力机制空间金字塔池化 image processing object detection YOLOv7 algorithm convolutional attention mechanism space pyramid pooling

PDF全文 Full Text

液晶与显示

2023, 38(8): 1139

信息光学

基于改进DeepLabV3+的一步数字全息相位重建方法

陈建明 ¹江夏男 ²张春元 ^1,*王学 ^1,3王华英 ^1,3

作者单位

摘要

¹ 河北工程大学数理科学与工程学院, 河北邯郸 056038

² 河北博夏光电信息科技有限公司, 河北邯郸 056000

³ 计算光学成像与光电检测技术创新中心, 河北邯郸 056038

数字全息显微术能够测量定量光场信息, 但全息相位重建通常需要经过频谱滤波、模拟衍射、相位展开、畸变补偿等步骤, 且在滤波时人工选取滤波窗口的尺寸误差会很大程度上影响成像质量。提出了一种基于改进DeepLabV3+网络的一步数字全息相位重建方法, 在DeepLabV3+网络的基础上引入MobileNetV2结构进行改进。使用MobileNetV2提取全息图特征; 通过空洞空间金字塔池融合多尺度特征; 采用双线性插值的方法进行上采样, 以得到高精度的定量相位重建结果。实验结果表明, 与使用PhaseNet重建相比, 方法在结构相似性指数上提高了6.5%, 能够准确高效地实现数字全息高精度定量相位重建。

数字全息相位重建空洞空间金字塔池深度学习 digital holography phase reconstruction atrous spatial pyramid pooling deep learning

PDF全文 Full Text

光学技术

2023, 49(1): 17

图像处理

改进YOLOv5s算法的地铁场景行人目标检测

下载：620次

张秀再 ^1,2,*邱野 ¹张晨 ¹

作者单位

摘要

¹ 南京信息工程大学电子与信息工程学院，江苏南京 210044

² 南京信息工程大学江苏省大气环境与装备技术协同创新中心，江苏南京 210044

地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题，很大程度影响了行人目标检测的准确性。针对上述问题，本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集，标注对应标签，进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络，将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道，削弱冗余特征信道；利用改进空洞空间金字塔池化模块，在不丢失图像信息的前提下获得多尺度、多感受野的融合特征，有效捕获图像全局上下文信息；设计了一种改进非极大值抑制算法，对目标预测框进行后处理，保留检测目标最优预测框。实验结果表明：提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度，尤其对小行人目标和密集行人目标的检测，效果提升更为显著。

行人目标检测 YOLOv5s 注意力机制改进空洞空间金字塔池化

PDF全文 Full Text

激光与光电子学进展

2023, 60(6): 0610013

成像光谱

基于小目标类别注意力机制与特征融合的AF-ICNet非结构化场景语义分割方法

艾青林 ^1,*张俊瑞 ¹吴飞青 ²

作者单位

摘要

¹ 浙江工业大学特种装备制造与先进加工技术教育部/浙江省重点实验室，杭州 310023

² 浙大宁波理工学院信息科学与工程学院，宁波 315100

针对非结构化道路分割难度大、小目标检测精度较低等问题，构建基于小目标类别注意力机制与特征融合的AF-ICNet轻量级实时语义分割网络。采用空洞空间卷积池化金字塔融合不同尺度特征感受野以增强网络的全局感知能力。嵌入CA注意力机制，建立通道信息和空间位置信息以增强网络对非结构化道路小目标类别语义特征的提取能力。针对类别分布不均衡问题，改进权重交叉熵损失函数。利用AF-ICNet模型对Cityscapes与IDD数据集进行训练，在Cityscapes测试图像中分割的MIoU达到了71.5%，在IDD测试图像中分割的MIoU达到了62.5%。搭建实验测试系统进行实景测试，测试结果表明，AF-ICNet有效提升了非结构化道路及小目标类别的分割精度，并满足测试的实时性要求。

小目标类别语义分割 AF-ICNet CA注意力机制空洞空间卷积池化金字塔损失函数 Semantic segmentation of small target category AF-ICNet CA attention mechanism Atrous spatial pyramid pooling Loss function

PDF全文 Full Text

光子学报

2023, 52(1): 0110001

图像处理

DECANet：基于改进DeepLabv3+的图像语义分割方法

下载：703次

唐璐 ^1,1,2,2万良 ^1,1,2,">*王婷婷 ^1,1,2,2李树胜 ^1,1,2,2

作者单位

摘要

¹ 贵州大学计算机科学与技术学院，贵州贵阳 550025

² 贵州大学计算机软件与理论研究所，贵州贵阳 550025

在图像的语义分割任务中，不同对象之间像素值存在差异，导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题，提出一种图像语义分割方法（DECANet）。首先，引入通道注意力网络模块，通过对所有通道的依赖关系进行建模提高网络的表达能力，选择性地学习并强化通道特征，提取有用信息，抑制无用信息。其次，利用改进的空洞空间金字塔池化（ASPP）结构，对提取到的图像卷积特征进行多尺度融合，减少图像细节信息丢失，且在权重参数不改变的情况下提取语义像素位置信息，加快模型的收敛速度。最后，DECANet在PASCAL VOC2012和Cityscapes数据集上的平均交并比分别达81.08%和76%，与现有的先进网络模型相比，检测性能更优，可以有效地捕获局部细节信息，减少图像语义像素分类错误。

图像语义分割注意力机制空洞空间金字塔池化多尺度融合

PDF全文 Full Text

激光与光电子学进展

2023, 60(4): 0410002

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索