相同关键词【D-Attention】论文列表 -- 中国光学期刊网

Research Articles

基于梯度可感知通道注意力模块的红外小目标检测前去噪网络

林再平 ¹罗伊杭 ¹李博扬 ¹凌强 ¹[ ... ]吴京 ^1,*

作者单位

摘要

¹ 国防科技大学电子科学学院，湖南长沙 410073

² 航天系统部装备部军事代表局，北京 100000

³ 上海卫星工程研究所，上海 200000

红外图像去噪在**及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计，此类方法容易过度平滑图像细节，从而导致弱小目标丢失，为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息，本文提出了一种基于梯度可感知通道注意力模块的红外弱小目标检测前去噪网络。该网络首先采用编码器-解码器结构来去除图像中的加性噪声，然后通过梯度可感知通道注意力模块对图像高频区域进行自适应增强，有效保持红外弱小目标的响应强度。此外，本文提出了领域第一个包含3 981张含噪声的红外图像数据集。实验结果表明，该网络能够在有效去除加性噪声的同时避免过度平滑，很好地保留了红外图像中的目标信息，最终实现了在含噪声环境下的高鲁棒性红外弱小目标检测。

红外小目标检测前去噪梯度可感知通道注意力模块 infrared small target denoising before detection gradient-aware channel attention

PDF全文 Full Text

红外与毫米波学报

2024, 43(2): 254

数字图像处理

结合频域先验和特征增强的心脏图像分割方法

陈柯炎 ¹刘巧红 ^2,*韩啸翔 ¹林元杰 ¹张维坤 ¹

作者单位

摘要

¹ 上海理工大学健康科学与工程学院，上海 200093

² 上海健康医学院医疗器械学院，上海 201318

针对心脏磁共振图像中的心脏子结构之间灰度差异小导致的边界不清、右心室区域形状大小多变等影响分割精度的问题，提出一种结合频域先验知识和特征融合增强的心脏磁共振图像分割网络。所提模型是一个由频域先验引导子网络和特征融合增强子网络组合而成的D形结构网络。首先，通过傅里叶变换将原始图像从空间域转换为频域，提取出高频的边缘特征，并将频域先验引导的子网络的低级特征与特征融合增强子网络的对应阶段进行特征拼接融合，以提高边缘识别的能力；其次，在特征融合增强子网络的跳转连接处引入具有局部和全局注意力机制的特征融合模块，提取上下文信息并获得丰富的纹理细节；最后，在网络底部引入Transformer模块，进一步提取长距离语义信息，增强模型表达能力，提高分割精度。在ACDC数据集上的实验结果表明，与现有方法相比，所提方法在客观指标和视觉效果上均取得最佳的效果，良好的心脏分割结果能为后续图像分析和临床诊断提供参考依据。

图像分割心脏磁共振图像频域先验注意力机制傅里叶变换

PDF全文 Full Text

激光与光电子学进展

2024, 61(10): 1037005

遥感与传感器

基于改进YOLOv8算法的遥感图像目标检测

张秀再 ^1,2,*沈涛 ¹许岱 ¹

作者单位

摘要

¹ 南京信息工程大学电子与信息工程学院，江苏南京 210044

² 南京信息工程大学江苏省大气环境与装备技术协同创新中心，江苏南京 210044

针对遥感图像目标检测算法漏检和误检率高、目标定位不精确、无法准确识别目标类别等问题，提出一种基于改进YOLOv8的目标检测算法。为提高模型的损失函数对梯度分配的灵活性，适应各种形状和尺寸的物体，设计了非单调聚焦机制与边界框几何因素相结合的边界框回归损失函数；为扩大模型的感受野并削弱遥感图像背景对检测目标的影响，采用全局注意力机制与残差块结合的方式，设计了残差全局注意力机制；为使模型适应遥感图像中目标物体的形变与不规则排列，对YOLOv8模型中的C2f模块进行改进，融入可变形卷积与可变形感兴趣区域池化层。实验结果表明，在DOTA数据集和RSOD数据集上，所提算法的平均精度均值（mAP@0.5）达到72.1%和94.6%，优于对比算法，提高了遥感图像目标检测精度，为遥感图像识别提供了新的手段。

目标检测 YOLOv8 WIoU 全局注意力机制可变形卷积

PDF全文 Full Text

激光与光电子学进展

2024, 61(10): 1028001

数字图像处理

全局采样空间注意力机制及其在图像分类与小目标检测识别中的应用

卢镜宇 ^1,2,3张海洋 ^1,2,3,*王文鑫 ^1,2,3赵长明 ^1,2,3

作者单位

摘要

¹ 北京理工大学光电学院，北京 100081

² 光电成像技术与系统教育部重点实验室，北京 100081

³ 信息光子技术工业和信息化部重点实验室，北京 100081

注意力机制的出现和应用在一定程度上改善了神经网络对全局信息应用不足的缺陷，但常见的注意力机制模块也同样存在感受野小无法关注全局信息的问题，而某些全局注意力机制模块则计算成本过高。为此，提出一种基于卷积、池化、对比方法的轻量化注意力模块，即全局采样空间注意力模块。对于深度网络推理过程中部分模块输出的中间特征图，该注意力模块通过对比差值的形式获取所需要的空间注意力图。全局采样空间注意力模块是一种轻量化的通用模块，能够直接置入卷积神经网络中，增加的成本几乎可以忽略不计，并且其能够与网络一同进行端到端训练。主要在随机抽取的部分ImageNet-1K数据集和团队自制的“低慢小”无人机数据集中对模块进行了验证。实验结果显示，相比其他模块，所提模块在图像分类和小目标检测识别任务中具备1百分点~3百分点的性能提升效果，证明了所提模块的性能与其在小目标检测方面的适用性。

注意力机制全局采样轻量化图像分类小目标探测

PDF全文 Full Text

激光与光电子学进展

2024, 61(10): 1037009

遥感与传感器

基于TransMANet的遥感图像语义分割算法

宋熙睿 ^1,2葛洪伟 ^1,2,*

作者单位

摘要

¹ 江南大学人工智能与计算机学院，江苏无锡 214122

² 江苏省模式识别与计算智能工程实验室（江南大学），江苏无锡 214122

针对multiattention network（MANet）算法与图像语义信息关联不足、全局特征提取不充分和分割精度较低的问题，基于Transformer与注意力机制，提出一种增强浅层网络语义信息，具有融合局部和全局上下文的双分支解码器的网络结构，即Transformer multiattention network（TransMANet）。首先，引入局部注意力嵌入机制，增强上下文信息的嵌入，并将高级特征的语义信息嵌入低级特征；然后，设计基于Transformer与卷积神经网络的双分支解码器，分别提取全局上下文信息和不同尺度的细节信息，对全局与局部信息建模；最后，改进原有的损失函数，缓解遥感数据集类别不平衡的问题，提高分割准确度。实验结果表明，TransMANet在UAVid、LoveDA、Potsdam和Vaihingen数据集上均取得了较MANet及其他有竞争力的先进方法更优的交并比指标，有较好的泛化能力。

图像处理语义分割注意力机制 Transformer 高分辨率遥感影像

PDF全文 Full Text

激光与光电子学进展

2024, 61(10): 1028002

仪器，测量与计量

基于改进YOLOv7-tiny的多光谱苹果表层缺陷检测

化春键 ^1,2,*孙明春 ^1,2蒋毅 ^1,2俞建峰 ^1,2陈莹 ³

作者单位

摘要

¹ 江南大学机械工程学院，江苏无锡 214122

² 江苏省食品先进制造装备技术重点实验室，江苏无锡 214122

³ 江南大学物联网工程学院，江苏无锡 214122

针对苹果表层存在多种缺陷类型、对不同缺陷的检测方法不同的问题，提出一种基于改进YOLOv7-tiny的缺陷检测模型，结合相机采集的RGB+NIR多光谱图像对苹果表层多种缺陷进行了检测和分类。首先，为了提取更多有效的特征信息，提高对缺陷的定位能力，在主干网络中使用坐标注意力（CA）机制聚合坐标信息，同时在主干网络后添加上下文转换器（CoT）模块以增加全局感受野；其次，为了增强高效聚合网络的特征融合能力，将其与加权双向特征金字塔结合，调整结构中各分支的占比；最后，为了解决难易样本不均衡的问题，将损失函数更换为Focal-EIoU损失。改进后网络的平均精度均值（mAP）@0.5提升了1.2百分点，达到93.2%，识别速度为89.3 frame/s。研究结果表明，本文研究内容为苹果表层的缺陷检测提供了更加高效的方法，同时为苹果的分级提供了更加精确的依据。

缺陷检测苹果表层多光谱图像深度学习 YOLOv7-tiny 注意力机制

PDF全文 Full Text

激光与光电子学进展

2024, 61(10): 1012003

基于重参数化的红外小目标检测网络

朱翊翔 ¹闵志方 ¹朱雪琼 ²王翔 ¹

作者单位

摘要

¹ 华中光电技术研究所—武汉光电国家研究中心，湖北武汉430223

² 武汉设计工程学院信息工程学院，湖北武汉430225

红外小目标检测通常受制于较远的成像距离，使得提取目标特征成为了一种困难，如何增强目标的特征表达是近些年的主要方向之一。而过于复杂的特征表达会损失推理速度，这对于有实时性要求的红外小目标检测任务是不利的。通过使用重参数化技术结合领域中常用的残差网络作为特征提取网络，再使用额外注意力与通道注意力作为特征增强模块与特征融合模块，在数据集上取得了较好的结果。提出的模型在 SIRST 与 IRSTD-1K 数据集上分别取得了 0.734 与 0.638 的 mIoU 值，同时参数量和计算复杂度只有 0.306 M 与1.114 G FLOPs。该模型能够在推理阶段保持较少参数的同时拥有和其他领先的方法相近甚至领先的性能，在串行运行的环境上有着明显的优势。

红外小目标检测深度学习卷积神经网络模型压缩注意力机制 infrared small targets detection deep learning convolutional neural networks model compression attention mechanism

PDF全文 Full Text

光学与光电技术

2024, 22(1): 10

研究论文

健身行为的人体姿态估计及动作识别

付惠琛 ^1,2高军伟 ^1,2,*车鲁阳 ^1,2

作者单位

摘要

¹ 青岛大学自动化学院，山东青岛 266071

² 山东省工业控制技术重点实验室，山东青岛 266071

人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题，本文提出了一种改进的YOLOv7-POSE算法，并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础，对原始网络模型添加了分类的功能，在Backbone主干网络中引入CA卷积注意力机制，提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核，提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构，提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU，提高了坐标回归的精度。设计了两组对照实验，实验结果证明，改进后的YOLOv7-POSE在验证集上的mAP为95.7%，相比于原始YOLOv7算法提高了4%，各类运动动作识别准确率显著上升，在实际推理中的关键点错检、漏检等情况明显减少，关键点位置估计误差明显降低。

图像处理关键点检测姿态估计注意力机制空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling

PDF全文 Full Text

液晶与显示

2024, 39(2): 217

研究论文

基于深度学习的雾霾天气下的车牌号码识别方法

杨云 ^*王静姜佳乐

作者单位

摘要

陕西科技大学电子信息与人工智能学院，陕西西安 710021

针对雾霾天气下车牌识别存在的精确度低、漏检等问题，提出了一种基于深度学习的雾霾天气下的车牌号码识别方法。首先用AOD-Net算法对车辆图像进行去雾预处理。然后，基于YOLOv5网络设计一种车牌检测网络ACG_YOLOv5s。ACG_YOLOv5s是在YOLOv5s网络的基础上，融入CBAM注意力机制，提高模型的抗干扰能力；引入自适应特征融合网络ASFF，根据模型自适应学习到的权重赋予网络不同特征层不同比重的权值，从而突出重要特征信息；使用Ghost卷积模块替换传统卷积，在保证模型效果的同时减少了网络训练过程中的参数量。最后通过LPRNet对检测到的车牌图像进行识别。实验结果表明，改进后的ACG_YOLOv5s网络车牌检测准确率达到99.6%，LPRNet识别准确率达96%且内存占比小。实验证明AOD-Net算法和YOLO算法结合可更加有效地检测雾霾天气下车牌图像中的车牌号码。

车牌号码识别 AOD-Net算法 YOLOv5网络注意力机制 license plate number recognition AOD-Net algorithm YOLOv5 network attention mechanism

PDF全文 Full Text

液晶与显示

2024, 39(2): 205

研究论文

融合XLnet与DMGAN的文本生成图像方法

赵泽纬车进 ^*吕文涵

作者单位

摘要

宁夏大学物理与电子电气工程学院，宁夏银川 750021

针对文本生成图像任务中的文本编码器不能深度挖掘文本信息，导致后续生成的图像存在语义不一致的问题，本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码，该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识，实现对上下文信息的深度挖掘；然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块，突出重要的特征通道，进一步提升生成图像的语义一致性和空间布局合理性，以及模型的收敛速度和稳定性。实验结果表明，所提出模型在CUB数据集上生成的图像相比原DMGAN模型，IS指标提升了0.47，FID指标降低了2.78，充分说明该模型具有更好的跨模态生成能力。

文本生成图像 XLnet模型生成对抗网络通道注意力 text-to-image XLnet model generate adversarial networks attention of channel

PDF全文 Full Text

液晶与显示

2024, 39(2): 168

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索