1 上海理工大学健康科学与工程学院,上海 200093
2 上海健康医学院医疗器械学院,上海 201318
针对心脏磁共振图像中的心脏子结构之间灰度差异小导致的边界不清、右心室区域形状大小多变等影响分割精度的问题,提出一种结合频域先验知识和特征融合增强的心脏磁共振图像分割网络。所提模型是一个由频域先验引导子网络和特征融合增强子网络组合而成的D形结构网络。首先,通过傅里叶变换将原始图像从空间域转换为频域,提取出高频的边缘特征,并将频域先验引导的子网络的低级特征与特征融合增强子网络的对应阶段进行特征拼接融合,以提高边缘识别的能力;其次,在特征融合增强子网络的跳转连接处引入具有局部和全局注意力机制的特征融合模块,提取上下文信息并获得丰富的纹理细节;最后,在网络底部引入Transformer模块,进一步提取长距离语义信息,增强模型表达能力,提高分割精度。在ACDC数据集上的实验结果表明,与现有方法相比,所提方法在客观指标和视觉效果上均取得最佳的效果,良好的心脏分割结果能为后续图像分析和临床诊断提供参考依据。
图像分割 心脏磁共振图像 频域先验 注意力机制 傅里叶变换 激光与光电子学进展
2024, 61(10): 1037005
1 南京信息工程大学电子与信息工程学院,江苏 南京 210044
2 南京信息工程大学江苏省大气环境与装备技术协同创新中心,江苏 南京 210044
针对遥感图像目标检测算法漏检和误检率高、目标定位不精确、无法准确识别目标类别等问题,提出一种基于改进YOLOv8的目标检测算法。为提高模型的损失函数对梯度分配的灵活性,适应各种形状和尺寸的物体,设计了非单调聚焦机制与边界框几何因素相结合的边界框回归损失函数;为扩大模型的感受野并削弱遥感图像背景对检测目标的影响,采用全局注意力机制与残差块结合的方式,设计了残差全局注意力机制;为使模型适应遥感图像中目标物体的形变与不规则排列,对YOLOv8模型中的C2f模块进行改进,融入可变形卷积与可变形感兴趣区域池化层。实验结果表明,在DOTA数据集和RSOD数据集上,所提算法的平均精度均值(mAP@0.5)达到72.1%和94.6%,优于对比算法,提高了遥感图像目标检测精度,为遥感图像识别提供了新的手段。
目标检测 YOLOv8 WIoU 全局注意力机制 可变形卷积 激光与光电子学进展
2024, 61(10): 1028001
1 北京理工大学光电学院,北京 100081
2 光电成像技术与系统教育部重点实验室,北京 100081
3 信息光子技术工业和信息化部重点实验室,北京 100081
注意力机制的出现和应用在一定程度上改善了神经网络对全局信息应用不足的缺陷,但常见的注意力机制模块也同样存在感受野小无法关注全局信息的问题,而某些全局注意力机制模块则计算成本过高。为此,提出一种基于卷积、池化、对比方法的轻量化注意力模块,即全局采样空间注意力模块。对于深度网络推理过程中部分模块输出的中间特征图,该注意力模块通过对比差值的形式获取所需要的空间注意力图。全局采样空间注意力模块是一种轻量化的通用模块,能够直接置入卷积神经网络中,增加的成本几乎可以忽略不计,并且其能够与网络一同进行端到端训练。主要在随机抽取的部分ImageNet-1K数据集和团队自制的“低慢小”无人机数据集中对模块进行了验证。实验结果显示,相比其他模块,所提模块在图像分类和小目标检测识别任务中具备1百分点~3百分点的性能提升效果,证明了所提模块的性能与其在小目标检测方面的适用性。
注意力机制 全局采样 轻量化 图像分类 小目标探测 激光与光电子学进展
2024, 61(10): 1037009
1 江南大学人工智能与计算机学院,江苏 无锡 214122
2 江苏省模式识别与计算智能工程实验室(江南大学),江苏 无锡 214122
针对multiattention network(MANet)算法与图像语义信息关联不足、全局特征提取不充分和分割精度较低的问题,基于Transformer与注意力机制,提出一种增强浅层网络语义信息,具有融合局部和全局上下文的双分支解码器的网络结构,即Transformer multiattention network(TransMANet)。首先,引入局部注意力嵌入机制,增强上下文信息的嵌入,并将高级特征的语义信息嵌入低级特征;然后,设计基于Transformer与卷积神经网络的双分支解码器,分别提取全局上下文信息和不同尺度的细节信息,对全局与局部信息建模;最后,改进原有的损失函数,缓解遥感数据集类别不平衡的问题,提高分割准确度。实验结果表明,TransMANet在UAVid、LoveDA、Potsdam和Vaihingen数据集上均取得了较MANet及其他有竞争力的先进方法更优的交并比指标,有较好的泛化能力。
图像处理 语义分割 注意力机制 Transformer 高分辨率遥感影像 激光与光电子学进展
2024, 61(10): 1028002
1 江南大学机械工程学院,江苏 无锡 214122
2 江苏省食品先进制造装备技术重点实验室,江苏 无锡 214122
3 江南大学物联网工程学院,江苏 无锡 214122
针对苹果表层存在多种缺陷类型、对不同缺陷的检测方法不同的问题,提出一种基于改进YOLOv7-tiny的缺陷检测模型,结合相机采集的RGB+NIR多光谱图像对苹果表层多种缺陷进行了检测和分类。首先,为了提取更多有效的特征信息,提高对缺陷的定位能力,在主干网络中使用坐标注意力(CA)机制聚合坐标信息,同时在主干网络后添加上下文转换器(CoT)模块以增加全局感受野;其次,为了增强高效聚合网络的特征融合能力,将其与加权双向特征金字塔结合,调整结构中各分支的占比;最后,为了解决难易样本不均衡的问题,将损失函数更换为Focal-EIoU损失。改进后网络的平均精度均值(mAP)@0.5提升了1.2百分点,达到93.2%,识别速度为89.3 frame/s。研究结果表明,本文研究内容为苹果表层的缺陷检测提供了更加高效的方法,同时为苹果的分级提供了更加精确的依据。
缺陷检测 苹果表层 多光谱图像 深度学习 YOLOv7-tiny 注意力机制 激光与光电子学进展
2024, 61(10): 1012003
1 华中光电技术研究所—武汉光电国家研究中心,湖北武汉430223
2 武汉设计工程学院信息工程学院,湖北武汉430225
红外小目标检测通常受制于较远的成像距离,使得提取目标特征成为了一种困难,如何增强目标的特征表达是近些年的主要方向之一。而过于复杂的特征表达会损失推理速度,这对于有实时性要求的红外小目标检测任务是不利的。通过使用重参数化技术结合领域中常用的残差网络作为特征提取网络,再使用额外注意力与通道注意力作为特征增强模块与特征融合模块,在数据集上取得了较好的结果。提出的模型在 SIRST 与 IRSTD-1K 数据集上分别取得了 0.734 与 0.638 的 mIoU 值,同时参数量和计算复杂度只有 0.306 M 与1.114 G FLOPs。该模型能够在推理阶段保持较少参数的同时拥有和其他领先的方法相近甚至领先的性能,在串行运行的环境上有着明显的优势。
红外小目标检测 深度学习 卷积神经网络 模型压缩 注意力机制 infrared small targets detection deep learning convolutional neural networks model compression attention mechanism
1 沈阳航空航天大学机电工程学院,辽宁 沈阳 110136
2 沈阳航空航天大学航空制造工艺数字化国防重点学科实验室,辽宁 沈阳 110136
在对K4169合金母材进行修复前采用不同的工艺进行热处理,以获取两类不同的显微组织,然后对比分析了母材的显微组织分和力学性能,并系统研究了修复试样热影响区液化裂纹的敏感性和产生机制。研究结果显示:在均匀化固溶时效条件下,母材主要由Laves相、δ相以及碳化物组成,修复试样母材与热影响区的平均显微硬度分别为220 HV和210 HV,修复试样的抗拉强度、屈服强度和延伸率分别为870.7 MPa、618.9 MPa和7.7%,断裂位置位于母材。在均匀化热等静压固溶时效条件下,母材主要由δ相以及碳化物组成;修复试样中存在裂纹,裂纹分布在母材一侧,横截面上裂纹的平均长度可达0.68 mm,最大裂纹长度为0.72 mm;热影响区液化裂纹的发生与母材的组织成分、晶粒度密切相关。相较之下,均匀化热等静压固溶时效合金修复试样母材与热影响区的平均硬度都较低,分别为210 HV和200 HV,Laves相和δ相的含量对母材和热影响区的显微硬度均有影响,抗拉强度和屈服强度分别降低了20.3%和38.4%,但延伸率有所升高,断裂位置在热影响区。两种试样都未断在修复区,这是因为修复区的晶粒更细,产生了细晶强化作用。
激光技术 激光沉积修复 K4169合金 修复前热处理 开裂机理 力学性能 中国激光
2024, 51(10): 1002322