光电工程
2024, 51(1): 230304
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
周涛 1,2彭彩月 1,2,*杜玉虎 1,2党培 1,2[ ... ]陆惠玲 3
作者单位
摘要
1 北方民族大学 计算机科学与工程学院,宁夏银川75002
2 北方民族大学 图像图形智能处理国家民委重点实验室,宁夏银川75001
3 宁夏医科大学 医学信息与工程学院,宁夏银川750004
针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强。设计了组注意力双残差模块(GADRM),采用双残差结构进行高效的特征融合,将双残差结构与通道混洗、通道注意力、空间注意力结合,增强模型对于病灶区域特征的提取能力;在网络的高层采用全局局部特征提取模块(GLFEM),结合CNN和Transformer的优势使网络充分提取图像的全局和局部特征,获得高层语义信息的全局特征,进一步增强网络的语义特征提取能力;设计了跨层双注意力特征融合模块(CDAFFM),融合浅层网络的空间信息以及深层网络的通道信息,对网络提取到的跨层特征进行增强。为了验证本文模型的有效性,分别在COVID-19 CHEST X-RAY数据集上进行消融实验和对比实验。实验结果表明,本文所提出网络的准确率、精确率、召回率,F1值和AUC值分别为98.41%,94.42%,94.20%,94.26%和99.65%。DRT Net能够帮助放射科医生使用胸部X光片对肺炎进行诊断,具有重要的临床作用。
肺炎识别 X射线图像 特征增强 双残差结构 Transformer pneumonia recognition X-ray image feature enhancement dual residual model Transformer 
光学 精密工程
2024, 32(5): 714
作者单位
摘要
1 兰州交通大学 电子与信息工程学院,甘肃兰州730000
2 兰州大学 信息科学与工程学院,甘肃兰州730000
利用图像结构特征进行图像修复,是近年来在深度学习技术广泛应用背景下出现的新方法。应用该方法可以在缺失区域内生成合理的内容,但图像修复结果过于依赖图像结构的提取内容,且在实际训练中会出现错误的持续传播和累积,一旦图像结构存在噪声或失真会直接影响到图像的生成质量。该方法处在探索应用阶段,尚存在网络训练难度大、鲁棒性较差、生成图像上下文语义不一致等问题。为此,本文提出了一种图像平滑结构指导修复的并行网络结构。图像平滑结构的生成内容不直接作为下一级网络的输入,只为网络的解码层提供指导信息。同时,为了更好地匹配和均衡结构与图像之间的特征关系,本文结合transformer提出了一种多尺度特征指导模块。该模块利用transformer联系全局特征的强大建模能力,对结构和图像纹理之间的特征进行匹配和均衡。实验结果表明,本文方法在三个常用的数据集上能够有效地恢复图像缺损内容,并且可以作为图像编辑工具实现目标移除。
图像修复 深度学习 平滑结构 Transformer image inpainting deep learning smooth structure transformer 
光学 精密工程
2024, 32(4): 549
周涛 1,3程倩茹 1,3,*张祥祥 1,3李琦 1,3陆惠玲 2
作者单位
摘要
1 北方民族大学 计算机科学与工程学院,宁夏银川75002
2 宁夏医科大学 医学信息工程学院,宁夏银川750004
3 北方民族大学 图像图形智能处理国家民委重点实验室,宁夏银川750021
基于生成对抗网络(Generative Adversarial Network,GAN)的医学图像融合是计算机辅助诊断领域的研究热点之一,但是现有基于GAN的融合方法存在训练不稳定,提取图像的局部和全局上下文语义信息能力不足,交互融合程度不够等问题。针对上述问题,本文提出了双耦合交互式融合GAN (Dual-Coupled Interactive Fusion GAN, DCIF-GAN)。首先,设计了双生成器双鉴别器GAN,通过权值共享机制实现生成器之间和鉴别器之间的耦合,通过全局自注意力机制实现交互式融合;第二,设计耦合CNN-Transformer的特征提取模块(Coupled CNN-Transformer Feature Extraction Module, CC-TFEM)和特征重构模块(CNN-Transformer Feature Reconstruction Module, C-TFRM),提升了对同一模态图像内部的局部和全局特征信息提取能力;第三,设计跨模态交互式融合模块(Cross Model Intermodal Fusion Module, CMIFM),通过跨模态自注意力机制,进一步整合不同模态间的全局交互信息。为了验证本文模型的有效性,在肺部肿瘤PET/CT医学图像数据集上进行实验,该文方法在平均梯度,空间频率,结构相似度,标准差,峰值信噪比,信息熵等上与其他四种方法中最优方法相比,分别提高了1.38%,0.39%,29.05%,30.23%,0.18%,4.63%。模型能够突出病变区域信息,融合图像结构清晰且纹理细节丰富。
医学图像 图像融合 PET/CT 耦合生成对抗网络 Swin Transformer medical image image fusion PET/CT coupled generative adversarial network swin transformer 
光学 精密工程
2024, 32(2): 221
作者单位
摘要
中国工程物理研究院 核物理与化学研究所,四川 绵阳 621900
结合理论求解、仿真分析与实验验证,确定了影响脉冲变压器型触发器输出前沿的主要因素,并研制了一台能可靠触发真空沿面闪络开关导通的快前沿固态触发器。研究结果表明:影响触发器输出脉冲前沿的关键因素为脉冲变压器漏感、匝数比和半导体开关开通速度;不同绕制方式的脉冲变压器漏感差异很大,最小漏感绕法的变压器漏感值低1个数量级;选用开通速度优于15 ns的碳化硅金属氧化物半导体场效应晶体管(SiC MOSFET)、绕制低漏感(小于0.5 μH)的脉冲变压器,实现了前沿为20.4 ns(10%~90%)、幅值为16.5 kV的快前沿输出;控制SiC MOSFET的驱动脉宽在35~55 ns变化可以控制触发电流峰值在35~55 A范围内变化。
固态触发源 脉冲变压器 快前沿输出 真空沿面闪络开关 solid-state trigger pulse generator pulse transformer fast-rise-time output vacuum surface flashover switch 
强激光与粒子束
2024, 36(2): 025004
作者单位
摘要
1 天津大学微电子学院,天津 300072
2 天津师范大学数学科学学院,天津 300387
3 天津市成像与感知微电子技术重点实验室,天津 300072
多能计算机断层扫描(Computed tomography,CT)技术可以更加精确地分辨出人体组织对不同能量X射线光子的吸收情况,是医学成像领域的重要发展方向。为了解决因量子噪声等非理想效应加重导致重建图像质量急剧退化的问题,提出了一种基于移位窗口多头自注意力机制的双流Transformer网络结构。该结构利用移位窗口Transformer和局部增强窗口Transformer分别提取投影数据的全局和局部特征,充分利用投影数据的非局部自相似性以保留投影数据的内部结构;然后通过残差卷积融合提取的特征;最后使用带有非局部全变分的混合损失函数来监督网络模型的训练,提升该网络模型对投影数据内部细节的敏感程度。实验结果表明,所提方法处理后的重建图像峰值信噪比(PSNR)值、结构相似性(SSIM)值和特征相似度(FSIM)值分别达到37.7301 dB、0.9944和0.9961。与目前先进的多能CT去噪方法相比,所提方法在去除低剂量多能CT投影数据噪声的同时,可保留更多的细节特征,有利于后续的精确诊断。
图像处理 计算机断层扫描成像 低剂量 卷积神经网络 Transformer网络 
激光与光电子学进展
2024, 61(8): 0837008
作者单位
摘要
北京联合大学智慧城市学院,北京 100101
针对肺结节计算机断层(CT)图像具有的细节多样性以及类间相似性的问题,构建了一种集卷积神经网络(Convolutional neural network,CNN)和Transformer优势的双路径交叉融合网络对肺结节进行更精确的分类。首先,以窗口多头自注意力和滑动窗口多头自注意力为基础,构建全局特征块,用于捕获结节的形态特征;以大核注意力为基础构建局部特征块,用于提取结节的纹理、密度等内部特征。其次,设计特征融合块用于融合上一阶段的局部与全局特征,使每一条路径都能获得更综合的判别信息。然后,引入KL(Kullback-leibler)散度来增加不同尺度特征之间的分布差异性,优化网络性能。最后,采用决策层融合的方法获得分类结果。在LIDC-IDRI数据集上进行实验,网络的分类准确率、召回率、精确率、特异性、受试者操作特征(ROC)曲线下的面积(Area under curve,AUC)分别为94.16%、93.93%、93.03%、92.54%、97.02%。实验结果表明,所提方法具有较好的肺结节良恶性分类能力。
肺结节良恶性分类 CT图像 局部-全局特征 Transformer 注意力机制 
激光与光电子学进展
2024, 61(8): 0837002
作者单位
摘要
上海工程技术大学电子电气工程学院,上海 201620
卷积神经网络已在图像超分辨率领域得到广泛应用,Transformer近年来在该类图像处理任务中的扩展更是具有里程碑的意义,然而这些大型网络具有过多的参数量和计算量,其在部署和应用上存在很大局限性。考虑到上述发展现状,提出一种基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建网络,该网络引入了以交错组卷积为主的特征提取模块,对Transformer的多头自注意力机制进行优化,设计了一种稀疏全局注意力机制以增强特征学习能力,并提出了一种多尺度特征重构模块来提高重建效果。实验结果表明:相比其他几种基于深度神经网络的方法,所提方法的PSNR、SSIM、参数量、计算量等性能指标都表现较好。而与基于Transfomer的方法相比,所提方法在PSNR、SSIM指标上平均提高0.03、0.0002,在参数量、计算量、运行时间上平均降低2.66×106、130×109、930 ms。
图像超分辨率 交错组卷积 注意力机制 轻量化网络 Transformer 多尺度特征重建 
激光与光电子学进展
2024, 61(4): 0411003
作者单位
摘要
华北理工大学 电气工程学院,河北 唐山 063210
烧结火焰图像中具有细粒度的局部火焰状态特征信息和复杂多变的全局火焰状态特征信息,而传统的卷积神经网络往往对局部特征更加敏感,难以提取火焰状态的全局特征信息,从而制约烧结火焰特征的表达能力,导致烧结火焰状态分类识别精度低。针对此类问题,提出一种基于CNN-Transformer的双流网络特征融合分类方法,该方法包含CNN(convolutional neural networks)流和Transformer流两个模块,首先将CNN块和Transformer块并行设计,CNN流提取烧结火焰RGB图像中的局部特征信息,Transformer流提取烧结火焰GRAY图像的全局特征信息;然后,将双流网络分别提取的烧结火焰状态局部特征信息和全局特征信息进行级联交互特征融合;最后,利用softmax分类器实现烧结火焰状态的分类。实验结果表明,火焰分类准确率可达96.20%,与传统卷积神经网络相比提升6%~8%的识别准确率。
卷积神经网络 Transformer 特征融合 烧结火焰 图像分类 convolutional neural network Transformer feature fusion sintering flame image classification 
应用光学
2023, 44(5): 1030

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!