相同关键词【transformer】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 福州大学先进制造学院，福建泉州 362252

² 中国福建光电信息科学与技术实验室，福建福州 350116

针对太阳能电池片缺陷检测方法存在精度低的问题，提出一种基于改进的YOLOv5s太阳能电池片表面缺陷检测算法。首先，为了解决电池片小目标缺陷检测问题，提出了上下文Transformer网络（CoT），可以为小目标提供全局上下文信息，帮助模型更好地预测小目标。其次，将CBAM注意力加入到Head部分的C3模块，能够更好地捕捉输入特征图的重要通道和空间位置，提高模型的性能和鲁棒性。接着，使用轻量级的通用上采样算子CARAFE减少上采样过程中特征信息的损失，保证了特征信息的完整性。最后，使用WIoU作为边界框损失函数，大幅提升了回归的准确性，并且有助于快速实现模型的收敛。实验结果显示，改进后的YOLOv5s相较于原始算法在Precision、Recall、mAP@0.5三个指标上分别提高了5.5%、4.1%、3.3%，检测速度达到了76 FPS，满足太阳能电池片缺陷检测要求。

太阳能电池片 YOLOv5s 上下文Transformer网络 CARAFE 损失函数 solar cell YOLOv5s contextual transformer network CARAFE loss function

PDF全文 Full Text

液晶与显示

2024, 39(2): 237

面向道路场景语义分割的移动窗口变换神经网络设计

杭昊黄影平 ^*张栩瑞罗鑫

作者单位

摘要

上海理工大学光电信息与计算机工程学院，上海 200093

语义分割移动窗口变换神经网络注意力机制自动驾驶深度学习 semantic segmentation Swin Transformer attention mechanism autonomous driving deep learning

PDF全文 Full Text

光电工程

2024, 51(1): 230304

信息科学

位置敏感Transformer航拍图像目标检测模型

李大湘辛嘉妮 ^*刘颖

作者单位

摘要

西安邮电大学通信与信息工程学院，陕西西安710121

针对无人机视角下航拍图像小目标多且检测困难的问题，提出了一个位置敏感Transformer目标检测（PS-TOD）模型。设计了一个基于位置通道嵌入三维注意力（PCE3DA）的多尺度特征融合（MSFF）模块，即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力，用于加强模型对兴趣区域的特征表达能力，且基于它构造了一个自底向上的跨层MSFF方案，使得融合后的特征语义信息更加丰富；然后，设计了一种新的位置敏感自注意力（PSSA）机制，且以此构造位置敏感Transformer编-解码器，使模型在捕获图像全局上下文信息的长期依赖关系时，也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明，提出模型的AP达到28.8%，与基线模型（DETR）相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测，且改善小目标的检测效果。

目标检测无人机图像位置敏感Transformer 多尺度特征融合注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism

PDF全文 Full Text

光学精密工程

2024, 32(5): 727

信息科学

DRT Net：面向特征增强的双残差Res-Transformer肺炎识别模型

周涛 ^1,2彭彩月 ^1,2,*杜玉虎 ^1,2党培 ^1,2[ ... ]陆惠玲 ³

作者单位

摘要

¹ 北方民族大学计算机科学与工程学院，宁夏银川75002

² 北方民族大学图像图形智能处理国家民委重点实验室，宁夏银川75001

³ 宁夏医科大学医学信息与工程学院，宁夏银川750004

针对肺部X射线图像的病灶区域较小、形状复杂，与正常组织间的边界模糊，使得肺炎图像中的病灶特征提取不充分的问题，提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型，设计3种不同的特征增强策略对模型特征提取能力进行增强。设计了组注意力双残差模块（GADRM），采用双残差结构进行高效的特征融合，将双残差结构与通道混洗、通道注意力、空间注意力结合，增强模型对于病灶区域特征的提取能力；在网络的高层采用全局局部特征提取模块（GLFEM），结合CNN和Transformer的优势使网络充分提取图像的全局和局部特征，获得高层语义信息的全局特征，进一步增强网络的语义特征提取能力；设计了跨层双注意力特征融合模块（CDAFFM），融合浅层网络的空间信息以及深层网络的通道信息，对网络提取到的跨层特征进行增强。为了验证本文模型的有效性，分别在COVID-19 CHEST X-RAY数据集上进行消融实验和对比实验。实验结果表明，本文所提出网络的准确率、精确率、召回率，F1值和AUC值分别为98.41%，94.42%，94.20%，94.26%和99.65%。DRT Net能够帮助放射科医生使用胸部X光片对肺炎进行诊断，具有重要的临床作用。

肺炎识别 X射线图像特征增强双残差结构 Transformer pneumonia recognition X-ray image feature enhancement dual residual model Transformer

PDF全文 Full Text

光学精密工程

2024, 32(5): 714

信息科学

利用图像平滑结构信息指导图像修复

张家骏 ¹廉敬 ^1,2,*刘冀钊 ²董子龙 ¹张怀堃 ²

作者单位

摘要

¹ 兰州交通大学电子与信息工程学院，甘肃兰州730000

² 兰州大学信息科学与工程学院，甘肃兰州730000

利用图像结构特征进行图像修复，是近年来在深度学习技术广泛应用背景下出现的新方法。应用该方法可以在缺失区域内生成合理的内容，但图像修复结果过于依赖图像结构的提取内容，且在实际训练中会出现错误的持续传播和累积，一旦图像结构存在噪声或失真会直接影响到图像的生成质量。该方法处在探索应用阶段，尚存在网络训练难度大、鲁棒性较差、生成图像上下文语义不一致等问题。为此，本文提出了一种图像平滑结构指导修复的并行网络结构。图像平滑结构的生成内容不直接作为下一级网络的输入，只为网络的解码层提供指导信息。同时，为了更好地匹配和均衡结构与图像之间的特征关系，本文结合transformer提出了一种多尺度特征指导模块。该模块利用transformer联系全局特征的强大建模能力，对结构和图像纹理之间的特征进行匹配和均衡。实验结果表明，本文方法在三个常用的数据集上能够有效地恢复图像缺损内容，并且可以作为图像编辑工具实现目标移除。

图像修复深度学习平滑结构 Transformer image inpainting deep learning smooth structure transformer

PDF全文 Full Text

光学精密工程

2024, 32(4): 549

信息科学

基于DCIF-GAN的肺部肿瘤PET/CT跨模态医学图像融合

周涛 ^1,3程倩茹 ^1,3,*张祥祥 ^1,3李琦 ^1,3陆惠玲 ²

作者单位

摘要

¹ 北方民族大学计算机科学与工程学院，宁夏银川75002

² 宁夏医科大学医学信息工程学院，宁夏银川750004

³ 北方民族大学图像图形智能处理国家民委重点实验室，宁夏银川750021

基于生成对抗网络（Generative Adversarial Network，GAN）的医学图像融合是计算机辅助诊断领域的研究热点之一，但是现有基于GAN的融合方法存在训练不稳定，提取图像的局部和全局上下文语义信息能力不足，交互融合程度不够等问题。针对上述问题，本文提出了双耦合交互式融合GAN （Dual-Coupled Interactive Fusion GAN， DCIF-GAN）。首先，设计了双生成器双鉴别器GAN，通过权值共享机制实现生成器之间和鉴别器之间的耦合，通过全局自注意力机制实现交互式融合；第二，设计耦合CNN-Transformer的特征提取模块（Coupled CNN-Transformer Feature Extraction Module， CC-TFEM）和特征重构模块（CNN-Transformer Feature Reconstruction Module， C-TFRM），提升了对同一模态图像内部的局部和全局特征信息提取能力；第三，设计跨模态交互式融合模块（Cross Model Intermodal Fusion Module， CMIFM），通过跨模态自注意力机制，进一步整合不同模态间的全局交互信息。为了验证本文模型的有效性，在肺部肿瘤PET/CT医学图像数据集上进行实验，该文方法在平均梯度，空间频率，结构相似度，标准差，峰值信噪比，信息熵等上与其他四种方法中最优方法相比，分别提高了1.38%，0.39%，29.05%，30.23%，0.18%，4.63%。模型能够突出病变区域信息，融合图像结构清晰且纹理细节丰富。

医学图像图像融合 PET/CT 耦合生成对抗网络 Swin Transformer medical image image fusion PET/CT coupled generative adversarial network swin transformer

PDF全文 Full Text

光学精密工程

2024, 32(2): 221

高功率脉冲电源技术及应用

基于脉冲变压器的快前沿固态触发器

叶明天张迎鹏龙天骏王真

作者单位

摘要

中国工程物理研究院核物理与化学研究所，四川绵阳 621900

结合理论求解、仿真分析与实验验证，确定了影响脉冲变压器型触发器输出前沿的主要因素，并研制了一台能可靠触发真空沿面闪络开关导通的快前沿固态触发器。研究结果表明：影响触发器输出脉冲前沿的关键因素为脉冲变压器漏感、匝数比和半导体开关开通速度；不同绕制方式的脉冲变压器漏感差异很大，最小漏感绕法的变压器漏感值低1个数量级；选用开通速度优于15 ns的碳化硅金属氧化物半导体场效应晶体管（SiC MOSFET）、绕制低漏感（小于0.5 μH）的脉冲变压器，实现了前沿为20.4 ns（10%～90%）、幅值为16.5 kV的快前沿输出；控制SiC MOSFET的驱动脉宽在35～55 ns变化可以控制触发电流峰值在35～55 A范围内变化。

固态触发源脉冲变压器快前沿输出真空沿面闪络开关 solid-state trigger pulse generator pulse transformer fast-rise-time output vacuum surface flashover switch

PDF全文 Full Text

强激光与粒子束

2024, 36(2): 025004

数字图像处理

基于双流Transformer结构的多能计算机断层扫描成像投影数据去噪方法

欧阳顺馨 ¹史再峰 ^1,3,*孔凡宁 ¹张丽丽 ¹曹清洁 ²

作者单位

摘要

¹ 天津大学微电子学院，天津 300072

² 天津师范大学数学科学学院，天津 300387

³ 天津市成像与感知微电子技术重点实验室，天津 300072

多能计算机断层扫描（Computed tomography，CT）技术可以更加精确地分辨出人体组织对不同能量X射线光子的吸收情况，是医学成像领域的重要发展方向。为了解决因量子噪声等非理想效应加重导致重建图像质量急剧退化的问题，提出了一种基于移位窗口多头自注意力机制的双流Transformer网络结构。该结构利用移位窗口Transformer和局部增强窗口Transformer分别提取投影数据的全局和局部特征，充分利用投影数据的非局部自相似性以保留投影数据的内部结构；然后通过残差卷积融合提取的特征；最后使用带有非局部全变分的混合损失函数来监督网络模型的训练，提升该网络模型对投影数据内部细节的敏感程度。实验结果表明，所提方法处理后的重建图像峰值信噪比（PSNR）值、结构相似性（SSIM）值和特征相似度（FSIM）值分别达到37.7301 dB、0.9944和0.9961。与目前先进的多能CT去噪方法相比，所提方法在去除低剂量多能CT投影数据噪声的同时，可保留更多的细节特征，有利于后续的精确诊断。

图像处理计算机断层扫描成像低剂量卷积神经网络 Transformer网络

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0837008

数字图像处理

基于双路径交叉融合网络的肺结节CT图像分类方法

杨萍张鑫 ^*温帆田吉何宁

作者单位

摘要

北京联合大学智慧城市学院，北京 100101

针对肺结节计算机断层（CT）图像具有的细节多样性以及类间相似性的问题，构建了一种集卷积神经网络（Convolutional neural network，CNN）和Transformer优势的双路径交叉融合网络对肺结节进行更精确的分类。首先，以窗口多头自注意力和滑动窗口多头自注意力为基础，构建全局特征块，用于捕获结节的形态特征；以大核注意力为基础构建局部特征块，用于提取结节的纹理、密度等内部特征。其次，设计特征融合块用于融合上一阶段的局部与全局特征，使每一条路径都能获得更综合的判别信息。然后，引入KL（Kullback-leibler）散度来增加不同尺度特征之间的分布差异性，优化网络性能。最后，采用决策层融合的方法获得分类结果。在LIDC-IDRI数据集上进行实验，网络的分类准确率、召回率、精确率、特异性、受试者操作特征（ROC）曲线下的面积（Area under curve，AUC）分别为94.16%、93.93%、93.03%、92.54%、97.02%。实验结果表明，所提方法具有较好的肺结节良恶性分类能力。

肺结节良恶性分类 CT图像局部-全局特征 Transformer 注意力机制

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0837002

成像系统

基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建

李想张娟 ^*

作者单位

摘要

上海工程技术大学电子电气工程学院，上海 201620

卷积神经网络已在图像超分辨率领域得到广泛应用，Transformer近年来在该类图像处理任务中的扩展更是具有里程碑的意义，然而这些大型网络具有过多的参数量和计算量，其在部署和应用上存在很大局限性。考虑到上述发展现状，提出一种基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建网络，该网络引入了以交错组卷积为主的特征提取模块，对Transformer的多头自注意力机制进行优化，设计了一种稀疏全局注意力机制以增强特征学习能力，并提出了一种多尺度特征重构模块来提高重建效果。实验结果表明：相比其他几种基于深度神经网络的方法，所提方法的PSNR、SSIM、参数量、计算量等性能指标都表现较好。而与基于Transfomer的方法相比，所提方法在PSNR、SSIM指标上平均提高0.03、0.0002，在参数量、计算量、运行时间上平均降低2.66×10⁶、130×10⁹、930 ms。

图像超分辨率交错组卷积注意力机制轻量化网络 Transformer 多尺度特征重建

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0411003

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索