作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
中国计量大学光学与电子科技学院,浙江 杭州 310018
为解决分布式相位敏感光时域反射计系统现有事件识别方法对于相似振动信号识别困难这一问题,提出了一种基于多尺度特征融合的相似信号识别方法。在该方法中,原始信号首先通过经验模态分解和小波包分解被分解为不同频率范围内的子信号。随后,分别提取原始信号和子信号的时频特征和近似熵特征,并利用主成分分析法对所提取的特征进行融合。最后,通过构建一个6层轻量反向传播(BP)神经网络分类器,训练分类模型并利用测试集验证模型分类度。该方法对小车经过和行走等相似信号的识别准确率可分别达到98.5%和98.0%,对于敲击和摇晃差异性大的信号的识别准确率可达100%。相比于直接从原始信号中提取特征并结合时频图的卷积神经网络方式,所提方法的综合识别准确率分别提高了8.4%与9.0%,相似信号的识别准确率分别提高了13.5%与12.4%。结果表明,该方法在保证差异性大的信号的高识别准确率的基础上,显著提高了相似信号的识别准确率,对于拓展分布式光纤传感的应用范围有重要的价值。
光通信 相位敏感光时域反射计 时频特征 近似熵 多尺度特征融合 反向传播神经网络 
中国激光
2024, 51(6): 0606001
作者单位
摘要
上海工程技术大学电子电气工程学院,上海 201620
卷积神经网络已在图像超分辨率领域得到广泛应用,Transformer近年来在该类图像处理任务中的扩展更是具有里程碑的意义,然而这些大型网络具有过多的参数量和计算量,其在部署和应用上存在很大局限性。考虑到上述发展现状,提出一种基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建网络,该网络引入了以交错组卷积为主的特征提取模块,对Transformer的多头自注意力机制进行优化,设计了一种稀疏全局注意力机制以增强特征学习能力,并提出了一种多尺度特征重构模块来提高重建效果。实验结果表明:相比其他几种基于深度神经网络的方法,所提方法的PSNR、SSIM、参数量、计算量等性能指标都表现较好。而与基于Transfomer的方法相比,所提方法在PSNR、SSIM指标上平均提高0.03、0.0002,在参数量、计算量、运行时间上平均降低2.66×106、130×109、930 ms。
图像超分辨率 交错组卷积 注意力机制 轻量化网络 Transformer 多尺度特征重建 
激光与光电子学进展
2024, 61(4): 0411003
作者单位
摘要
国防科技大学 电子科学学院 ATR重点实验室,湖南长沙410073
针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题,通过引入一种多尺度特征融合策略和注意力机制,提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题,设计了一种基于残差结构的主干网络;针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题,设计了一种简单有效的多尺度特征融合策略;针对主干网络提取的特征图中信息冗余的问题,提出了一种卷积注意力机制。为验证所提算法的性能,在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明,所提出的算法在KITTI数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.84%,2.13%和4.02%;在DAIR-V2X-I数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.33%,2.09%和4.71%,由此证明了所提方法对点云稀疏小目标检测的有效性。
小目标检测 点云稀疏 PointPillar 残差结构 多尺度特征融合 卷积注意力 small object detection point cloud sparse PointPillar residual structure multi-scale feature fusion convolutional attention 
光学 精密工程
2023, 31(19): 2910
作者单位
摘要
辽宁工程技术大学软件学院,辽宁葫芦岛 125105
现有的基于深度学习图像融合算法无法同时满足融合效果与运算效率,且在建模过程中大部分采用基于单一尺度的融合策略,无法很好地提取源图像中上下文信息。为此本文提出了一种基于信息感知与多尺度特征结合的端到端图像融合网络。该网络由编码器、融合策略和解码器组成。具体来说,通过编码器提取红外与可见光图像的多尺度特征,并设计特征增强融合模块来融合多个尺度的不同模态特征,最后设计了一个轻量级的解码器将不同尺度的低级细节与高级语义信息结合起来。此外,利用源图像的信息熵构造一个信息感知损失函数来指导融合网络的训练,从而生成具有丰富信息的融合图像。在 TNO、MSRS数据集上对提出的融合框架进行了评估实验。结果表明:与现有的融合方法相比,该网络具有较高计算效率;同时在主观视觉评估和客观指标评价上都优于其它方法。
关键词:图像融合 多尺度特征 信息感知 特征增强 image fusion, multi-scale feature, information per 
红外技术
2023, 45(7): 685
作者单位
摘要
1 中国科学院长春光学精密机械与物理研究所,吉林 长春130033
2 中国人民解放军63618部队,新疆 库尔勒841000
目前采用U-Net结构的去模糊算法存在细节损失、图像质量欠佳等问题,因此对U-Net进行改进,提出一种基于多尺度优化和动态特征融合的图像去模糊方法。首先针对细节损失,提出一种精简且有效的多尺度残差注意力模块(Multi-Scale Residual Module, MSRM),通过增加特征尺度多样性来提取更精细的图像特征。此外,为了将更有利的特征传递到解码部分,在跳跃连接处设计动态特征融合模块(Dynamic Feature Fusion Module, DFFM),采用注意力加权的方式选择性融合不同阶段的编码特征。该算法采用多尺度内容损失和多尺度高频信息损失进行约束训练。在GoPro和RealBlur数据集上的实验结果表明,这种方法能有效改善图像质量,复原更丰富的细节信息。与现有去模糊算法相比,本文算法在主观视觉和客观评价等方面均具有一定优势。
图像去模糊 特征加权 多尺度特征 U-Net结构 image deblurring feature weighting multi-scale feature U-Net structure0 
红外
2023, 44(4): 0033
作者单位
摘要
1 河北工程大学 数理科学与工程学院, 河北 邯郸 056038
2 河北省计算光学成像与光电检测技术创新中心, 河北 邯郸 056038
数字全息成像是一种获得三维物体的波前信息的关键技术, 获得高质量的全息图是其首要条件, 由于受到图像传感器的约束及实验环境的影响, 所获得的数字全息图带有散斑噪声及分辨率低等问题。为了克服这一约束, 采用了一种基于深度学习的方法来提高全息图质量、图像分辨率及条纹信噪比。结果表明, 所研究算法可以应用于采集的多尺度全息图, 而且获得的高质量全息图重建效果更好, 减少散斑噪声影响, 并比较了三种损失函数在该网络训练中的性能。
全息 数字全息图 超分辨 深度学习 多尺度特征融合 holography the digital hologram super resolution deep learning characteristics of the fusion 
光学技术
2023, 49(4): 407
作者单位
摘要
天津大学微电子学院,天津 300072
针对当前红外场景下多尺度车辆检测精度欠佳且算法模型复杂度高的问题,提出了基于Shuffle-RetinaNet的红外车辆检测算法。该算法以RetinaNet网络为基础,并选用ShuffleNetV2作为特征提取网络。提出双分支注意力模块,通过双分支结构和自适应融合方法增强网络对红外图像中目标关键特征的提取能力;优化特征融合网络,集成双向交叉尺度连接和快速归一化融合,增强目标多尺度特征的表达能力;设置校准因子增强分类和回归之间的任务交互,提高目标分类和定位的准确性。该算法在自建红外车辆数据集上的检测精度达到92.9%,参数量为11.74×106,浮点计算量为24.35×109,同时在公开红外数据集FLIR ADAS上也展现出较好的检测性能。实验结果表明:该算法具有较高的检测精度,且模型复杂度低,在红外车辆检测领域具有较高的应用价值。
目标检测 红外车辆 通道注意力模块 多尺度特征融合 校准因子 
激光与光电子学进展
2023, 60(24): 2410006
作者单位
摘要
1 昆明理工大学机电工程学院,云南 昆明 650500
2 火箭军工程大学导弹工程学院,陕西 西安 710025
从遥感影像能够获取到精度高、范围广的地物信息,因而遥感影像在高空侦察和精确制导等领域得到广泛应用。针对遥感影像地物目标边缘模糊、尺度多变导致难以精准分割的问题,提出以深度残差网络为主干并结合注意力引导与多特征融合的分割方法,命名为AMSNet。首先,采用类别引导通道注意力模块提高模型对难分辨区域的敏感性;其次,嵌入特征复用模块减少遥感影像特征提取过程中边缘损失和小尺度目标丢失的问题;最后,设计跨区域特征融合模块以增强对多尺度特征信息的获取能力,并耦合多尺度损失融合模块对损失函数进行优化,综合提升模型对多尺度遥感影像目标的分割能力。选取3组遥感影像数据集进行对比实验,结果表明,AMSNet能够有效分割遥感影像地物目标边缘和多尺度目标。
遥感影像 语义分割 注意力机制 多尺度特征 
光学学报
2023, 43(24): 2428010

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!