作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
国防科技大学 电子科学学院 ATR重点实验室,湖南长沙410073
针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题,通过引入一种多尺度特征融合策略和注意力机制,提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题,设计了一种基于残差结构的主干网络;针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题,设计了一种简单有效的多尺度特征融合策略;针对主干网络提取的特征图中信息冗余的问题,提出了一种卷积注意力机制。为验证所提算法的性能,在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明,所提出的算法在KITTI数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.84%,2.13%和4.02%;在DAIR-V2X-I数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.33%,2.09%和4.71%,由此证明了所提方法对点云稀疏小目标检测的有效性。
小目标检测 点云稀疏 PointPillar 残差结构 多尺度特征融合 卷积注意力 small object detection point cloud sparse PointPillar residual structure multi-scale feature fusion convolutional attention 
光学 精密工程
2023, 31(19): 2910
作者单位
摘要
辽宁工程技术大学软件学院,辽宁葫芦岛 125105
现有的基于深度学习图像融合算法无法同时满足融合效果与运算效率,且在建模过程中大部分采用基于单一尺度的融合策略,无法很好地提取源图像中上下文信息。为此本文提出了一种基于信息感知与多尺度特征结合的端到端图像融合网络。该网络由编码器、融合策略和解码器组成。具体来说,通过编码器提取红外与可见光图像的多尺度特征,并设计特征增强融合模块来融合多个尺度的不同模态特征,最后设计了一个轻量级的解码器将不同尺度的低级细节与高级语义信息结合起来。此外,利用源图像的信息熵构造一个信息感知损失函数来指导融合网络的训练,从而生成具有丰富信息的融合图像。在 TNO、MSRS数据集上对提出的融合框架进行了评估实验。结果表明:与现有的融合方法相比,该网络具有较高计算效率;同时在主观视觉评估和客观指标评价上都优于其它方法。
关键词:图像融合 多尺度特征 信息感知 特征增强 image fusion, multi-scale feature, information per 
红外技术
2023, 45(7): 685
作者单位
摘要
1 中国科学院长春光学精密机械与物理研究所,吉林 长春130033
2 中国人民解放军63618部队,新疆 库尔勒841000
目前采用U-Net结构的去模糊算法存在细节损失、图像质量欠佳等问题,因此对U-Net进行改进,提出一种基于多尺度优化和动态特征融合的图像去模糊方法。首先针对细节损失,提出一种精简且有效的多尺度残差注意力模块(Multi-Scale Residual Module, MSRM),通过增加特征尺度多样性来提取更精细的图像特征。此外,为了将更有利的特征传递到解码部分,在跳跃连接处设计动态特征融合模块(Dynamic Feature Fusion Module, DFFM),采用注意力加权的方式选择性融合不同阶段的编码特征。该算法采用多尺度内容损失和多尺度高频信息损失进行约束训练。在GoPro和RealBlur数据集上的实验结果表明,这种方法能有效改善图像质量,复原更丰富的细节信息。与现有去模糊算法相比,本文算法在主观视觉和客观评价等方面均具有一定优势。
图像去模糊 特征加权 多尺度特征 U-Net结构 image deblurring feature weighting multi-scale feature U-Net structure0 
红外
2023, 44(4): 0033
作者单位
摘要
天津大学微电子学院,天津 300072
针对当前红外场景下多尺度车辆检测精度欠佳且算法模型复杂度高的问题,提出了基于Shuffle-RetinaNet的红外车辆检测算法。该算法以RetinaNet网络为基础,并选用ShuffleNetV2作为特征提取网络。提出双分支注意力模块,通过双分支结构和自适应融合方法增强网络对红外图像中目标关键特征的提取能力;优化特征融合网络,集成双向交叉尺度连接和快速归一化融合,增强目标多尺度特征的表达能力;设置校准因子增强分类和回归之间的任务交互,提高目标分类和定位的准确性。该算法在自建红外车辆数据集上的检测精度达到92.9%,参数量为11.74×106,浮点计算量为24.35×109,同时在公开红外数据集FLIR ADAS上也展现出较好的检测性能。实验结果表明:该算法具有较高的检测精度,且模型复杂度低,在红外车辆检测领域具有较高的应用价值。
目标检测 红外车辆 通道注意力模块 多尺度特征融合 校准因子 
激光与光电子学进展
2023, 60(24): 2410006
作者单位
摘要
1 昆明理工大学机电工程学院,云南 昆明 650500
2 火箭军工程大学导弹工程学院,陕西 西安 710025
从遥感影像能够获取到精度高、范围广的地物信息,因而遥感影像在高空侦察和精确制导等领域得到广泛应用。针对遥感影像地物目标边缘模糊、尺度多变导致难以精准分割的问题,提出以深度残差网络为主干并结合注意力引导与多特征融合的分割方法,命名为AMSNet。首先,采用类别引导通道注意力模块提高模型对难分辨区域的敏感性;其次,嵌入特征复用模块减少遥感影像特征提取过程中边缘损失和小尺度目标丢失的问题;最后,设计跨区域特征融合模块以增强对多尺度特征信息的获取能力,并耦合多尺度损失融合模块对损失函数进行优化,综合提升模型对多尺度遥感影像目标的分割能力。选取3组遥感影像数据集进行对比实验,结果表明,AMSNet能够有效分割遥感影像地物目标边缘和多尺度目标。
遥感影像 语义分割 注意力机制 多尺度特征 
光学学报
2023, 43(24): 2428010
作者单位
摘要
1 天津大学微电子学院,天津 300072
2 天津大学智能与计算学部,天津 300072
3 天津市成像与感知微电子技术重点实验室,天津 300072
针对无人机航摄图像中目标尺寸差异大导致的感受野难以同时兼顾不同尺寸物体分割效果的问题,提出了利用两路分支分别提取浅层和深层信息的双路特征融合网络(DSFA-Net)。在编码器中,浅层分支利用三个串行ConvNeXt模块提取高通道数的浅层特征以保留更多空间细节;深层分支利用坐标注意力空洞空间金字塔池化(CA-ASPP)模块为特征图重新分配权重,使网络更加关注尺寸各异的分割目标,获得深层多尺度特征。在解码过程中,网络利用双边引导融合模块为两层特征建立通信以进行分辨率融合,提高层级特征的利用率。所提方法在AeroScapes和Semantic Drone航摄图像数据集上进行了实验,其平均交并比分别达到83.16%和72.09%、平均像素准确率分别达到90.75%和80.34%。与主流的语义分割方法相比,所提方法对于具有较大尺寸差异的目标,分割能力更强,更适用于无人机航摄图像场景下的语义分割任务。
语义分割 特征融合 双路网络 坐标注意力空洞空间金字塔池化 多尺度特征提取 
激光与光电子学进展
2023, 60(24): 2428005
作者单位
摘要
河海大学计算机与信息学院,江苏 南京 210098
针对现有深度学习算法在进行医学图像配准时出现的模型对噪声敏感、精度较低等问题,提出一种基于结构光和CT图像的点云配准算法,旨在提高配准精度、算法鲁棒性的同时,避免图像采集过程中X射线带来的辐射。首先,向术中患者体表投射编码后的结构光,并使用主成分分析方法获取主轴矫正后术中患者的体表点云;然后,对术前患者进行CT扫描并进行三维重建及采样获取术前患者的体表点云。最后,构建一种基于特征重用和注意力机制的动态图卷积网络模型结合图像迭代配准算法进行人体背部点云配准。整个过程较好地融合了两种模态的信息,且具有无辐射、精度较高、用时较短等优点。
多模态点云配准 注意力机制 多尺度特征融合 主轴矫正 
激光与光电子学进展
2023, 60(22): 2210007
作者单位
摘要
长春理工大学 计算机科学技术学院, 吉林 长春 130022
光学成像分辨率受衍射极限、探测器尺寸等诸多因素限制。为了获得细节更丰富、纹理更清晰的超分辨率图像,本文提出了一种多尺度特征注意力融合残差网络。首先,使用一层卷积提取图像的浅层特征,之后,通过级联的多尺度特征提取单元提取多尺度特征,多尺度特征提取单元中引入通道注意力模块自适应地校正特征通道的权重,以提高对高频信息的关注度。将网络中的浅层特征和每个多尺度特征提取单元的输出作为全局特征融合重建的层次特征。最后,利用残差分支引入浅层特征和多级图像特征,重建出高分辨率图像。算法使用Charbonnier损失函数使训练更加稳定,收敛速度更快。在国际基准数据集上的对比实验表明:该模型的客观指标优于大多数最先进的方法。尤其在Set5数据集上,4倍重建结果的PSNR指标提升了0.39 dB,SSIM指标提升至0.8992,且算法主观视觉效果更好。
卷积神经网络 超分辨率重建 多尺度特征提取 残差学习 通道注意力机制 convolutional neural network super-resolution reconstruction multi-scale feature extraction residual learning channel attention mechanism 
中国光学
2023, 16(5): 1034

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!