作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
光电工程
2024, 51(1): 230304
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
1 内蒙古科技大学 信息工程学院,内蒙古包头市0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。
脑肿瘤 图像分割 特征对齐 注意力机制 轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight 
光学 精密工程
2024, 32(4): 565
作者单位
摘要
中国人民解放军63870部队,陕西渭南714299
在可见光红外跟踪(RGB and Thermal Infrared Tracking,RGB-T)的研究中,为了在常规跟踪算法的基础上实现两个模态的有效融合,基于注意力机制提出了一种基于注意力交互的RGB-T跟踪算法。该算法引入注意力机制对可见光和红外两种模态的图像特征进行增强和融合,设计了自特征增强编码器对单一模态的特征进行增强,设计了互特征解码器对两个模态增强后的特征进行交互融合。编码器和解码器均采用两层注意力模块。为了减小算法模型的复杂度,对传统注意力模块进行简化,将全连接层改为1×1卷积。此外,该算法对多个卷积层的特征均进行分层融合,以充分挖掘各层卷积特征中的细节和语义信息。在GTOT,RGBT234和LasHeR三个数据集上进行对比测试。实验结果表明,所提算法性能优异,特别是在RGBT234和LasHeR这两个大规模数据集上取得了最优的跟踪结果,验证了注意力机制在RGB-T跟踪中的有效性。
可见光红外跟踪 注意力机制 多模态特征融合 特征增强 RGB-T tracking attention mechanism feature fuse of multi-modality feature enhancement 
光学 精密工程
2024, 32(3): 435
刘光辉 1,2,*陈健 1,2孟月波 1,2徐胜军 1,3
作者单位
摘要
1 西安建筑科技大学 信息与控制工程学院,陕西西安70055
2 建筑机器人陕西省高等学校重点实验室,陕西西安710055
3 西安市建筑制造智动化技术重点实验室,陕西西安710055
针对混凝土表面裂缝分割过程中分割精度低、细微裂缝漏分和背景干扰等问题,提出一种联合线性引导和网格优化的裂缝分割模型。首先,在主干网络中引入多分支线性引导模块,通过自适应单维度池化增强网络对裂缝线性结构的表达能力,让不同区域的裂缝建立联系,增强全局上下文信息感知能力,提高网络分割精度;然后,提出网格细节优化模块,通过分区-优化-合并三步骤,将整个空间域划分为若干个空间网格,提取空间网格中的细微裂缝信息,防止细微裂缝漏分;最后,在主干网络的跳跃连接处嵌入混合注意力模块,在空间和通道双维度突出裂缝特征,减少背景干扰。在Deepcrack537,Crack500和CFD裂缝数据集上,所提模型的IoU值分别达到77.07%,58.96%和56.55%,F1-score值分别达到87.05%,74.19%和72.24%,明显优于大多数现有方法,具有更高的分割精度。
裂缝图像 线性引导 语义分割 网格优化 注意力机制 crack image linear guide semantic segmentation mesh optimization attention mechanism 
光学 精密工程
2024, 32(2): 286
作者单位
摘要
兰州交通大学 电子与信息工程学院,甘肃兰州730070
针对多模态医学图像融合中存在纹理细节模糊和对比度低的问题,提出了一种结构功能交叉神经网络的多模态医学图像融合方法。首先,根据医学图像的结构信息和功能信息设计了结构功能交叉神经网络模型,不仅有效地提取解剖学和功能学医学图像的结构信息和功能信息,而且能够实现这两种信息之间的交互,从而很好地提取医学图像的纹理细节信息。其次,利用交叉网络通道和空间特征变化构造了一种新的注意力机制,通过不断调整结构信息和功能信息权重来融合图像,提高了融合图像的对比度和轮廓信息。最后,设计了一个从融合图像到源图像的分解过程,由于分解图像的质量直接取决于融合结果,因此分解过程可以使融合图像包含更多的细节信息。通过与近年来提出的7种高水平方法相比,本文方法的AG,EN,SF,MI,QAB/F和CC客观评价指标分别平均提高了22.87%,19.64%,23.02%,12.70%,6.79%,30.35%,说明本文方法能够获得纹理细节更清晰、对比度更好的融合结果,在主观视觉和客观指标上都优于其他对比算法。
多模态医学图像融合 结构功能信息交叉网络 注意力机制 分解网络 multimodal medical image fusion structural and functional information cross-interacting network attention mechanism decomposition network 
光学 精密工程
2024, 32(2): 252
作者单位
摘要
烟台大学计算机与控制工程学院,山东 烟台 264000
现在大多数基于图卷积的点云语义分割方法忽略了边构建的重要性,不能充分地表示局部区域的特征。基于此,提出一种结合注意力机制的边增强的图卷积网络(AE-GCN)。首先,将邻居点特征加入边中,而不仅仅是中心点与邻居点的特征差异;其次,加入注意力机制保证点云的局部信息得到更充分的利用;最后,采用U-Shape的分割结构,确保网络更好适应点云的语义分割这一任务。在两个公开数据集Toronto_3D和S3DIS上的实验结果表明,与目前的大多数方法相比,AE-GCN取得了具有竞争力的结果:在Toronto_3D数据集的平均交并比为80.3%,总体准确度为97.1%;在S3DIS数据集的平均交并比为68.0%,总体准确度为87.2%。
三维图像处理 点云语义分割 注意力机制 边增强 图卷积 
激光与光电子学进展
2024, 61(8): 0837009
王创世 1,**陈勇 1,*刘焕淋 2吴金兰 1[ ... ]张薇薇 1
作者单位
摘要
1 重庆邮电大学工业物联网与网络化控制教育部重点实验室,重庆 400065
2 重庆邮电大学通信与信息工程学院,重庆 400065
针对室内可见光定位接收信号强度易出现波动从而产生较大定位误差,以及从一个定位单元迁移到其他定位单元可能会降低定位精度的问题,笔者提出了一种基于注意力机制的卷积神经网络的室内三维定位方法,以减小接收信号波动产生的影响,并采用迁移学习将在第一个定位单元中训练的网络迁移到其他定位单元中,在保证定位精度不变的前提下减少了训练网络的成本。仿真结果表明:所提算法在5 m×5 m×3 m的定位单元内可以实现平均误差为3.54 cm的三维定位;采用迁移学习将已训练网络部署到第二个定位单元中,可以实现平均误差为3.67 cm的定位。实验结果表明:在1.2 m×0.75 m×1.2 m的定位单元实验中,所提算法可以实现平均误差为3.32 cm的三维定位,90%的误差分布在4.12 cm内;采用迁移学习将已训练网络部署到第二个定位单元中,可以实现平均误差为3.35 cm的定位。与现有算法相比,所提算法迁移前后的定位精度均有所改善。
光通信 可见光定位 注意力机制 卷积神经网络 迁移学习 
中国激光
2024, 51(8): 0806002
作者单位
摘要
1 广西大学计算机与电子信息学院,广西 南宁 530004
2 广西大学机械工程学院,广西 南宁 530004
为了实时检测乘客的异常行为,提出一种基于YOLOv5s算法的轻量化自动扶梯乘客异常行为实时检测算法YOLO-STE。首先在主干网络中引入轻量化ShuffleNetV2网络,以减少主干网络的参数量和计算量;其次在骨干网络的最后一层引入基于Transformer编码的C3TR模块,以更好地提取丰富的全局信息和融合不同尺度的特征;最后在YOLOv5s的特征融合网络中嵌入SE(Squeeze-and-excitation)注意力机制,以更好地关注主要信息,从而提高模型精度。自建数据集并进行实验,实验结果表明,相比于原YOLOv5s,改进算法的全类平均精度值(mAP)高出1.9百分点,达到了96.1%,模型大小减少了70.8%。并且在Jetson Nano硬件上部署测试所得,改进后的算法前传耗时比原YOLOv5s模型缩短了39.9%。通过对比改进前后的算法,后者能更好地实现对自动扶梯乘客异常行为的实时检测,从而可以更好地保障乘客乘梯安全。
目标检测 轻量化 YOLOv5s ShuffleNetV2 C3TR模块 注意力机制 
激光与光电子学进展
2024, 61(8): 0812004

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!