汪菲菲 1,3赵慧洁 1,2,3李娜 1,2,3,*李思远 4蔡昱 5
作者单位
摘要
1 北京航空航天大学 仪器科学与光电工程学院 精密光机电一体化技术教育部重点实验室,北京 100191
2 北京航空航天大学 人工智能研究院,北京 100191
3 北京航空航天大学 “空天光学-微波一体化精准智能感知”工信部重点实验室,北京 100191
4 中国科学院西安光学精密机械研究所 光谱成像技术重点实验室,西安 710119
5 中国运载火箭技术研究院,北京 100076
在高光谱图像分类任务中,引入注意力改变提取到的光谱和空间特征权重,有效突出重要特征,提高分类准确率。将注意力机制、残差网络和特征提取模块集成到分类框架中,引入中心区域光谱注意力机制,在避免干扰像素对波段权重影响的同时,利用周围像素增强中心像素波段,增强光谱特征的鲁棒性进而提取有效的光谱特征。并在此基础上提出了光谱-空间注意力残差网络,该网络可以从高光谱图像中连续提取到丰富的光谱特征和空间特征,并通过残差网络连接特征提取模块,缓解了精度下降问题,保证网络良好的分类性能。在4个公开数据集上,所提出的分类算法和其他算法相比,各项指标均达到最优。
光谱-空间特征 残差网络 高光谱分类 光谱注意力机制 空间注意力机制 Spectral-spatial feature Residual network Hyperspectral image classification Spectral attention mechanism Spatial attention mechanism 
光子学报
2023, 52(12): 1210002
作者单位
摘要
1 广东工业大学 广东省焊接工程技术研究中心, 广州 510006
2 黄埔海关技术中心,东莞 523076
为了实现自动检测X射线图像中的违禁品,解决相互遮挡、目标相近和小目标违禁品检测难的问题,提出一种基于改进的你只观察一次(YOLOX)算法的X射线图像违禁品检测方法。首先在YOLOX的主干网络低层中引入使用大核注意力构建的空间注意力,提取低层特征图的远距离依赖信息和纹理信息,之后在主干网络的中层和高层增加卷积块的注意力模块以增强感兴趣区域信息并抑制无用信息; 该方法在公开的安全检查X射线数据集上进行实验,同时为改善模型的鲁棒性,在训练前70个周期使用Mosaic数据增强方法。结果表明,改进的模型较基本模型增加少量的参数和计算量,均值平均精度增加2.45%,提升到87.88%,平均推理速率为58.5 frame/s。该研究为即时自动检测X射线图像中违禁品提供了有益的参考。
X射线光学 违禁品检测 YOLOX算法 大核注意力 空间注意力 卷积块的注意力模块 X-ray optics prohibited items detection YOLOX algorithm larger kernel attention spatial attention convolutional block attention module 
激光技术
2023, 47(4): 547
作者单位
摘要
1 上海海洋大学 信息学院,上海 201306
2 国家海洋局 东海标准计量中心,上海 201306
图像几何畸变校正是许多计算机视觉应用的关键预处理步骤。当前基于深度学习的几何畸变校正方法主要解决图像的单一畸变校正问题,为此,本文提出一种改进U-Net网络的图像混合畸变校正方法。首先,提出了一种构建混合畸变的图像数据集的方法,解决了训练数据集稀缺以及畸变类型单一的问题。其次,采用U-Net网络结合空间注意力机制进行图像特征提取及畸变坐标图的重建,将图像校正问题转为畸变图像的逐像素点坐标位移变化的预测问题,并设计了结合坐标差损失和图像重采样损失的损失函数,有效提高校正的准确性。最后,通过消融实验验证了本文方法各模块的性能。与最新基于深度学习的畸变校正方法对比。实验结果表明,本文方法在定量指标和主观评价方面都有较好的表现,对畸变图像的空间坐标校正的平均绝对误差为0.251 9。本文还对GoPro相机获取的光学影像开展了校正实验,进一步验证了本文方法对畸变图像校正的有效性。
混合畸变校正 U-Net 空间注意力 坐标差损失 重采样损失 hybrid distortion correction U-Net spatial attention coordinate difference loss resampling loss 
液晶与显示
2023, 38(11): 1580
作者单位
摘要
东华理工大学 信息工程学院,江西 南昌330013
现有的超分辨率方法假设了从高分辨率图像到低分辨率图像的预定义退化过程,这对于具有复杂退化类型的真实世界图像来说很难成立。针对该问题,本文提出了基于退化感知的盲超分辨率模型。该模型用随机模糊核生成低分辨率图像,用对比学习退化表征。模型生成器由包含多个退化感知块的残差组构成。退化感知块用退化表征和图像特征做交叉注意力计算空间权重图,此外模型还收集残差组输出的层级特征,计算层间注意力来复用层级特征,使得模型更加关注高频细节,模型特征提取能力进一步提高。通过消融实验验证了各模块的有效性。在多个国际公开测试集上,放大倍数为4的平均PSNR提升1.45 dB,SSIM提升0.058。实验结果表明,该模型在盲超分辨率任务上取得了显著的性能,且具有良好的视觉效果。
超分辨率 盲超分辨率 交叉注意力 空间注意力 特征复用 super resolution blind super resolution cross attention spatial attention feature reuse 
液晶与显示
2023, 38(9): 1224
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
眼底血管图像在临床中通常被用于眼部疾病的诊断及监测,其中血管的形态结构能够反映疾病的重要特征,因此,眼底血管图像的分割处理对眼部疾病的诊断和预防具有十分重要的医学意义。针对目前人工智能主流算法中卷积和池化操作会导致很多特征丢失,提取特征时会忽视图像中的空间信息,图像中的细小血管很难分割出来等问题,基于U-net模型进行了相关研究,结合空间注意力模块对空间特征进行细化,同时提出了一种下补偿结构LC-SAnet。该结构能够减少网络提取特征信息过程中的特征损失,从而提高分割精度。研究实验在DRIVE数据集上完成,LC-SAnet的分割准确率达到96.97%,F1值达到74.36%。结果证明,LC-SAnet表现出更好的分割性能,对细小血管的结构识别更加准确。
医学图像分割 神经网络 空间注意力 下补偿结构 medical image segmentation neural network spatial attention low compensation structure 
光学仪器
2023, 45(3): 15
作者单位
摘要
上海海洋大学信息学院,上海 201306
快速而准确的水下图像超分辨率重建技术可以帮助水下航行器更好地感知水下场景,从而作出导航决策。基于此,提出一种轻量级的基于信息蒸馏机制的水下图像超分辨率重建算法(SRIDM)。该算法在普通残差网络的基础上,引入全局特征融合结构、信息蒸馏机制和空间注意力模块,进一步提高了模型的特征表达能力。通过模型消融实验,验证了每个模块的有效性并找到了最佳的模块组合和蒸馏速率。在USR-248测试集上的对比实验结果表明,通过所提算法恢复的图像不管是在主观视觉效果还是在客观评价质量上均优于其他对比算法,在放大因子为4时,其峰值信噪比和结构相似度分别达到了27.7640 dB和0.7640。另外,所提算法也是一种轻量化算法,在保持性能的同时大大降低了模型参数量和计算复杂度。
图像处理 超分辨率重建 轻量级 特征融合 信息蒸馏机制 空间注意力 
激光与光电子学进展
2023, 60(12): 1210017
作者单位
摘要
四川大学 电气工程学院, 成都 610065
提出一种基于注意力和中间融合表示的三维重建模型, 旨在重建具有精细化结构的三维模型。该方法利用轴向空间注意力机制学习不同方向的信息, 将其嵌入编码器中以捕获局部结构特征; 并基于双流网络推测深度图和三维平均形状以设计中间融合表示模块, 该模块能够有效地融合可见表面细节信息, 从而更好地描绘对象的三维空间结构。实验结果表明: 所提出的轴向空间注意力机制和中间融合表示模块增强了特征提取的能力, IoU和F-score比PixVox++分别提升了1.3%和0.4%, 三维重建效果更优。
深度学习 三维重建 轴向空间注意力 深度图 中间融合表示 deep learning 3D reconstruction axial spatial attention depth map intermediate fusion representation 
半导体光电
2023, 44(1): 122
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室,上海 201800
2 中国科学院大学,北京 100049
由于尺寸有限、外观和几何线索较少以及缺少大规模小目标数据集,从图像中检测小目标仍然是计算机视觉领域中一个具有挑战性的难题。针对这个问题,提出一种自适应特征增强的目标检测网络(YOLO-AFENet)来改善小目标的检测精度。首先,通过引入特征融合因子,设计改进的自适应双向特征融合模块,充分利用各个尺度的特征图,提高网络的特征表达能力;其次,结合网络自身的特点,提出空间注意力生成模块,通过学习图像中感兴趣区域的位置信息以提高网络的特征定位能力。在UAVDT数据集上实验结果表明:所提YOLO-AFENet的平均精度(AP)比改进前的YOLOv5提高了6.3个百分点,同时也优于其他目标检测网络。
图像处理 目标检测 小目标 多尺度特征融合 空间注意力 UAVDT 
激光与光电子学进展
2023, 60(6): 0610004
王向军 1,2李名洋 1,2王霖 1,2刘峰 1,2王玮 1,2
作者单位
摘要
1 天津大学 精密测试技术及仪器国家重点实验室,天津 300072
2 天津大学 微光机电系统技术教育部重点实验室,天津 300072
针对基于FCN和U型网络架构的深度学习显著性目标检测方法提取的显著性图存在边界不清晰和结构不完整的问题,文中提出了一种基于边缘信息引导多级尺度特征融合网络(EGMFNet)。EGMFNet使用多通道融合残差块(RCFBlock)以嵌套的U型网络架构作为主干模型。同时,在网络的较低层级引入具有边缘信息引导的全局空间注意力模块(EGSAM)以增强空间特征及边缘特征。此外,在损失函数中引入了图像边界损失,用于提升显著性图的质量并在学习过程中保留更加清晰的边界。在四个基准数据集上进行实验,实验结果表明,文中方法的F值较典型方法提升1.5%、2.7%、1.8%和1.6%,验证了EGMFNet网络模型的有效性。
显著性目标检测 多尺度特征融合 边缘信息引导 空间注意力模块 边界损失函数 salient object detection multi-scale feature-fusion edge-information guidance spatial attention module boundary loss function 
红外与激光工程
2023, 52(1): 20220344
刘昊鑫 1,2,3,4赵源萌 1,2,3,4,*张存林 1,2,3,4朱凤霞 1,2,3,4杨墨轩 1,2,3,4
作者单位
摘要
1 首都师范大学物理系,北京 100048
2 太赫兹光电子学教育部重点实验室,北京 100048
3 太赫兹波谱与成像北京市重点实验室,北京 100048
4 北京成像理论与技术高精尖创新中心,北京 100048
锥形束计算机断层扫描(CT)成像技术在口腔疾病诊断中发挥了重要作用。如何从复杂的原始扫描图像中获取牙齿的准确信息,成为口腔医学的一个重要研究问题。引入空间注意力机制,提出一种基于改进U-net网络的分割算法,结合等值面提取算法,实现对牙齿锥形束计算机断层扫描图像的准确分割和三维重建。首先对图像进行分割,得到只保留牙齿信息的图像,再对结果进行三维重建,创建出牙齿的三维模型。实验结果表明,该方法能够有效地提取牙齿信息,有助于对口腔疾病特别是牙齿疾病的诊断和治疗。
成像系统 锥形束计算机断层扫描 神经网络 三维重建 空间注意力机制 
中国激光
2022, 49(24): 2407207

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!