作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
1 南京理工大学机械工程学院,江苏 南京 210094
2 南京理工大学智能弹药国防重点实验室,江苏 南京 210094
针对传统多尺度融合方法不能突出目标信息、融合图像缺失细节与纹理的问题,提出一种基于梯度域引导滤波和显著性检测的红外与可见光图像融合方法。该方法利用梯度域引导滤波将输入图像分解为基础层和细节层,同时利用加权的全局对比度方法将基础层分解为特征层以及差异层。在融合过程中,分别采用相位一致性组合加权局部能量、局部熵结合加权最小二乘优化、平均规则来融合特征层、差异层、细节层。实验结果表明,所提融合方法的多项指标相对于其他方法提升较多,且图像视觉效果更好,在突出目标信息、保留轮廓细节、提高对比度和清晰度方面十分有效。
图像融合 引导滤波 显著性分析 多尺度分解 
激光与光电子学进展
2024, 61(8): 0837010
光电工程
2024, 50(12): 230242
王悦 1,2,3范慧杰 1,2,*刘世本 1,2,3唐延东 1,2
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016
2 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016
3 中国科学院大学,北京 100049
由于水体对光的吸收和散射作用,水下图像普遍存在颜色失真和细节模糊这两种退化问题。为了得到色彩鲜明、细节清晰的水下图像,提出了一个基于多尺度注意力和对比学习的水下图像增强算法模型。该模型采用编码-解码结构作为基础框架,为了提取到更细粒度的特征,在编码部分设计了一个多尺度通道像素注意力模块,利用3个并行支路提取图像中不同层次的特征,然后将3条支路提取的特征进行融合输入到下一层编码器以及对应的解码层,提高网络特征提取以及细节增强的能力。最后,为了进一步提高增强图像的质量,引入对比学习训练网络。大量实验证明,本文算法增强后的图像色彩鲜明且细节信息保留较好。峰值信噪比和结构相似性指标的平均值最高可达到25.46和0.8946,与其他方法相比至少提高了4.4%和2.8%;水下彩色图像质量指标和信息熵的平均值最高为0.5802和7.6668,与其他方法相比均至少提高了2%;特征点匹配平均比原始图像多24个。
图像增强 注意力 多尺度 对比学习 
激光与光电子学进展
2024, 61(4): 0437008
陈果 1,2胡立坤 1,2,*
作者单位
摘要
1 广西大学电气工程学院,广西 南宁 530004
2 广西大学先进测控与智能电力研究中心,广西 南宁 530004
现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案,但由于其缺乏对全局信息的关注,模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度,提出一种结合上下文信息与多层特征融合的context&multilayer features-UNet(CMF-UNet),该模型利用金字塔特征聚合模块融合多层特征,并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证,结果表明,所提方法能够有效提升道路分割精度,相较于原U-Net,CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点,在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。
图像处理 U-Net模型 多尺度上下文 注意力机制 条带池化 
激光与光电子学进展
2024, 61(4): 0428007
作者单位
摘要
昆明理工大学国土资源工程学院,云南 昆明 650093
高分辨率遥感影像建筑物提取是遥感影像解译的一个重要研究方向。针对传统提取方法中小型建筑物容易丢失和大型建筑物边界模糊问题,以Unet为基础,提出一种基于多模块建筑物提取网络(MM-Unet)。首先在网络的编码和解码部分引入多尺度特征组合模块(MFCM)以获取并补充更多的空间信息。之后在解码器末端加入多尺度特征增强模块(MFEF)以增强多尺度特征的提取。在跳跃连接完成后引入双重注意力模块(DAM),使网络能够自适应地学习通道和空间位置的特征重要性,减小不同深度特征的差异。为了验证所提网络的有效性,分别在空间分辨率为1 m、0.3 m、0.09 m的Massachusetts、WHU以及Vaihingen建筑物数据集上进行实验,MM-Unet的交并比分别达到73.42%、90.11%和85.21%,相比于Unet分别提高2.21个百分点、1.25个百分点和1.55个百分点。结果表明,MM-Unet对于不同尺度的建筑物表现出较高的提取精度和较强的泛化能力。
遥感影像 建筑物提取 多尺度 注意力机制 特征组合 
激光与光电子学进展
2024, 61(4): 0428004
作者单位
摘要
辽宁工程技术大学软件学院,辽宁 葫芦岛 125105
针对当前去雾算法中容易产生的图像伪影、图像颜色失真、图像细节模糊不清等问题,提出一种并行多尺度注意力映射图像去雾算法,通过端到端方式以编码器解码器结构实现图像去雾。在编码阶段,采用连续下采样层降低特征维度,避免过拟合。在特征转换阶段,采用并行分支结构设计并行多尺度注意力映射模块,使模型能够在关注图像重要特征的同时充分利用多尺度特征,并通过并行连接选择性特征融合模块有效收集图像空间结构信息。解码阶段,采用上采样层重构图像,并通过上下采样层融合更好地保留图像边缘信息。实验结果表明,该算法在合成雾天数据集以及真实雾天图像上均具有较好的去雾效果,相较于传统去雾算法,可更好地保留图像细节,具备较好的色彩保持度。
图像去雾 卷积神经网络 并行分支结构 多尺度映射 注意力机制 
激光与光电子学进展
2024, 61(4): 0401002
金睿蛟 1,2†王堃 1,2†刘敏豪 1,2腾锡超 1,2[ ... ]于起峰 1,2
作者单位
摘要
1 国防科技大学空天科学学院,湖南 长沙 410000
2 图像测量与视觉导航湖南省重点实验室,湖南 长沙 410000
旋转目标检测是遥感图像解译的重要任务之一,存在目标方向任意、小目标密集排列、目标表示引起的角度周期性等典型问题。针对上述问题,提出一种基于DEtection Transformer(DETR)目标检测器和改进去噪训练的旋转目标检测方法,即arbitrary-oriented object detection Transformer with improved deNoising anchor boxes(AO2DINO)。首先,该方法引入一种多尺度旋转可变形注意力模块,将角度信息以旋转矩阵的形式引入注意力权重的计算,提高了模型对旋转目标的适应能力。其次,针对小目标密集排列问题,提出一种自适应的样本分配器,引入旋转交并比和自适应阈值,实现对密集目标更加精确的采样,提升了模型对小目标的检测能力。最后,在模型中引入基于卡尔曼滤波的交并比(KFIoU)作为回归损失,以解决旋转目标表示引起的角度周期性问题。AO2DINO在DOTAv1.0和DIOR-R两个公开数据集上与典型的旋转目标检测方法进行了比较,在DETR系列旋转目标检测方法中检测精度最高,且训练时收敛速度更快,在训练12个epochs时就几乎达到了其他旋转目标检测方法训练36个epochs时的检测效果。
旋转目标检测 DETR目标检测器 多尺度旋转可变形注意力 
激光与光电子学进展
2024, 61(2): 0211023
作者单位
摘要
国防科技大学 电子科学学院 ATR重点实验室,湖南长沙410073
针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题,通过引入一种多尺度特征融合策略和注意力机制,提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题,设计了一种基于残差结构的主干网络;针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题,设计了一种简单有效的多尺度特征融合策略;针对主干网络提取的特征图中信息冗余的问题,提出了一种卷积注意力机制。为验证所提算法的性能,在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明,所提出的算法在KITTI数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.84%,2.13%和4.02%;在DAIR-V2X-I数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.33%,2.09%和4.71%,由此证明了所提方法对点云稀疏小目标检测的有效性。
小目标检测 点云稀疏 PointPillar 残差结构 多尺度特征融合 卷积注意力 small object detection point cloud sparse PointPillar residual structure multi-scale feature fusion convolutional attention 
光学 精密工程
2023, 31(19): 2910

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!