相同关键词【multi-scale】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 河北工业大学人工智能与数据科学学院，天津30030

² 河北省控制工程技术研究中心，天津300130

针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取，导致特征提取不充分的问题，提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息，设计了多尺度特征融合块，其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先，自适应双尺度块自主融合两个尺度的特征，获得了更丰富的上下文特征；其次，多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征，提高了上下文特征之间的关联性；最后，自适应双维度注意力自主选择不同维度注意力细化输出特征后，提高了输出特征的鉴别力。实验结果表明，在Set5， Set14， BSD100和Urban100测试集上，本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升，尤其对于纹理细节难以恢复的Urban100测试集，本文方法在比例因子为×4时，相较于现有最优方法SwinIR，PSNR和SSIM指标分别提升了0.05 dB和0.004 5；在视觉效果方面，本文的重建图像具有更多的纹理细节。

超分辨率多尺度特征注意力机制自适应权重渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction

PDF全文 Full Text

光学精密工程

2024, 32(6): 843

信息科学

位置敏感Transformer航拍图像目标检测模型

李大湘辛嘉妮 ^*刘颖

作者单位

摘要

西安邮电大学通信与信息工程学院，陕西西安710121

针对无人机视角下航拍图像小目标多且检测困难的问题，提出了一个位置敏感Transformer目标检测（PS-TOD）模型。设计了一个基于位置通道嵌入三维注意力（PCE3DA）的多尺度特征融合（MSFF）模块，即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力，用于加强模型对兴趣区域的特征表达能力，且基于它构造了一个自底向上的跨层MSFF方案，使得融合后的特征语义信息更加丰富；然后，设计了一种新的位置敏感自注意力（PSSA）机制，且以此构造位置敏感Transformer编-解码器，使模型在捕获图像全局上下文信息的长期依赖关系时，也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明，提出模型的AP达到28.8%，与基线模型（DETR）相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测，且改善小目标的检测效果。

目标检测无人机图像位置敏感Transformer 多尺度特征融合注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism

PDF全文 Full Text

光学精密工程

2024, 32(5): 727

数字图像处理

基于梯度域引导滤波和显著性分析的红外与可见光图像融合

司婷波 ^1,2贾方秀 ^1,2,*吕自强 ^1,2王子康 ^1,2

作者单位

摘要

¹ 南京理工大学机械工程学院，江苏南京 210094

² 南京理工大学智能弹药国防重点实验室，江苏南京 210094

针对传统多尺度融合方法不能突出目标信息、融合图像缺失细节与纹理的问题，提出一种基于梯度域引导滤波和显著性检测的红外与可见光图像融合方法。该方法利用梯度域引导滤波将输入图像分解为基础层和细节层，同时利用加权的全局对比度方法将基础层分解为特征层以及差异层。在融合过程中，分别采用相位一致性组合加权局部能量、局部熵结合加权最小二乘优化、平均规则来融合特征层、差异层、细节层。实验结果表明，所提融合方法的多项指标相对于其他方法提升较多，且图像视觉效果更好，在突出目标信息、保留轮廓细节、提高对比度和清晰度方面十分有效。

图像融合引导滤波显著性分析多尺度分解

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0837010

基于双分支多尺度融合网络的毫米波SAR图像多目标语义分割方法

丁俊华 ^1,2袁明辉 ^1,2,*

作者单位

摘要

¹ 上海理工大学太赫兹技术创新研究院，上海 200093

² 上海理工大学光电信息与计算机工程学院，上海 200093

毫米波合成孔径雷达违禁品检测深度学习语义分割双分支多尺度融合网络 millimetre-wave synthetic aperture radar contraband detection deep learning semantic segmentation dual-branch multi-scale fusion network

PDF全文 Full Text

光电工程

2024, 50(12): 230242

数字图像处理

基于多尺度注意力和对比学习的水下图像增强

王悦 ^1,2,3范慧杰 ^1,2,*刘世本 ^1,2,3唐延东 ^1,2

作者单位

摘要

¹ 中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016

² 中国科学院机器人与智能制造创新研究院，辽宁沈阳 110016

³ 中国科学院大学，北京 100049

由于水体对光的吸收和散射作用，水下图像普遍存在颜色失真和细节模糊这两种退化问题。为了得到色彩鲜明、细节清晰的水下图像，提出了一个基于多尺度注意力和对比学习的水下图像增强算法模型。该模型采用编码-解码结构作为基础框架，为了提取到更细粒度的特征，在编码部分设计了一个多尺度通道像素注意力模块，利用3个并行支路提取图像中不同层次的特征，然后将3条支路提取的特征进行融合输入到下一层编码器以及对应的解码层，提高网络特征提取以及细节增强的能力。最后，为了进一步提高增强图像的质量，引入对比学习训练网络。大量实验证明，本文算法增强后的图像色彩鲜明且细节信息保留较好。峰值信噪比和结构相似性指标的平均值最高可达到25.46和0.8946，与其他方法相比至少提高了4.4%和2.8%；水下彩色图像质量指标和信息熵的平均值最高为0.5802和7.6668，与其他方法相比均至少提高了2%；特征点匹配平均比原始图像多24个。

图像增强注意力多尺度对比学习

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0437008

遥感与传感器

结合上下文信息与多层特征融合的遥感道路提取

陈果 ^1,2胡立坤 ^1,2,*

作者单位

摘要

¹ 广西大学电气工程学院，广西南宁 530004

² 广西大学先进测控与智能电力研究中心，广西南宁 530004

现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案，但由于其缺乏对全局信息的关注，模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度，提出一种结合上下文信息与多层特征融合的context＆multilayer features-UNet（CMF-UNet），该模型利用金字塔特征聚合模块融合多层特征，并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证，结果表明，所提方法能够有效提升道路分割精度，相较于原U-Net，CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点，在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。

图像处理 U-Net模型多尺度上下文注意力机制条带池化

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0428007

遥感与传感器

基于多模块的遥感影像建筑物提取方法

明兴涛杨德宏 ^*

作者单位

摘要

昆明理工大学国土资源工程学院，云南昆明 650093

高分辨率遥感影像建筑物提取是遥感影像解译的一个重要研究方向。针对传统提取方法中小型建筑物容易丢失和大型建筑物边界模糊问题，以Unet为基础，提出一种基于多模块建筑物提取网络（MM-Unet）。首先在网络的编码和解码部分引入多尺度特征组合模块（MFCM）以获取并补充更多的空间信息。之后在解码器末端加入多尺度特征增强模块（MFEF）以增强多尺度特征的提取。在跳跃连接完成后引入双重注意力模块（DAM），使网络能够自适应地学习通道和空间位置的特征重要性，减小不同深度特征的差异。为了验证所提网络的有效性，分别在空间分辨率为1 m、0.3 m、0.09 m的Massachusetts、WHU以及Vaihingen建筑物数据集上进行实验，MM-Unet的交并比分别达到73.42%、90.11%和85.21%，相比于Unet分别提高2.21个百分点、1.25个百分点和1.55个百分点。结果表明，MM-Unet对于不同尺度的建筑物表现出较高的提取精度和较强的泛化能力。

遥感影像建筑物提取多尺度注意力机制特征组合

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0428004

大气光学与海洋光学

并行多尺度注意力映射图像去雾算法

袁姮颜廷昊 ^*

作者单位

摘要

辽宁工程技术大学软件学院，辽宁葫芦岛 125105

针对当前去雾算法中容易产生的图像伪影、图像颜色失真、图像细节模糊不清等问题，提出一种并行多尺度注意力映射图像去雾算法，通过端到端方式以编码器解码器结构实现图像去雾。在编码阶段，采用连续下采样层降低特征维度，避免过拟合。在特征转换阶段，采用并行分支结构设计并行多尺度注意力映射模块，使模型能够在关注图像重要特征的同时充分利用多尺度特征，并通过并行连接选择性特征融合模块有效收集图像空间结构信息。解码阶段，采用上采样层重构图像，并通过上下采样层融合更好地保留图像边缘信息。实验结果表明，该算法在合成雾天数据集以及真实雾天图像上均具有较好的去雾效果，相较于传统去雾算法，可更好地保留图像细节，具备较好的色彩保持度。

图像去雾卷积神经网络并行分支结构多尺度映射注意力机制

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0401002

成像系统

基于DETR和改进去噪训练的光学遥感图像多尺度旋转目标检测（特邀）创刊六十周年特邀

金睿蛟 ^1,2†王堃 ^1,2†刘敏豪 ^1,2腾锡超 ^1,2[ ... ]于起峰 ^1,2

作者单位

摘要

¹ 国防科技大学空天科学学院，湖南长沙 410000

² 图像测量与视觉导航湖南省重点实验室，湖南长沙 410000

旋转目标检测是遥感图像解译的重要任务之一，存在目标方向任意、小目标密集排列、目标表示引起的角度周期性等典型问题。针对上述问题，提出一种基于DEtection Transformer（DETR）目标检测器和改进去噪训练的旋转目标检测方法，即arbitrary-oriented object detection Transformer with improved deNoising anchor boxes（AO²DINO）。首先，该方法引入一种多尺度旋转可变形注意力模块，将角度信息以旋转矩阵的形式引入注意力权重的计算，提高了模型对旋转目标的适应能力。其次，针对小目标密集排列问题，提出一种自适应的样本分配器，引入旋转交并比和自适应阈值，实现对密集目标更加精确的采样，提升了模型对小目标的检测能力。最后，在模型中引入基于卡尔曼滤波的交并比（KFIoU）作为回归损失，以解决旋转目标表示引起的角度周期性问题。AO²DINO在DOTAv1.0和DIOR-R两个公开数据集上与典型的旋转目标检测方法进行了比较，在DETR系列旋转目标检测方法中检测精度最高，且训练时收敛速度更快，在训练12个epochs时就几乎达到了其他旋转目标检测方法训练36个epochs时的检测效果。

旋转目标检测 DETR目标检测器多尺度旋转可变形注意力

PDF全文 Full Text

激光与光电子学进展

2024, 61(2): 0211023

信息科学

基于特征融合的改进型PointPillar点云目标检测

张勇石志广 ^*沈奇张焱张宇

作者单位

摘要

国防科技大学电子科学学院 ATR重点实验室，湖南长沙410073

针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题，通过引入一种多尺度特征融合策略和注意力机制，提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题，设计了一种基于残差结构的主干网络；针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题，设计了一种简单有效的多尺度特征融合策略；针对主干网络提取的特征图中信息冗余的问题，提出了一种卷积注意力机制。为验证所提算法的性能，在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明，所提出的算法在KITTI数据集上与PointPillar相比，汽车、行人和骑行者的平均精度最大提高分别为0.84%，2.13%和4.02%；在DAIR-V2X-I数据集上与PointPillar相比，汽车、行人和骑行者的平均精度最大提高分别为0.33%，2.09%和4.71%，由此证明了所提方法对点云稀疏小目标检测的有效性。

小目标检测点云稀疏 PointPillar 残差结构多尺度特征融合卷积注意力 small object detection point cloud sparse PointPillar residual structure multi-scale feature fusion convolutional attention

PDF全文 Full Text

光学精密工程

2023, 31(19): 2910

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索