1 南京信息工程大学电子与信息工程学院,江苏 南京 210044
2 南京信息工程大学江苏省大气环境与装备技术协同创新中心,江苏 南京 210044
针对遥感图像目标检测算法漏检和误检率高、目标定位不精确、无法准确识别目标类别等问题,提出一种基于改进YOLOv8的目标检测算法。为提高模型的损失函数对梯度分配的灵活性,适应各种形状和尺寸的物体,设计了非单调聚焦机制与边界框几何因素相结合的边界框回归损失函数;为扩大模型的感受野并削弱遥感图像背景对检测目标的影响,采用全局注意力机制与残差块结合的方式,设计了残差全局注意力机制;为使模型适应遥感图像中目标物体的形变与不规则排列,对YOLOv8模型中的C2f模块进行改进,融入可变形卷积与可变形感兴趣区域池化层。实验结果表明,在DOTA数据集和RSOD数据集上,所提算法的平均精度均值(mAP@0.5)达到72.1%和94.6%,优于对比算法,提高了遥感图像目标检测精度,为遥感图像识别提供了新的手段。
目标检测 YOLOv8 WIoU 全局注意力机制 可变形卷积 激光与光电子学进展
2024, 61(10): 1028001
1 西安理工大学印刷包装与数字媒体学院,陕西 西安 710054
2 渭南日报社印刷厂,陕西 渭南 714099
针对印刷生产中传统人工缺陷检测耗时耗力、小缺陷区域不易检测,以及传统图像处理方法鲁棒性差等问题,提出一种基于改进YOLOv5l模型的印刷品缺陷检测算法。首先,通过增加浅层特征图拓展检测尺度,以捕获微小缺陷信息,从而提高网络对小目标的检测能力;然后,使用全维度动态卷积替换Neck区中的普通卷积,以增强网络对印刷缺陷上下文信息的捕获能力;最后,为解决前两项工作带来的检测速度下降的问题,采用C3Ghost替换Neck中的C3模块,在检测精度损耗极低的情况下尽可能地提高检测速度。实验结果表明:改进后的YOLOv5l算法的平均精度均值(mAP)达到97.3%,较原YOLOv5l算法和现有的印刷品缺陷检测算法Siamese-YOLOv4的精度分别提高2.9百分点和2.7百分点;检测速度为44.1 frame/s。所提算法对印刷品缺陷的分类和定位效果优于原YOLOv5l和Siamese-YOLOv4算法,具有较高的检测精度和检测速度,可以应用于印刷质检来提高生产质量管控水平、降低人工成本。
机器视觉 缺陷检测 YOLOv5算法 多尺度融合 动态卷积 激光与光电子学进展
2024, 61(10): 1012002
1 西安建筑科技大学 信息与控制工程学院,陕西 西安 710055
2 陕西省文物保护研究院,陕西 西安 710075
3 陕西省考古研究院,陕西 西安 710054
使用现有边缘检测方法提取古代壁画的线稿,存在噪声干扰大且丢失信息较多的问题。本文提出一种融合像素差卷积的壁画最优波段线稿提取方法,利用最小噪声分离方法将壁画多光谱数据的有效信息和噪声分离,选择最优主成分波段进行线稿的提取。针对传统卷积提取图像梯度信息的问题,引入像素差卷积提高边缘检测的图像梯度信息。在侧输出网络加入尺度增强模块(SEM)丰富多尺度特征,同时针对像素级别不平衡引起的像素错误分类问题,设计了基于图像相似度的Dice损失函数策略,逐级最小化像素距离获得清晰图像边缘,并利用壁画数据集先验知识微调模型解决数据集不足的问题。实验结果表明,本文方法可以在壁画褪色和噪声较多的场景下提取出较为清晰的线稿,线稿图像的SSIM和RMSE均优于其他算法,分别提高了2%~10%和2%~4%;在公开数据集BIPED上对模型进行验证,所提方法的ODS和OIS较PiDiNet分别提高0.005和0.007。该方法对褪色及具有病害的壁画可以提取出清晰完整的线稿图像。
线稿提取 光谱成像 像素差卷积 像素级平衡 壁画 sketch extraction spectral imaging pixel difference convolution pixel-level balancing mural
精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力 (Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。
高分辨率遥感影像 双注意力机制 空洞卷积 建筑物提取 high-resolution remote sensing images dual attention mechanism atrous convolution building extraction
强激光与粒子束
2024, 36(4): 043016
长春理工大学电子信息工程学院,吉林 长春 130012
针对彩色图像引导的深度图像超分辨率重建算法中存在的纹理转移和深度流失的问题,提出一种基于双特征融合引导的深度图像超分辨率重建网络(DF-Net)。为了充分利用深度和强度特征的关联性,在网络模型的深度恢复重建部分采用双通道融合模块(DCM)和双特征引导重建模块(DGM)。利用输入金字塔结构提取深度信息和强度信息的多尺度特征:DCM基于通道注意力机制对深度特征和强度特征进行通道间的特征融合与增强;DGM将深度、强度特征自适应选择融合后实现重建的双特征引导,增加了深度特征的引导作用,改善了纹理转移和深度流失的问题。实验结果表明,所提方法的峰值信噪比(PSNR)和均方根误差(RMSE)优于RMRF、JBU和Depth-Net等方法,尤其4×超分辨率重建结果的PSNR值比其他方法平均提升6.79 dB,RMSE平均下降0.94,取得了较好的深度图像超分辨率重建效果。
图像处理 图像超分辨率重建 卷积神经网络 深度图像 特征融合 通道注意力 激光与光电子学进展
2024, 61(8): 0837007