光电工程
2024, 51(1): 230304
刘光辉 1,2,*陈健 1,2孟月波 1,2徐胜军 1,3
作者单位
摘要
1 西安建筑科技大学 信息与控制工程学院,陕西西安70055
2 建筑机器人陕西省高等学校重点实验室,陕西西安710055
3 西安市建筑制造智动化技术重点实验室,陕西西安710055
针对混凝土表面裂缝分割过程中分割精度低、细微裂缝漏分和背景干扰等问题,提出一种联合线性引导和网格优化的裂缝分割模型。首先,在主干网络中引入多分支线性引导模块,通过自适应单维度池化增强网络对裂缝线性结构的表达能力,让不同区域的裂缝建立联系,增强全局上下文信息感知能力,提高网络分割精度;然后,提出网格细节优化模块,通过分区-优化-合并三步骤,将整个空间域划分为若干个空间网格,提取空间网格中的细微裂缝信息,防止细微裂缝漏分;最后,在主干网络的跳跃连接处嵌入混合注意力模块,在空间和通道双维度突出裂缝特征,减少背景干扰。在Deepcrack537,Crack500和CFD裂缝数据集上,所提模型的IoU值分别达到77.07%,58.96%和56.55%,F1-score值分别达到87.05%,74.19%和72.24%,明显优于大多数现有方法,具有更高的分割精度。
裂缝图像 线性引导 语义分割 网格优化 注意力机制 crack image linear guide semantic segmentation mesh optimization attention mechanism 
光学 精密工程
2024, 32(2): 286
作者单位
摘要
烟台大学计算机与控制工程学院,山东 烟台 264000
现在大多数基于图卷积的点云语义分割方法忽略了边构建的重要性,不能充分地表示局部区域的特征。基于此,提出一种结合注意力机制的边增强的图卷积网络(AE-GCN)。首先,将邻居点特征加入边中,而不仅仅是中心点与邻居点的特征差异;其次,加入注意力机制保证点云的局部信息得到更充分的利用;最后,采用U-Shape的分割结构,确保网络更好适应点云的语义分割这一任务。在两个公开数据集Toronto_3D和S3DIS上的实验结果表明,与目前的大多数方法相比,AE-GCN取得了具有竞争力的结果:在Toronto_3D数据集的平均交并比为80.3%,总体准确度为97.1%;在S3DIS数据集的平均交并比为68.0%,总体准确度为87.2%。
三维图像处理 点云语义分割 注意力机制 边增强 图卷积 
激光与光电子学进展
2024, 61(8): 0837009
光电工程
2024, 50(12): 230242
作者单位
摘要
长安大学工程机械学院,陕西 西安 710000
裂缝是路面最主要的病害之一,及时、有效地检测和评估裂缝对路面养护至关重要。为实现路面裂缝图像快速、准确的语义分割,提出一种基于DeepLabv3+模型的路面裂缝检测方法。为减小模型参数量、提高推理速度,采用MobileNetv3作为模型的主干特征提取网络,且在空洞空间金字塔池化模块中使用Ghost卷积代替普通卷积,使模型更加轻量化。为避免替换主干网络降低模型精度:首先,在空洞空间金字塔池化模块中使用条形池化模块代替全局平均池化,有效捕获裂缝结构的上下文信息,避免无关区域噪声的干扰;其次,引入轻量级通道注意力机制efficient channel attention(ECA)模块,增强特征的表达能力,并设计浅层特征融合结构丰富图像的细节信息,优化模型对裂缝的识别效果;最后,构造混合损失函数解决裂缝数据集类别不平衡而导致检测精度较低的问题,利用迁移学习的训练方式提高模型的泛化能力。实验结果表明:所提路面裂缝检测模型参数仅为14.53 MB,比原模型参数量减少93.04%,平均帧率达到47.18,满足实时检测的要求;在精度方面,该模型裂缝检测结果的交并比和F1值分别为57.21%和72.76%,优于经典的DeepLabv3+、PSPNet、U-Net模型和先进的FPBHN、ACNet等模型。所提方法可大幅减小模型参数量,在保证路面裂缝检测精度的同时满足实时性,为基于语义分割的路面裂缝在线检测奠定基础。
图像处理 路面裂缝检测 语义分割 DeepLabv3+ 轻量化 检测精度 
激光与光电子学进展
2024, 61(8): 0812001
鲁斌 1,2刘亚伟 1,2,*张宇航 1,2杨振宇 1,2
作者单位
摘要
1 华北电力大学计算机系,河北 保定 071003
2 河北省能源电力知识计算重点实验室,河北 保定 071003
针对现有三维点云语义分割算法对点间密度信息以及空间位置特征利用不充分的问题,提出一种基于密度感知和自注意力机制的三维点云语义分割算法。首先,基于自适应K近邻(KNN)算法和局部密度位置编码构建密度感知卷积模块,从而有效地提取点间关键密度信息,加强初始输入特征的信息表达深度,提升算法捕获局部特征的能力。然后,构建空间特征自注意力模块,基于自注意力和空间注意力机制强化全局上下文信息和空间位置信息的关联性,对全局特征和局部特征进行有效聚合,从而提取更深层次的上下文特征,有效提升算法的分割性能。最后,在公开的S3DIS数据集和ScanNet数据集上进行了大量实验。实验结果表明,算法的平均交并比分别达到了69.11%和72.52%,与其他算法相比有明显提升,验证了所提算法有着良好的分割性能和泛化性能。
三维点云 语义分割 密度信息 注意力机制 密度位置编码 
激光与光电子学进展
2024, 61(8): 0811004
作者单位
摘要
1 新疆大学智能制造现代产业学院,新疆 乌鲁木齐 830017
2 新疆大学交通运输工程学院,新疆 乌鲁木齐 830017
针对现有语义分割方法检测高速公路护栏时存在预测速度慢、分割精度低的问题,提出一种基于改进DeepLabV3+的无人机高速公路护栏检测方法。首先,采用MobileNetv2网络替换原模型的主干并输出中层特征,减少参数量的同时恢复降采样过程中丢失的空间信息;然后,采用密集连接扩张卷积改进空洞空间金字塔池化,以减少漏分割现象;最后,在编码器部分引入空间分组增强(SGE)注意力机制,减少错分割现象。实验结果表明,改进后模型平均交并比、平均像素准确率、画面每秒传输帧数达到了79.20%、87.89%、52.59,相比基础模型,分别提高了2.59%、2.93%、56.70%,参数量降低了78.85%,能够在保障模型预测速度的同时提高对护栏的分割精度。
图像处理 语义分割 无人机 DeepLabV3+ 注意力机制 
激光与光电子学进展
2024, 61(4): 0412004
作者单位
摘要
山东科技大学测绘与空间信息学院,山东 青岛 266590
云的存在影响卫星数据的使用,因此准确高效的云检测在遥感图像目标识别和参数定量反演中具有重要作用。针对亮地表、薄碎云及云边界等难以识别、不同尺度特征的云检测精度不稳定等问题,对短期时序数据进行线性回归计算,将前后时序数据的表观反射率斜率变化趋势作为输入特征。为充分挖掘不同尺度的信息,采用具有密集跳跃结构和深监督结构的UNet++模型进行云检测研究。与单时相数据集的U-Net、SegNet和UNet++相比,所提方法可以更有效地突出多尺度特征,增加对亮地表、云边缘和薄云信息的敏感度。结果表明,所提方法在云检测方面得到较高的精度,总体精度达98.21%,误检率降低至1.07%,漏检率降低至3.12%。所提方法能有效降低裸地、道路、建筑物、冰雪等亮地表对云识别的干扰,提升了对薄云的识别精度,且适用于不同下垫面的遥感影像。
云检测;深度学习;时序数据;线性回归分析;语义分割 
激光与光电子学进展
2024, 61(4): 0428013
作者单位
摘要
1 重庆邮电大学计算机科学与技术学院重庆空间大数据智能技术工程研究中心,重庆 400065
2 昆明理工大学信息工程与自动化学院,云南 昆明 650500
高分辨率无人机遥感图像具有极为丰富的语义和地物特征,在语义分割中容易出现目标分割不全、边缘信息缺失、分割精度不足等问题。为了解决上述问题,基于DeepLabV3_plus模型提出改进的DeepLabV3_DHC。首先,利用多种主干网络进行下采样,采集图像的低级特征和高级特征。其次,将原模型的atrous spatial pyramid pooling(ASPP)全部替换成深度可分离混合空洞卷积,同时添加自适应系数,减弱网格效应。之后,抛弃传统上采样的双线性插值法,替换为可学习的密集上采样卷积。最后,在低级特征中串联注意机制。选用多种主干网络进行实验,数据集选用四川省隆昌市地区的部分图像,采用平均交并比和类别平均像素准确率作为评价指标。实验结果表明:所提方法不仅具有较高的分割精度,而且减少了计算量和参数量。
城市无人机遥感图像 语义分割 深度可分离混合空洞卷积 密集上采样 注意力机制 网格效应 
激光与光电子学进展
2024, 61(4): 0428005
Author Affiliations
Abstract
1 School of Instrumentation Science and Engineering, Harbin Institute of Technology, Harbin, China
2 Research Center of Laser Fusion, China Academy of Engineering Physics, Mianyang, China
Segmenting dark-field images of laser-induced damage on large-aperture optics in high-power laser facilities is challenged by complicated damage morphology, uneven illumination and stray light interference. Fully supervised semantic segmentation algorithms have achieved state-of-the-art performance but rely on a large number of pixel-level labels, which are time-consuming and labor-consuming to produce. LayerCAM, an advanced weakly supervised semantic segmentation algorithm, can generate pixel-accurate results using only image-level labels, but its scattered and partially underactivated class activation regions degrade segmentation performance. In this paper, we propose a weakly supervised semantic segmentation method, continuous gradient class activation mapping (CAM) and its nonlinear multiscale fusion (continuous gradient fusion CAM). The method redesigns backpropagating gradients and nonlinearly activates multiscale fused heatmaps to generate more fine-grained class activation maps with an appropriate activation degree for different damage site sizes. Experiments on our dataset show that the proposed method can achieve segmentation performance comparable to that of fully supervised algorithms.
class activation maps laser-induced damage semantic segmentation weakly supervised learning 
High Power Laser Science and Engineering
2024, 12(1): 010000e4

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!