南京林业大学土木工程学院,江苏 南京 210037
针对PointNet++在特征提取阶段未能深层挖掘Lidar点云的语义特征及其在特征聚合阶段采用最大池化聚合导致特征丢失,进而导致点云分割精度下降的问题,通过改进PointNet++的特征提取及特征聚合模块,提出一种基于特征偏差值和注意力机制的点云分割模型。首先,利用球形采样获取不同的局部邻域,并采用K最近邻(KNN)算法筛选邻域点,计算不同邻域的特征偏差值,获取点云的深层语义信息,增强模型对不同局部邻域的识别能力;其次,利用基于注意力机制的特征聚合模块代替PointNet++中的最大池化模块,在聚合特征阶段学习不同特征的权重,从而提高模型对不同结构信息的筛选能力,增强模型的分割性能;最后,为了进一步优化模型架构,在全连接层中加入残差模块,共享权重,避免参数冗余,提升模型性能。基于ISPRS提供的Vaihingen数据集与斯坦福的S3DIS数据集进行实验验证,实验结果表明,所提模型总体精度达到86.69%,较PointNet++提高了5.49个百分点,同时平均F1得分达到了73.97%,较PointNet++提高了8.30个百分点。在S3DIS数据集上的实验结果表明,与PointNet++、RandLA-Net和ConvPoint等主流模型相比,所提模型结果较PointNet++也有提升,即相较于PointNet++的分割结果,改进后的模型能够充分提取点云的语义特征,有效提高模型分割精度。
点云分割 PointNet++ Lidar 特征偏差值 注意力机制 特征融合 残差结构 激光与光电子学进展
2024, 61(4): 0411001
光学 精密工程
2023, 31(19): 2910
湖南科技大学计算机科学与工程学院,湖南 湘潭 411201
手术与化疗作为肝癌的主要治疗手段需要精确提取肝脏病变区域。针对目前肝肿瘤分割方法存在的小型肿瘤丢失、肿瘤边界分割模糊、分割严重错误等问题,提出一种融合注意力机制与残差可形变卷积的肝肿瘤分割方法。以U-Net为主干网络,在编码卷积层末尾增加一条带有反卷积与激活函数的残差路径,该路径与上层跳跃连接相连,解决池化与反卷积操作中的信息损失造成的小目标分割缺失与边界模糊问题;利用可形变卷积增强模型对肿瘤边界的特征提取能力;在跳跃连接层中添加一定数量的卷积层,弥补简单跳跃连接在特征融合时造成的语义空白;通过双注意力机制,模型更加关注肿瘤特征;采用混合损失函数,该函数在保证训练稳定的情况下解决类不平衡造成的分割性能下降的问题。在肝脏肿瘤公开数据集(LITS)上进行实验,所提方法的肿瘤分割Dice系数达85.2%,分割性能优于其他对比网络,能够达到辅助医疗诊断的要求。
肝癌 肿瘤分割 U-Net 残差结构 注意力 激光与光电子学进展
2023, 60(12): 1210001
天津大学电气自动化与信息工程学院,天津 300072
交通标志检测是自动驾驶系统的一项重要功能,当前先进的交通标志检测器大多采用Anchor-Based网络模型,根据锚框遍历所有潜在的目标位置。为了减少锚框带来的计算开销和过多的超参数设置,提出了一种基于编码-解码结构的Anchor-Free交通标志检测算法。为了增加解码模块的特征表征能力,在解码模块中引入残差增强分支。为了高效地提取和利用多尺度特征,设计了特征融合子网络,提升对多尺度目标的检测能力,并使用Ghost轻量化模块提取多尺度特征图,不显著引进运算量。在Tsinghua-Tencent 100K数据集上进行验证,所提算法实现了92.5%的召回率和90.3%的准确率,模型的参数量和模型大小分别为1.61×107和64.4 Mbit。实验结果表明,与主流目标检测算法相比,所提算法的检测精度较高,计算开销较低,在综合性能上具有优越性。
机器视觉 交通标志检测 Anchor-Free 残差结构 多尺度特征融合 激光与光电子学进展
2022, 59(24): 2415002
针对高光谱图像分类过程中存在的标记样本需求量大和分类精度要求高等问题,提出了一种利用残差生成对抗网络(GAN)的高光谱图像分类方法。该方法以生成对抗网络为基础,使用包含上采样层和卷积层构成的8层残差网络替换生成器的反卷积层网络结构,提高数据的生成能力,使用34层残差卷积网络替换判别器的卷积层网络结构,提高特征提取能力。以Pavia University、Salinas及Indian Pines数据集为实验数据,将所提方法与GAN、CAE-SVM、2DCNN、3DCNN、ResNet进行了比较。实验结果表明,所提方法在总体分类精度、平均分类精度和Kappa系数上均有显著提高,其中总体分类精度在Indian Pines数据集上达到了98.84%,较对比方法分别提高了2.99个百分点、22.03个百分点、12.91个百分点、4.99个百分点、1.79个百分点。所提方法在网络中加入残差结构,增强了浅层网络与深层网络的信息交流,可提取高光谱图像的深层次特征,提高了高光谱图像分类的精度。
图像处理 高光谱图像 分类 深度学习 生成对抗网络 残差结构 激光与光电子学进展
2022, 59(22): 2210008
1 贵州大学大数据与信息工程学院半导体功率器件可靠性教育部工程研究中心,贵州 贵阳 550025
2 中国科学院苏州纳米技术与纳米仿生研究所,江苏 苏州 215123
为充分提取高光谱图像(HSI)的光谱空间信息特征,实现HSI的高精度地物分类,提出端到端的多尺度特征融合残差(MFFI)模块。该模块结合了3D多尺度卷积、特征融合以及残差连接3种手段,实现了HSI多尺度光谱空间特征的联合提取。因模块具有端到端特性,可通过堆叠多个MFFI模块得到具有提取深层特征能力的MFFI网络。该网络在Salinas、Indian Pines和University of Pavia 3个HSI数据集的平均总体准确率为99.73%,平均准确率为99.84%,平均卡帕系数为0.9971。结果表明:MFFI模块可以有效提取不同类型地物数据集的光谱空间特征,并取得良好的分类结果。
高光谱图像分类 残差结构 多尺度特征融合 光谱空间特征提取 卷积神经网络 激光与光电子学进展
2022, 59(18): 1810014
1 成都理工大学地球科学学院,四川 成都 610059
2 成都理工大学地质灾害防治与地质环境保护国家重点实验室,四川 成都 610059
近年来,以卷积神经网络为代表的深度学习方法因不用进行复杂的数据预处理和特征设计逐渐成为高光谱图像分类领域的研究热点。在现有的神经网络模型基础上,结合高光谱图像数据特点,提出了一种注意力卷积神经网络模型。该模型通过残差结构构建深度卷积神经网络提取空谱特征,引入通道注意力机制对提取的特征进行重标定。根据特征重要性的不同,注意力机制对不同通道上的特征赋予不同的权重,突出重要特征,抑制次要特征,从而提高分类的精度。在两个公开的高光谱数据集Indian Pines和Pavia University上进行了实验。当数据集的空间邻域大小设置为19×19,Indian Pines以3∶1∶6的比例划分样本,Pavia University以1∶1∶8的比例划分样本时,数据集的分类精度最优,平均总体分类精度为99.55%,平均分类精度为99.31%,平均Kappa系数为99.45%。实验结果表明,引入残差结构的深度卷积神经网络可以提取高光谱图像的深层空谱特征,注意力机制对特征进行重新标定,强化了重要特征,从而有效提高了高光谱图像的分类精度。
成像系统 高光谱图像 卷积神经网络 残差结构 注意力机制 激光与光电子学进展
2022, 59(18): 1811001
石家庄铁道大学信息科学与技术学院, 河北 石家庄 050043
针对目前隧道内漏缆卡具检测数据量大、人工检测效率低的问题,提出了一种基于改进single shot MultiBox detector(SSD)算法的隧道漏缆卡具检测算法。该算法使用不同尺度的特征图检测卡具目标,并在网络宽度和网络深度上对SSD网络结构进行改进。结合Inception结构,增加网路宽度;采用残差结构,在提高网络深度的同时优化网络深度结构;使用深度可分离卷积和1×1卷积结构,减少模型参数量,改善模型结构,从而提高模型检测效率。将改进后的模型应用于隧道漏缆卡具图像检测,实验结果表明,该算法检测的平均准确率达到了86.6%,检测速度达到了26.6 frame/s,相较于原始SSD算法和MobileNet SSD算法,具有明显优势。
机器视觉 图像处理 卡具检测 SSD 残差结构 深度可分离卷积 激光与光电子学进展
2021, 58(22): 2215005