东北石油大学计算机与信息技术学院,黑龙江 大庆 163318
针对目前基于点云的三维目标检测算法中小目标检测效果差的问题,提出了基于改进PointPillars模型的三维目标检测方法。首先,改进了PointPillars模型中的pillar特征网络,提出了一个新的pillar编码模块,在编码网络中引入了平均池化和注意力池化,充分考虑了每个pillar模块的局部详细几何信息,提高了每个pillar模块的特征表示能力,从而提升了模型的小目标检测性能。其次,基于ConvNeXt改进了骨干网络中的二维卷积下采样模块,使模型在网络特征提取阶段能够提取丰富的上下文语义信息和全局特征,从而增强了算法的特征提取能力。在公开数据集KITTI上进行验证,实验结果表明,所提方法具有更高的检测精度,相较于原网络,改进后的算法的平均检测精度提升了3.63个百分点,证明了该方法的有效性。
三维目标检测 PointPillars 小目标检测 注意力池化 ConvNeXt 激光与光电子学进展
2024, 61(8): 0812007
1 厦门理工学院 电气工程与自动化学院,福建 厦门 361024
2 中国科学院 福建物质结构研究所,福建 福州 350108
3 中国科学院 海西研究院 泉州装备制造研究中心,福建 泉州 362000
4 厦门市高端电力装备及智能控制重点实验室,福建 厦门 361024
激光雷达数据由于其几何特性,被广泛应用于三维目标检测任务中。由于点云数据的稀疏性和不规则性,难以实现特征提取的质量和推理速度间的平衡。本文提出一种基于体柱特征编码的三维目标检测算法,以Pointpillars网络为基础,设计Teacher-Student模型框架对回归框尺度进行蒸馏,增加蒸馏损失,优化训练网络模型,提升特征提取的质量。为进一步提高模型检测效果,设计定位引导分类项,增加分类预测和回归预测之间的相关性,提高物体识别准确率。本网络所做改进没有引入额外的网络嵌入。算法在KITTI数据集上的实验结果表明,相比于基准网络,在三维模式下的平均精度值从60.65%提升到了64.69%,鸟瞰图模式下的平均精度值从67.74%提升到70.24%。模型推理速度为45 FPS,在提升检测精度的同时满足了实时性要求。
激光点云 三维目标检测 知识蒸馏 分类置信度 laser point cloud 3D object detection knowledge distillation classification confidence
民航自助行李托运系统需自动检测行李加装托盘的情况。针对已装载行李的遮挡托盘目标检测问题,提出一种基于多层骨架模型的行李托盘快速检测算法。为准确描述托盘特征,通过空托盘的三维点云模型,构建托盘的边框骨架模型与平面点线模型。在线检测时,首先,采用设计的带状特征描述和提取方法,抓取托盘边框点云,并采用提出的点线引力势能自适应迭代算法,实现平面点线模型的快速粗配准,完成托盘判别。然后,在粗配准的位姿约束下,采用基于随机采样一致性的点云迭代最近点配准,实现边框骨架模型和点云模型的精确配准,得到托盘的精确位姿。大量实际行李托盘检测的对比试验验证了算法的有效性,在托盘遮挡70%以内时,仍可保持94%的正确率,检测速度超过典型算法的6倍以上。
图像处理 三维目标检测 行李托盘 骨架模型 点云配准 激光与光电子学进展
2024, 61(4): 0437004
1 安徽工程大学电气工程学院,安徽 芜湖 241000
2 检测技术与节能装置安徽省重点实验室,安徽 芜湖 241000
3 高端装备先进感知与智能控制教育部重点实验室,安徽 芜湖 241000
针对单目3D目标检测算法中存在图像缺乏深度信息以及检测精度不佳的问题,提出一种联合实例深度的多尺度单目3D目标检测算法。首先,为了增强模型对不同尺度目标的处理能力,设计基于空洞卷积的多尺度感知模块,同时考虑到不同尺度特征图之间的不一致性,从空间和通道两个方向对包含多尺度信息的深度特征进行重新精炼。其次,为了使模型获得更好的3D感知,将实例深度信息作为辅助学习任务来增强3D目标的空间深度特征,并使用稀疏实例深度来监督该辅助任务。最后,在KITTI测试集以及评估集上对所提算法进行验证。实验结果表明,所提算法相较于基线算法在汽车类别的平均精度提升了5.27%,有效提升了单目3D目标检测算法的检测性能。
测量 单目3D目标检测 实例深度学习 多尺度 注意力机制 辅助学习 激光与光电子学进展
2023, 60(16): 1612002
1 北京理工大学光电学院,北京 100081
2 北京理工大学光电成像技术与系统教育部重点实验室,北京 100081
3 北京理工大学重庆创新中心,重庆 401135
近年来,随着深度传感器和三维激光扫描设备的普及,点云数据引起了广泛关注。相对于二维图像,点云数据不仅包含场景的深度信息,还不受光照等环境因素的影响,能够更精确地实现目标识别和三维定位。因此,基于点云的三维目标检测技术已经成为智能空间感知和场景理解的关键技术。本文首先介绍了点云数据的特点,并探讨了不同类型的点云特征提取方法;其次,详细阐述了基于体素、点、图以及体素与点混合的点云目标检测方法的原理和发展历程;然后,介绍了常见的室内外点云目标检测数据集和评价指标,并对各类点云目标检测方法在KITTI和Waymo数据集上的性能进行了详细的比较和分析;最后,对点云目标检测技术的研究进展进行了总结和展望。
点云 三维目标检测 单模态 多模态 光学学报
2023, 43(15): 1515001
上海工程技术大学电子电气工程学院,上海 201620
针对汽车自动驾驶时通过激光雷达进行三维目标检测时识别结果不准确、目标朝向检测偏差较大的问题,提出一种基于改进PointPillars的激光雷达三维目标检测方法。首先,基于Swin Transformer改进PointPillars的二维卷积降采样模块,使得网络特征提取阶段能够使用自注意力机制来丰富上下文语义并获取全局特征,增强算法的特征提取能力。其次,利用点云立柱的特性将点云的地面部分去除,降低冗余点云的影响,从而提高三维目标检测的识别精度。在公开数据集KITTI上进行的验证实验结果表明:所提方法具有更高的检测精度,相较于原PointPillars,平均检测精度提升了1.3个百分点,验证了该方法的有效性。
遥感 深度学习 三维目标检测 激光雷达 Transformer 激光与光电子学进展
2023, 60(10): 1028012
1 中国科学院 长春光学精密机械与物理研究所, 吉林 长春 130033
2 中国科学院大学, 北京 100049
3 重庆嘉陵华光光电科技有限公司, 重庆 400000
三维目标检测在实际工程应用中的难点在于深度传感器价格高、点云质量差、缺少丰富的纹理信息、三维数据训练集制作困难。对此本文提出一种基于实例分割的三维目标位置估计方法, 可以用在多种传感器中, 如相机-雷达, 双目相机等。首先在二维图像下对目标进行实例分割, 根据目标的分割掩码提取出目标的深度图像与RGB图像融合转化为粗略点云, 最终进行异常噪声点去除, 得到精细的目标点云。在KITTI数据集上进行了测试, 平均精度值(AP)可以达到50%, 表明该方法可以准确地估计到目标位置信息。本文提出的方法无需三维数据训练集, 可以快速准确地进行三维物体点云的提取, 仅使用二维检测器就可以达到三维物体检测的目的。
点云分割 三维目标检测 实例分割 异常检测 位置估计 深度学习 point cloud segmentation 3D object detection instance segmentation anomaly detection position estimation deep learning