鲁斌 1,2刘亚伟 1,2,*张宇航 1,2杨振宇 1,2
作者单位
摘要
1 华北电力大学计算机系,河北 保定 071003
2 河北省能源电力知识计算重点实验室,河北 保定 071003
针对现有三维点云语义分割算法对点间密度信息以及空间位置特征利用不充分的问题,提出一种基于密度感知和自注意力机制的三维点云语义分割算法。首先,基于自适应K近邻(KNN)算法和局部密度位置编码构建密度感知卷积模块,从而有效地提取点间关键密度信息,加强初始输入特征的信息表达深度,提升算法捕获局部特征的能力。然后,构建空间特征自注意力模块,基于自注意力和空间注意力机制强化全局上下文信息和空间位置信息的关联性,对全局特征和局部特征进行有效聚合,从而提取更深层次的上下文特征,有效提升算法的分割性能。最后,在公开的S3DIS数据集和ScanNet数据集上进行了大量实验。实验结果表明,算法的平均交并比分别达到了69.11%和72.52%,与其他算法相比有明显提升,验证了所提算法有着良好的分割性能和泛化性能。
三维点云 语义分割 密度信息 注意力机制 密度位置编码 
激光与光电子学进展
2024, 61(8): 0811004
张赛强 1,2司绍峰 1,2鲁斌 1,2李庆 2,*[ ... ]戎安心 3
作者单位
摘要
1 中国科学院微电子研究所,北京 100029
2 中国科学院大学,北京 100049
3 湖州市特种设备检测研究院,浙江 湖州 313000
由于鱼眼图像存在几何畸变,导致现有的基于鱼眼图像的行人检测算法存在着检测准确率低以及后处理计算复杂度高的问题。针对上述问题,提出了一种使用旋转边界框的行人检测算法。首先,算法采用无锚框网络结构,使用中心热图预测边界框的中心点,在后处理筛选边界框时无需进行非极大值抑制,避免了旋转框之间交并比计算的引入;其次,设计具有角度和尺度自适应的高斯核函数,用于拟合畸变行人的中心分布,大幅减少了背景特征的干扰,并且平衡了具有不同成像大小的行人在边界框回归过程中的差异;最后,设计角度交并比损失,同时结合交并比损失以及旋转框参数的Ln范数损失,并通过指示函数改善角度正则项与交并比损失回归不一致的问题。在公开数据集上对算法进行了验证,实验结果表明,算法的平均mAP为51.33%,取得了目前最佳的检测结果,检测帧率达到49 fps,与带锚框的检测算法相比,提升了139%,综合性能优于现有的基于鱼眼图像的行人检测算法。
鱼眼图像 行人检测 无锚框 旋转高斯核 角度交并比 Fisheye images Person detection Anchor-free Rotated Gaussian kernel AIoU 
光子学报
2021, 50(10): 1010003

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!