作者单位
摘要
上海工程技术大学电子电气工程学院,上海 201620
针对汽车自动驾驶时通过激光雷达进行三维目标检测时识别结果不准确、目标朝向检测偏差较大的问题,提出一种基于改进PointPillars的激光雷达三维目标检测方法。首先,基于Swin Transformer改进PointPillars的二维卷积降采样模块,使得网络特征提取阶段能够使用自注意力机制来丰富上下文语义并获取全局特征,增强算法的特征提取能力。其次,利用点云立柱的特性将点云的地面部分去除,降低冗余点云的影响,从而提高三维目标检测的识别精度。在公开数据集KITTI上进行的验证实验结果表明:所提方法具有更高的检测精度,相较于原PointPillars,平均检测精度提升了1.3个百分点,验证了该方法的有效性。
遥感 深度学习 三维目标检测 激光雷达 Transformer 
激光与光电子学进展
2023, 60(10): 1028012
作者单位
摘要
上海工程技术大学电子电气工程学院,上海 201620
脊柱侧弯是当今社会中常见的脊柱疾病,在X光图像上快速而准确地定位脊椎骨角点并计算其Cobb角度数是医生诊断脊柱弯曲程度的金指标。针对X光骨科图片中其他器官的遮挡以及复杂背景干扰等问题,提出一种基于嵌入注意力机制和向量损失模块的神经网络模型。所提模型以vertebra-focused landmark detection(VFLD)网络为基础网络,在编码器和解码器之间嵌入旋转注意力机制模块加强网络对于脊椎骨深层、高维特征的提取,抑制其他器官的干扰,同时利用向量相似性的损失函数对网络进行训练。实验结果表明,在MICCAI 2019公开脊椎挑战赛数据集中,所提模型的对称平均绝对百分比误差准确度高达9.31,可以有效提高原模型检测椎骨角点能力。与现有的诸多模型相比,其具有较高的准确率和稳健性。
图像处理 X光图像 神经网络 注意力机制 Cobb角 
激光与光电子学进展
2023, 60(10): 1010024
作者单位
摘要
上海工程技术大学电子电气工程学院,上海 201600
现有的良性阵发性位置性眩晕视频眼震图分类算法存在以下不足:人工提取的特征主观性和局限性强;眼球的轴向转动特征提取困难;仅能区分正常人群和患者,或对简单的眼震进行分类。针对上述问题,提出了一种基于注意力机制的视频眼震图分类算法。以轻量级模型三维 MobileNet V2为基础网络进行特征提取,在全局细节特征、时空信息丰富的网络低层引入全局时空注意力模块,融合眼球震颤空间信息和帧间时序信息;在网络高层引入时空通道注意力机制,筛选高级语义特征;采用带有类别调制系数的交叉熵损失函数对网络进行训练,有效缓解了类别数量不平衡的问题。在复旦大学附属眼耳鼻喉科医院提供的包括66种类别的视频眼震图数据集上进行了实验,所提算法的分类准确度达到90.08%,各类别的平均精准度、召回率、F1-score分别为90.50%,92.00%,90.40%,表明了所提算法的优越性。
医用光学 图像处理 医学图像处理 视频眼震图分类 时空注意力机制 良性阵发性位置性眩晕 三维卷积神经网络 
激光与光电子学进展
2022, 59(16): 1617001
作者单位
摘要
上海工程技术大学电子电气工程学院, 上海 201620
针对传统视觉里程计在低纹理场景下,定位精度差甚至失效的问题,提出一种结合点线特征的RGB-D视觉里程计方法。该方法结合了点线特征各自独有的特性,同时联合点特征的光度误差和线特征的局部梯度适应性误差,构建了一个对低纹理场景鲁棒的联合误差函数。利用高斯-牛顿迭代法对联合误差函数进行非线性迭代优化,以获取相机每一帧的准确位姿。在公开的真实RGB-D数据集和合成基准测试数据集上对本文方法进行评估。实验结果表明,与其他先进算法相比,本文算法具有更优越的准确性和鲁棒性。
机器视觉 视觉里程计 低纹理 点特征 线特征 联合误差函数 
光学学报
2021, 41(4): 0415001
作者单位
摘要
上海工程技术大学电子电气工程学院, 上海 201600
针对由一般卷积神经网络预测的粗糙特征生成的深度图质量低、监督学习处理任务限制数据量等问题,提出一种新颖的融合扩张卷积神经网络和同时定位与建图(SLAM)的无监督单目深度估计方法。该方法采用视图重构的思想估计深度,利用光学一致性误差约束网络训练,扩大感受野,考虑图片细节特征。同时采用SLAM算法优化相机姿态,并将其嵌入视图重构框架中,实现单目图片与其深度图的直接映射。利用该方法在公开的KITTI数据集上进行实验,结果表明,与经典的sfmlearner方法相比,误差度量指标绝对差、平方差、均方差和对数均方差分别降低了0.032、0.634、1.095和0.026;准确率度量指标δ1、δ2和δ3分别提升了3.8%、2.6%和0.9%。该模型的可用性与稳健性得到验证。
图像处理 扩张卷积神经网络 同时定位与建图 无监督学习 单目视觉 深度估计 
激光与光电子学进展
2020, 57(6): 061007
作者单位
摘要
江西财经大学信息管理学院, 江西 南昌 330013
提出一种自适应方向提升多小波的算法,结合多小波变换的对称性、正交性、紧支性、高阶消失矩以及自适应算法的方向性特征,提高图像压缩的性能。传统的多小波变换只考虑水平与垂直两个方向上的变换,而自适应提升多小波利用图像局部的方向特征寻找像素点之间的相关性,从而减少编码时的预测误差。利用两个D9/7单小波构造提升多小波,并结合率失真(RD)模型自适应地进行提升方向的选择,在减少预测误差与编码比特率之间进行折中选择。实验结果表明,自适应方向提升多小波比传统的提升多小波具有更好的编码性能。
图像处理 自适应 提升多小波 
激光与光电子学进展
2012, 49(7): 071001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!