作者单位
摘要
贵州大学 大数据与信息工程学院,贵州 贵阳 550025
由于盲人对周围环境缺乏视觉感知力,出行一直是盲人生活中的困扰。本文提出一种基于YOLOX改进的导盲系统障碍物检测算法CE-YOLOX。首先,为了减少特征融合网络在特征通道缩减时带来的语义信息的丢失,以亚像素跳变融合模块SSF和亚像素上下文增强模块SCE来充分利用通道信息和不同尺度的语义信息,以通道注意力引导模块CAG减少多尺度特征融合带来的混叠效应。其次,为了使模型更加聚焦于有效特征,引入全局注意力机制GAM,通过减少信息弥散和放大全局交互表示来提高模型性能。然后,使用SIOU-LOSS替换原模型的位置回归损失函数IOU-LOSS,加快了边框的回归速度与精度。最后,搭建导盲系统检测平台,将所提算法移植到边缘计算设备NVIDIA Xavier NX上。实验结果表明,改进的导盲系统障碍物算法在服务器和NVIDIA Xavier NX平台上的mAP一致,提升至90.53%,相较原YOLOX模型算法提高了2.45%。在服务器上的检测速度达到75.93 FPS。本文模型在兼顾检测速度的同时提高了精度,显著优于对比算法,满足边缘计算设备的要求,具有实际的应用价值。
导盲系统 障碍物检测 亚像素 CEFPN GAM 角度损失 SIOU blind system obstacle detection subpixel CEFPN GAM angle loss SIOU 
液晶与显示
2023, 38(9): 1281
作者单位
摘要
贵州大学 大数据与信息工程学院,贵州 贵阳 550025
当前许多语义分割模型利用的训练数据是RGB图像,在一些极端的环境下其模型的稳定性容易受到很大的影响,不能满足夜间场景自动驾驶的实际需求。为了解决夜间场景的语义分割问题,将ResNet-152作为特征提取网络,构建了一种融合轻量化注意力模块的多模态双编码器-解码器模型。双编码器从RGB-T两种模态中提取关键信息通过注意力模块后进行融合,然后将提取到的特征信息送入解码器,分阶段拼接上采样特征图和各层编码器提取的特征图,再通过卷积层进行特征提取,通过上采样还原分辨率,最后进行语义分割。实验结果表明,该模型在MFNet测试集上的平均准确率和平均交并比分别为76%和55.7%,相比于其他网络模型在指标上取得了一定的提升,达到了应用RGB-T模态图像精准进行日间及夜间场景语义分割的基本要求。
夜间语义分割 多模态 轻量化注意力模块 多尺度信息 night semantic segmentation multimodal lightweight attention module multiple scale information 
液晶与显示
2023, 38(7): 975
作者单位
摘要
贵州大学大数据与信息工程学院,贵州 贵阳 550025
为了更好地保护和利用海洋鱼类资源,需要对海洋鱼类进行有效监测,但海洋环境复杂,导致海洋鱼类的识别检测普遍存在检测精度不佳等问题。针对上述问题,本文提出一种基于RetinaNet改进的海洋鱼类检测算法。首先,用DenseNet-121替换RetinaNet原有的主干网络,减少参数量的同时保留了更多的鱼类图像特征。然后,在主干网络中引入卷积注意力模块,引导神经网络更有针对性地提取图像特征。其次,在原有的FPN网络中引入新的卷积层,使得改进后的PFPN网络能够融合更多尺度的图像特征。最后,在分类和回归网络中引入soft-NMS,有效改善了相同类别的鱼距离过近和相互遮挡造成的漏检问题。实验表明,提出算法的平均精度(mAP)达到92.12%,相比SSD等算法的检测效果有明显提高,相比原算法的mAP提升了4.71%,对于海洋鱼类具有较好的检测效果。
图像处理 鱼类检测 RetinaNet DenseNet-121 卷积注意力模块 soft-NMS 
激光与光电子学进展
2023, 60(10): 1010014
作者单位
摘要
贵州大学 大数据与信息工程学院,贵州 贵阳 550025
针对DeepLabv3+模型对图像目标边缘分割不准确、不同类目标分割不一致等问题,提出一种基于类特征注意力机制融合的语义分割算法。该算法在DeepLabv3+模型编码端先设计一个类特征注意力模块增强类别间的相关性,更好地提取和处理不同类别的语义信息。然后采用多级并行的空间金字塔池化结构增强空间之间的相关性,更好地提取图像不同尺度的上下文信息。最后在解码端利用通道注意力模块的特性对多层融合特征重新校准,抑制冗余信息,加强显著特征来提高网络的表征能力。在Pascal Voc2012和Cityscapes数据集上对改进模型进行了有效性和泛化性实验,平均交并比分别达到了81.34%和76.27%,使图像边缘分割更细致,类别更清晰,显著优于本文对比算法。
多尺度特征融合 类特征 注意力机制 语义分割 DeepLabv3+ multi-scale feature fusion class feature attention mechanism semantic segmentation DeepLabv3+ 
液晶与显示
2023, 38(2): 236
作者单位
摘要
贵州大学大数据与信息工程学院,贵州 贵阳 550025
针对传统视觉同时定位与地图构建(vSLAM)系统在动态场景中无法有效去除运动物体及缺少可用于更高层应用的语义地图等问题,提出了一种可有效去除动态物体并构建表征室内静态环境的语义八叉树地图的vSLAM系统方法。首先,使用Fast-SCNN作为语义分割网络提取图像的语义信息,同时,利用金字塔光流法对特征点进行跟踪匹配。然后,使用步进随机抽样一致算法(Multi-stage RANSAC)通过多次执行不同尺度的RANSAC流程对特征点进行步进采样,再利用对极几何约束并结合Fast-SCNN提取的语义信息进行视觉里程计动态特征点剔除。最后,通过体素滤波降低点云冗余后构建纯静态环境的语义八叉树地图。实验结果表明:所提方法在公用数据集TUM RGB-D的8个RGB-D高动态序列中测试的相机相对位移误差、相对旋转误差和全局轨迹误差相较于ORB-SLAM2系统有94%以上的提升,全局轨迹误差仅为0.1 m;相较于同类DS-SLAM系统,动点剔除总耗时有21%的缩减。建图性能方面,经体素滤波后构建的语义点云地图与语义八叉树地图分别占据9.6 MB、685 kB的存储空间,相较于17 MB的原始点云,语义八叉树地图仅占用其4%的存储空间并因含有语义可用于更高层次的智能交互任务。
同步定位与地图构建 动态点剔除 语义分割 步进随机抽样一致算法 体素滤波 语义八叉树地图 
激光与光电子学进展
2022, 59(18): 1811003
作者单位
摘要
贵州大学大数据与信息工程学院,贵州 贵阳 550025
为提高垃圾分类的自主化和智能化程度,垃圾桶需要配备视觉传感器和搭载有效的垃圾检测与分类算法的智能硬件。针对该需求,提出了一种基于改进型YOLOv3的智能化垃圾识别分类算法。首先,引入MobileNetv3网络代替YOLOv3的主干网络Darknet53,并加入空间金字塔池化结构,在减少网络模型计算复杂度的同时保证模型准确率;其次,采用4个不同的尺度检测加强模型对小目标的检测能力;然后,采用complete intersection over union (CIOU)损失函数替换原有YOLOv3模型的损失函数,进一步提升模型的精确度;最后,搭建家用垃圾桶测试平台,并将所提算法移植到边缘计算模块NVIDIA Xavier NX上。实验结果表明,所提轻量化优化算法在服务器和NVIDIA Xavier NX平台上对于自主建立的垃圾数据集平均精度一致,达到了72.1%,比YOLOv3提高了4.9个百分点,比YOLOv4略低1.6个百分点;检测速度分别达到了74,19 frame/s,远高于YOLOv3算法的43,8 frame/s及YOLOv4算法的50,11 frame/s,表明所提算法满足边缘计算设备的要求,具备潜在的应用价值。
机器视觉 垃圾分类 YOLOv3 深度可分离卷积 空间金字塔池化 边缘计算 
激光与光电子学进展
2022, 59(4): 0415002
作者单位
摘要
贵州大学大数据与信息工程学院, 贵州 贵阳 550025
现如今用于立体匹配的深度学习算法都存在网络结构复杂、消耗大的问题。为解决此类问题,提出了一种参数量只有参考网络PSMNet一半的立体匹配端到端网络结构。所提结构在特征提取模块保留大致框架的同时,减少多余卷积层,并融合空间注意力机制和通道注意力机制来汇聚上下文信息;在代价计算模块,通过加大偏移步长减少视差计算输入的视差维度,使视差计算的参数量和消耗大幅度减少;在视差计算中,对匹配成本特征体的输出进行多视差预测;在L1损失函数的基础上加入交叉熵损失函数,这样可在降低消耗的同时保证了模型匹配精度。在KITTI数据集和SceneFlow数据集上对所提模型进行测试,实验结果表明:与基准方法相比,所提模型的参数量减少了58%,精度提升24%。
视觉光学 立体匹配 端到端网络 注意力机制 视差计算 
激光与光电子学进展
2021, 58(24): 2433002
作者单位
摘要
贵州大学 大数据与信息工程学院, 贵州 贵阳 550025
为解决原始单源图像缺乏多尺度细节信息和图像融合后出现的噪声问题, 提出了一种基于小波变换的多尺度图像融合增强算法, 根据不同频率子带分量采用不同融合规则的思想, 对高频子带提出了三种融合方法, 同时构建了一种新颖的多尺度残差金字塔空间并将其参与融合过程, 以减少融合噪声。多种小波分解和对比实验结果表明, 提出的小波多尺度融合增强算法能够在一定程度上减小融合图像噪声同时增强图像的多尺度细节信息。
信息光学 小波变换 多尺度图像融合 信息增强 information optics wavelet transform multi-scale image fusion information enhancement 
光学技术
2021, 47(2): 217
作者单位
摘要
贵州大学大数据与信息工程学院, 贵州 贵阳 550025
针对当前视网膜图像分割方法中存在的细小血管像素模糊以及较厚视网膜血管边缘细节丢失等问题,本文设计了一种基于改进U-Net与Mini-U-Net网络相结合的两阶段训练分割方法。首先,在全尺寸U-Net网络后加入一个小尺寸的Mini-U-Net对图像中的模糊血管像素进行二次训练,以提升模糊血管像素的分割效果;其次,将两个网络编解码过程中的原始卷积层改为残差卷积模块,使原始特征信息被更完整地保留;最后,在两个网络的跳跃连接处引入注意力机制,使任务目标集中在血管像素上,提高分割精度。该方法在DRIVE和STARE公共眼底图像数据集上进行测试的精确率分别为0.8331和0.8563,召回率分别为0.8396和0.8639,F1-Score分别为0.8351和0.8609,准确率分别为0.9698和0.9787,整体分割结果相较其他分割方法更好。
图像处理 视网膜血管分割 U-Net 两阶段训练 残差网络 注意力机制 
激光与光电子学进展
2021, 58(16): 1617002
作者单位
摘要
贵州大学大数据与信息工程学院, 贵州 贵阳 550025
针对传统视觉同时定位与地图构建(vSLAM)相机跟踪模块在动态环境中无法精确定位的问题,提出一种基于语义的视觉里程计。首先,在利用金字塔Lucas-Kanade 光流追踪匹配帧间特征点的同时,对图像进行像素级的语义分割。然后,将语义信息与几何特征紧密结合用以准确地剔除图像中的外点,使得位姿估计和建图仅依靠图像中值得信赖的静态特征点。最后,提出了一种多尺度的随机抽样一致(RANSAC)方案,对匹配点进行步进采样,每步使用不同的尺度因子,在降低外点检测时间的同时,提高了外点检测的鲁棒性。在TUM数据集上的实验结果表明,在高动态序列中,相比于ORB-SLAM2,本文方案的绝对轨迹误差和相对位姿误差改善了90%以上,而相比于同类型的DS-SLAM,本文方案在降低外点检测时间30%~40%的情况下,提升了位姿估计的鲁棒性。
成像系统 运动估计和光流 视觉里程计 动态场景 多尺度随机抽样一致 语义分割 
激光与光电子学进展
2021, 58(6): 0611001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!