1 广西大学电气工程学院,广西 南宁 530004
2 广西大学先进测控与智能电力研究中心,广西 南宁 530004
现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案,但由于其缺乏对全局信息的关注,模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度,提出一种结合上下文信息与多层特征融合的context&multilayer features-UNet(CMF-UNet),该模型利用金字塔特征聚合模块融合多层特征,并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证,结果表明,所提方法能够有效提升道路分割精度,相较于原U-Net,CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点,在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。
图像处理 U-Net模型 多尺度上下文 注意力机制 条带池化 激光与光电子学进展
2024, 61(4): 0428007
为应对特殊条件下不便于实地进行移动式操作的问题,设计了一套基于混合现实的可移动机械臂操作控制系统。该系统分为人机交互、机械驱动、虚拟现实等3个模块:人机交互模块通过摄像头识别操作者肢体手势动作并发布相应操作指令;机械驱动模块解析由人机交互模块发布的操作指令后完成相应动作并反馈设备工作状态;虚拟现实模块接收机械驱动模块反馈信息后将设备运行情况在构建好的虚拟场景中还原,实现对设备运行情况的实时监控。在可移动机械臂平台上的测试结果表明,操作者通过所提系统可以实现对可移动机械臂的远程精准控制与实时监控,系统响应速度能够达到60~100 ms/frame。
机器视觉 混合现实 Unity3D 机械臂 动作捕捉 激光与光电子学进展
2024, 61(4): 0415002
由于深度学习中语义分割模型参数量较大且算法耗时较长,不适合部署到移动端,针对此问题,提出了一种基于改进DeepLabv3+网络的轻量级语义分割算法。首先,采用MobileNetv3代替原DeepLabv3+语义分割模型特征提取骨干网络以降低模型复杂度,加快模型运行速度;其次,将空洞空间金字塔池化模块中的标准卷积替换为深度可分离卷积,提高模型训练效率;最后,引入注意力机制模块和组归一化方法,提升分割精度。所提分割算法在语义分割数据集Cityscapes验证集上的平均交并比(mIoU)达到72.94%。实验结果表明,与常见分割算法SegNet、Fast-SCNN、ENet等相比,所提算法在减少模型参数量的同时提高了分割效果。
图像处理 DeepLabv3+模型 MobileNetv3 轻量级 空洞空间金字塔池化 激光与光电子学进展
2022, 59(4): 0410015