陈果 1,2胡立坤 1,2,*
作者单位
摘要
1 广西大学电气工程学院,广西 南宁 530004
2 广西大学先进测控与智能电力研究中心,广西 南宁 530004
现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案,但由于其缺乏对全局信息的关注,模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度,提出一种结合上下文信息与多层特征融合的context&multilayer features-UNet(CMF-UNet),该模型利用金字塔特征聚合模块融合多层特征,并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证,结果表明,所提方法能够有效提升道路分割精度,相较于原U-Net,CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点,在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。
图像处理 U-Net模型 多尺度上下文 注意力机制 条带池化 
激光与光电子学进展
2024, 61(4): 0428007
作者单位
摘要
1 西安建筑科技大学信息与控制工程学院,陕西 西安 710055
2 西安交通大学自动化科学与工程学院,陕西 西安 710049
为解决工厂流水线上不同种类动态物品的快速精准抓取问题,提出一种两阶段动态多物品定位抓取方法。第1阶段采用所提多尺度上下文感知的单分支融合语义分割网络获取目标物品的掩码区域:首先特征提取网络采用单分支结构,在保证提取丰富的空间信息和高层语义信息的同时,减小网络参数量;随后特征融合网络通过双边引导特征融合模块增强空间信息和语义信息的表达能力;最后设计特征增强网络,通过特征辅助收敛模块嵌入浅层和深层网络中,加快网络收敛速度。第2阶段采用基于轮廓点检测的快速位姿估计策略在掩码区域预测最佳抓取点位姿。在自建数据集上的测试及流水线平台抓取实验结果表明,所提方法能实时检测和预测物品抓取点位姿,精准完成物品抓取,其分割精度、预测时间和抓取成功率均优于对比方法。
机器视觉 机器人抓取 两阶段定位抓取算法 多尺度上下文感知 特征增强 位姿估计 
激光与光电子学进展
2023, 60(6): 0615005
作者单位
摘要
江南大学物联网工程学院物联网应用技术教育部工程中心,江苏 无锡 214122
当前车辆辅助驾驶系统的一个主要挑战就是在复杂场景下实时检测出多遮挡的行人,以减少交通事故的发生。为了提高系统的检测精度和速度,提出了一种基于改进区域全卷积网络(R-FCN)的多遮挡行人实时检测算法。在R-FCN网络基础上,引进感兴趣区域(RoI)对齐层,解决特征图与原始图像上的RoI 不对准问题;改进可分离卷积层,降低R-FCN 的位置敏感分数图维度,提高检测速度。针对行人遮挡问题,提出多尺度上下文算法,采用局部竞争机制进行自适应上下文尺度选择;针对遮挡部位可见度低,引进可形变RoI 池化层,扩大对身体部位的池化面积。最后为了减少视频序列中行人的冗余信息,使用序列非极大值抑制算法代替传统的非极大值抑制算法。检测算法在基准数据集Caltech 训练检测和ETH 上产生较低的检测误差,优于当前数据集中检测算法的精度,且适用于检测遮挡的行人。
多遮挡行人 可分离卷积层 多尺度上下文 可形变RoI 池化层 multi-occluded pedestrian separable convolution layer multi-scale context deformable RoI pooling layer 
光电工程
2019, 46(9): 180606

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!