作者单位
摘要
1 国网保定供电公司, 河北保定 071000
2 华北电力大学动力工程系, 河北保定 071000
无人机拍摄下的红外图像中变电设备的分割精度直接影响着热故障诊断的结果, 针对复杂红外背景下变电设备分割精度低的问题, 提出了一种融合可见光和红外图像的多模态路径聚合网络Multimodal Path Aggregation Network, MPAN)。首先提取并融合两种模态图像的特征, 考虑到两种模态图像的特征空间存在差异, 提出了自适应特征融合模块(Adaptive Feature Fuse Module, AFFM), 以充分融合两种模态特征; 对具有多尺度特征的主干网络增加自底向上的金字塔网络, 并对横向连接的路径增强模块引入自注意力机制; 最后使用 dice系数优化掩膜损失函数。实验结果表明, 多模态图像的融合能够增强分割性能, 且验证了提出各模块的有效性, 该模型能够显著提高红外图像中变电设备实例分割的准确率。
实例分割 变电设备 红外图像 可见光图像 自适应特征融合模块 自注意力机制 dice系数 instance segmentation, substation equipment, infra 
红外技术
2023, 45(11): 1198
作者单位
摘要
昆明理工大学 机电工程学院,云南昆明650000
传统接触式甲烷泄漏传感器检测范围小且效率低,而结合非接触式红外热成像的机器视觉算法可实现远距离、大范围红外甲烷实例分割,对于提高甲烷检测效率及保障人员安全具有显著优势。然而远距离甲烷气体图像轮廓模糊、泄漏的甲烷气体与背景对比度较低且形状易受大气流动因素影响等问题限制了红外甲烷实例分割性能。针对上述问题,本文提出一种空间信息自适应调控和特征对齐的网络模型(Adaptive spatial information regulation and Feature alignment Network, AFNet)实现甲烷泄漏红外实例分割。首先,为增强模型的特征提取能力,提出自适应空间信息调控模块赋予主干网络不同尺度残差块自适应权重丰富模型提取的特征空间;其次,构建加权双向金字塔弥补特征金字塔自顶而下的特征传播方式导致的低层特征空间位置和实例边缘信息弥散丢失问题,以适应甲烷气体复杂轮廓变化下前景目标定位检测和轮廓分割需求。最后,设计原型特征对齐模块捕获长距离气体特征之间的语义关系丰富原型语义信息量以改善生成目标掩码质量提高甲烷气体分割精度。实验结果表明,本文提出的AFNet模型AP50@95,AP50定量分割精度分别达到42.42%,92.18%,相比于原始Yolact模型分割精度,分别提高9.79%,6.18%,推理速度达到36.80 frame/s,满足甲烷泄漏分割需求。实验结果验证了本文算法对红外甲烷泄漏分割的有效性和工程实用性。
红外甲烷 自适应调控 特征对齐 特征金字塔 实例分割 infrared methane adaptive regulation feature alignment feature pyramids instance segmentation 
光学 精密工程
2023, 31(20): 3034
作者单位
摘要
河南大学人工智能学院,河南 郑州 450046
针对主流单阶段实例分割算法因冗余语义信息造成实例掩码缺失和泄漏的问题,提出一个基于语义对齐和图节点交互的实例分割算法。在全局掩码生成阶段,设计一个语义对齐模块,通过全局映射和高斯映射评估语义信息对全局和局部语义完整性的影响,从而对冗余语义信息进行抑制。此外,在实例掩码组装阶段,设计一个图节点交互模块。该模块通过对特征图进行图结构数据变换和图节点信息交互,提取拓扑图的空间特征,补充了掩码组装信息,进一步提高了实例掩码的准确度。实验结果表明,所提算法在MS COCO数据集上实现了38.3%的平均精度均值(mAP),与其他先进算法相比,有很强的竞争力。
图像处理 实例分割 语义对齐 图节点交互 MS COCO数据集 image processing instance segmentation semantic alignment graph node interaction MS COCO dataset 
激光与光电子学进展
2023, 60(22): 2210008
作者单位
摘要
昆明理工大学 机电工程学院,云南 昆明 650000
视频实例分割是车辆辅助驾驶多目标感知和场景理解的一项关键技术。针对弱监督视频实例分割仅使用边界框对网络进行训练严重制约交通场景大尺度动态范围目标分割精度的问题,本文提出尺度自适应生成调控弱监督视频实例分割网络(Scale Adaptive Generation Regulation weakly supervised video instance segmentation network,SAGRNet)。首先,设计一种多尺度特征映射贡献度动态自适应调控模块,通过动态调整不同尺度特征映射信息贡献度取代原有的线性加权以强化对目标局部位置和整体轮廓的聚焦能力,解决了车辆、行人等目标由于成像距离远近造成的尺度动态范围过大问题;其次,构建目标实例多细粒度空间信息聚合生成调控模块,通过聚合基于不同空洞率提取的多细粒度空间信息生成权重参数以调控各尺度特征,实现了细化实例边界和增强跨通道信息交互掩码特征映射表征能力,有效弥补了实例边缘信息匮乏导致边缘轮廓分割mask连续性缺失问题。最后,为缓解边界框标签监督信息弱化,引入正交损失和颜色相似性损失缩小模型预测mask与真实边界框偏差并计算逐像素点对间标签属性归类模糊问题。Youtube-VIS2019提取的交通场景数据集实验结果表明,SAGRNet相较于弱监督基准网络平均分割精度提升5.1%达到38.1%,为实现多目标感知和实例级场景理解提供了有效算法依据。
辅助驾驶 弱监督 视频实例分割 自适应生成调控 细粒度 assisted driving weakly supervised video instance segmentation adaptive generation regulation fine grain 
光学 精密工程
2023, 31(18): 2736
作者单位
摘要
1 电子科技大学光电科学与工程学院,四川 成都 610000
2 陆军研究院装甲兵研究所,北京 100072
设计了一种无偏振片液晶透镜的离焦深度测量(DFD)方法。分别建立液晶透镜成像下的o光和e光的高斯模糊退化模型,将其加权求和得到自然光在液晶透镜成像下的模糊退化模型,求取自然光和e光下深度估计对噪声的偏导,并进行数值仿真,结果表明,自然光模型比e光模型抗干扰能力更强,小模糊光斑比大模糊光斑抗干扰能力更强。在无偏模糊均衡滤波器(UDE)算法的基础上,利用导向滤波对偏差进行滤波,并对置信度模型进行修正,引入实例分割对估计结果进行优化。搭建了放大率恒定的液晶透镜光学成像系统,实现了自然光条件下利用液晶透镜的深度测量。实验结果表明,本文方案和e光条件下UDE方法相比,均方根误差降低了56%。
机器视觉 无偏振片 液晶透镜 失焦深度估计 无偏滤波器 实例分割 machine vision polarizer-free liquid crystal lens out of focus depth estimation unbiased filters instance segmentation 
光学学报
2023, 43(14): 1415002
作者单位
摘要
1 安徽工程大学电气工程学院,安徽 芜湖 241000
2 高端装备先进感知与智能控制教育部重点实验室,安徽 芜湖 241000
3 芜湖市固高自动化技术有限公司,安徽 芜湖 241000
针对视觉同步定位与建图算法在遮挡情况下易受到干扰而导致定位误差较大且闭环检测精度较低等问题,提出一种融合混合注意力实例分割的视觉同步定位与建图算法。该算法能够动态调整被遮挡物识别权重,在出现遮挡情况时提升对被遮挡物的特征提取与识别能力。同时采用概率去误匹配算法去除错误匹配点对,增加位姿求解及关键帧选取精度,从而更好地修正机器人位姿、提高系统构图的准确率。通过KITTI公开数据集和真实场景对所提算法进行测试,结果表明,所提算法在闭环准确率上与ORB-SLAM2算法相比约提高10.7%,平移误差约减小27.6%,体现了良好的构图能力。
遥感 同步定位与地图构建 注意力机制 实例分割 目标识别 闭环检测 remote sensing simultaneous localization and mapping attentional mechanism instance segmentation target recognition closed-loop detection 
激光与光电子学进展
2023, 60(10): 1028008
作者单位
摘要
上海海洋大学信息学院,上海 201306
准确自动检测台风风眼位置可为台风预报与监测研究提供先验信息,以减少灾害损失。由于台风形态结构的多变性,其中心自动定位仍存在一定的困难。本研究利用台风卫星云图,提出一种基于多尺度镶嵌的R-CNN台风风眼检测方法。收集日本气象厅发布的1981—2017年5000多张台风卫星云图,利用图像数据中风眼眼壁轮廓曲线及内外明暗差别清晰明显的特点对图中风眼进行分割标注。通过台风风眼半径多尺度估算算法,将原始图像划分为多尺度台风云图,整合训练集和测试集。借助多尺度图像镶嵌、超参数选择和多条件测试分析,构建利用多尺度Mask R-CNN模型检测分割台风风眼的总体算法框架,开展多尺度对比实验。在自建标定数据集中,台风风眼的识别准确率最高达到92.63%、最低为88.36%,平均每张图片的检测时间最少为0.043 s,均方误差最小达到2154,平均交并比最大为0.9454。实验结果表明,所提多尺度镶嵌数据增强方法在大中规模尺度融合时效果最好、中小尺度较差,与现有主要数据增强方法相比,能更有效地提升神经网络准确率。整体检测模型在台风中心定位中的综合效率优于其他深度学习定位方法。
图像处理 台风风眼 目标检测 实例分割 卫星云图 数据增强 image processing typhoon eye object detection instance segmentation satellite cloud imagery data augmentation 
激光与光电子学进展
2023, 60(10): 1010009
赵敬伟 1,2林珊玲 2,3梅婷 1,2林志贤 1,2,3,*郭太良 1,2
作者单位
摘要
1 福州大学 物理与信息工程学院, 福州 350116
2 中国福建光电信息科学与技术创新实验室, 福州 350116
3 福州大学 先进制造学院, 福建 泉州 362200
为提高单阶段实例分割的检测精度和改善小目标漏检、错检情况, 提出一种基于YOLACT改进的YOLACTR算法。该算法首先利用CNN与Transformer相结合, 设计一种新的头部预测网络, 对特征进一步提取, 并使用双向注意力来关联同一实例的掩码信息并区分不同实例之间的掩码特征, 注重特征点周围的关联信息, 使得检测框的预测更加准确; 然后利用多级上采样和设计的CS注意力模块结合形成掩码分支, 使其融入多种不同尺度信息, 并利用CS注意力来关注不同的尺度信息。在MS COCO数据上, YOLACTR算法与YOLACT算法相比, 其边框和掩码检测精度分别提升了7.4%和2.9%, 在小目标检测上分别提升了18.9%和13.5%。实验表明, YOLACTR算法可以在多目标复杂场景下, 提升检测和分割精度以及分类的准确度, 改善小目标和重叠目标漏检、错检的问题。
实例分割 注意力机制 小目标检测 YOLACT YOLACT instance segmentation Transformer Transformer attention mechanism small target detection 
半导体光电
2023, 44(1): 134
宁欣 1刘江宽 2,3李卫军 1,*石园 2,3[ ... ]南方哲 4
作者单位
摘要
1 中国科学院半导体研究所, 北京 100083
2 威富集团形象认知计算联合实验室, 北京 102200
3 深圳市威富世界有限公司, 广东 深圳 518102
4 新疆大学软件学院, 新疆 乌鲁木齐 830091
随着实例分割技术在各种场景中的应用越来越广泛, 运行速度和硬件资源占用是该技术在应用中需要考虑的 2个重要因素。最近提出的基于图像原型掩码系数的实例分割网络 (YOLACT)在运行速度方面做得很好, 但是需要设置较大的特征提取网络才能保证分割精确度, 这就导致了模型占用的硬件资源较多, 同时运行速度也受到了限制。在 YOLACT的基础上, 提出一种新的模型, 对实例分割的特征提取网络进行了优化, 先使用基于批量归一化层放缩因子的通道剪枝方法对 YOLACT网络进行压缩, 然后对压缩后的卷积层和批量归一化层进行融合, 最后, 在 COCO val2017上对本文提出的方法进行了评估。实验结果表明, 相比原始的 YOLACT网络, 该方法的模型文件大小可以减少 56.9%, 运行速度提升 28.6%, 运行时显存占用也降低了 13.6%, 有效地减少了硬件资源占用, 并且提升了运行速度。
实例分割 模型压缩 通道剪枝 运行效率 instance-segmentation model-compression channel-pruning running efficiency 
太赫兹科学与电子信息学报
2023, 21(1): 95
作者单位
摘要
1 浙江大学 机械工程学院,浙江 杭州 310027
2 浙江西子势必锐航空工业有限公司,浙江 杭州 310018
为提高复合材料铺放质量,辅助现场人员快速对缺陷进行检测,提出一种基于Transformer的复合材料多源图像实时实例分割网络Trans-Yolact,用来对复合材料缺陷进行检测、分类、分割。在Yolact网络框架基础上,针对复合材料缺陷特点,从空间域与通道域两个维度,增强网络对复合材料缺陷的检测能力。在空间域上,常规卷积核具有空间尺度的局限性,对狭长形、大尺寸缺陷的检测效果不佳。因此,采用CNN+Transformer架构的BoTNet作为基础主干网络;同时将Transformer引入Yolact网络的FPN结构中,增强网络从非局部空间中获取信息的能力。在通道域上,采用红外与可见光联立的检测方式,并改进主干网络浅层结构,将其分为可见光通道、红外通道、混合通道,混合通道中引入通道域注意力机制,进一步增强网络对红外与可见光图像的综合判断能力。实验结果表明:改进后Trans-Yolact对复合材料缺陷mAP为88.0%,较基准Yolact网络提高5.5%,缺丝、扭转等狭长形缺陷AP提高15.2%、5.1%,包含部分大尺寸缺陷的异物类缺陷AP提高9.1%。最终对Trans-Yolact网络进行结构化剪枝,剪枝后较基准Yolact网络减少26.5%的计算量(FLOPs)、减少44.7%的参数量;检测帧数提高58%,达到57.67 fps。并在大型龙门复合材料自动铺放设备上进行在线测试,可以满足生产过程最大铺放速度1.2 m/s下,复合材料缺陷的实时检测分割。
缺陷检测 多光谱融合 纤维自动铺放 深度学习 实例分割 defects detection multi-spectrum fusion automatic fiber placement deep learning instance segmentation 
红外与激光工程
2023, 52(2): 20220338

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!