作者单位
摘要
昆明理工大学 机电工程学院,云南昆明650500
初烤烟叶等级的快速准确检测对开发烟叶智能分级设备以促进农产品精细化管理有着重要意义。针对相似度较高但等级不同的初烤烟叶难以区分的问题,本文提出多感受野特征自适应融合及动态损失调整的初烤烟叶等级检测网络(Flue-cured Tobacco Leaf Grade Detection Network,FTGDNet)。首先,FTGDNet采用CSPNet作为特征提取主干网络,采用GhostNet作为辅助特征提取网络以增强模型的特征提取能力;其次,在主干网络末端嵌入显式视觉中心瓶颈模块(Explicit Visual Center Bottleneck module,EVCB)以实现全局特征信息与局部细节特征信息融合;然后,构建多感受野特征自适应融合模块(Multi-Receptive Field Feature Adaptive Fusion module,MRFA_d),利用注意力特征融合机制(Attention Feature Fusion,AFF)将不同感受野特征图进行自适应加权融合,在增强模型局部感受野的同时突出有效通道信息;最后,设计了一种新的定位损失函数(More Complete IoU Loss,MCIoU_Loss),结合预测框与真实框面积损失以解决在回归定位过程中二者宽高比相等且中心点重合时CIoU_Loss性能退化导致定位精度下降问题,此外,引入矩形相似度衰减系数在训练过程中对真实框与预测框的相似度判别项进行动态调整,加快模型拟合。实验结果表明,FTGDNet对十个等级的初烤烟叶的验证精度达到90.0%,测试精度达到87.4%,且推理时间仅为12.6 ms。相较于多种先进目标检测算法,FTGDNet具有更高的检测精度和更快的检测速度,可为高精度初烤烟叶等级检测提供关键技术支撑。
初烤烟叶 目标检测 多感受野特征融合 动态损失调整 flue-cured tobacco leaf object detection multi receptive field feature fusion dynamic loss adjustment 
光学 精密工程
2024, 32(2): 301
作者单位
摘要
昆明理工大学 机电工程学院,昆明 650500
针对常规工业气体泄漏检测装置需泄漏扩散到一定范围并与传感器接触时才能响应的不足,提出一种融合结构重参数化变换的红外非接触式检测网络模型GRNet。GRNet模型采用Mosaic-Gamma变换的预处理方法增加泄漏样本数量并提高图像对比度以增强模型的鲁棒性;通过K-means聚类分析出适用于气体泄漏红外检测的候选框以预置模型参数;优化定位损失函数以提高模型对泄漏区域的定位准确性;采用改进后的轻量化网络RepVGG模块重构特征提取网络增强模型的特征提取能力,以实现轻量化并提高检测精度。实验结果表明,GRNet模型对氨气泄漏的平均检测精度达到94.90%,单张图像平均检测时间达到3.40 ms。采用伪色彩映射实现泄漏浓度的视觉感知效果,采用PyQt5将GRNet模型进行封装实现气体泄漏红外检测系统界面的可视化并在Jetson Nano B01嵌入式实验平台部署该模型,验证了实际工程应用的可行性和有效性,为开发气体泄漏非接触探测装置以保障涉气企业的安全生产和稳定运行提供一种有效的检测算法。
目标检测 气体泄漏检测 定位损失函数 图像预处理 聚类分析 结构重参数化 Target detection Gas leak detection Localization loss function Image pre-processing Cluster analysis Structural re-parameterization 
光子学报
2024, 53(1): 0130002
作者单位
摘要
昆明理工大学 机电工程学院,云南昆明650000
针对全监督视频实例分割网络训练数据高度依赖精细掩码标注,时间和人工成本过高,导致智能机器无法快速适应新场景的问题,提出一种端到端的掩码生成动态调控弱监督视频实例分割(Weakly Supervised Video Instance Segmentation,WSVIS)网络。为克服初始掩码预测层通道维度突降导致的实例激活特征丢失问题,构建多级特征融合模块,利用特征复用策略预测初始实例特征并融合相对位置信息生成初始预测掩码。然后,提出动态调控机制在通道和空间维度上建立掩码特征依赖关系,强化初始预测掩码与实例感知信息之间的动态交互。最后,网络设计二元颜色相似性生成伪亲和标签取代精细掩码标注,联合边界框与掩码一致性损失实现仅边界框标注的弱监督视频实例分割。实验结果表明,在BoxSet和YT-VIS数据集上,WSVIS网络能达到与全监督网络相近的分割精度和分割效果,同时能够满足实时推理要求,为智能机器快速适应新场景实现实时环境感知和理解提供了理论支撑和算法依据。
智能机器 弱监督视频实例分割 多级特征融合 动态调控 二元颜色相似性 intelligent machine weakly supervised video instance segmentation multi-level feature fusion dynamic regulation binary color similarity 
光学 精密工程
2023, 31(19): 2884
作者单位
摘要
1 昆明理工大学机电工程学院,云南 昆明 650500
2 火箭军工程大学导弹工程学院,陕西 西安 710025
从遥感影像能够获取到精度高、范围广的地物信息,因而遥感影像在高空侦察和精确制导等领域得到广泛应用。针对遥感影像地物目标边缘模糊、尺度多变导致难以精准分割的问题,提出以深度残差网络为主干并结合注意力引导与多特征融合的分割方法,命名为AMSNet。首先,采用类别引导通道注意力模块提高模型对难分辨区域的敏感性;其次,嵌入特征复用模块减少遥感影像特征提取过程中边缘损失和小尺度目标丢失的问题;最后,设计跨区域特征融合模块以增强对多尺度特征信息的获取能力,并耦合多尺度损失融合模块对损失函数进行优化,综合提升模型对多尺度遥感影像目标的分割能力。选取3组遥感影像数据集进行对比实验,结果表明,AMSNet能够有效分割遥感影像地物目标边缘和多尺度目标。
遥感影像 语义分割 注意力机制 多尺度特征 
光学学报
2023, 43(24): 2428010
作者单位
摘要
昆明理工大学 机电工程学院,云南昆明650000
传统接触式甲烷泄漏传感器检测范围小且效率低,而结合非接触式红外热成像的机器视觉算法可实现远距离、大范围红外甲烷实例分割,对于提高甲烷检测效率及保障人员安全具有显著优势。然而远距离甲烷气体图像轮廓模糊、泄漏的甲烷气体与背景对比度较低且形状易受大气流动因素影响等问题限制了红外甲烷实例分割性能。针对上述问题,本文提出一种空间信息自适应调控和特征对齐的网络模型(Adaptive spatial information regulation and Feature alignment Network, AFNet)实现甲烷泄漏红外实例分割。首先,为增强模型的特征提取能力,提出自适应空间信息调控模块赋予主干网络不同尺度残差块自适应权重丰富模型提取的特征空间;其次,构建加权双向金字塔弥补特征金字塔自顶而下的特征传播方式导致的低层特征空间位置和实例边缘信息弥散丢失问题,以适应甲烷气体复杂轮廓变化下前景目标定位检测和轮廓分割需求。最后,设计原型特征对齐模块捕获长距离气体特征之间的语义关系丰富原型语义信息量以改善生成目标掩码质量提高甲烷气体分割精度。实验结果表明,本文提出的AFNet模型AP50@95,AP50定量分割精度分别达到42.42%,92.18%,相比于原始Yolact模型分割精度,分别提高9.79%,6.18%,推理速度达到36.80 frame/s,满足甲烷泄漏分割需求。实验结果验证了本文算法对红外甲烷泄漏分割的有效性和工程实用性。
红外甲烷 自适应调控 特征对齐 特征金字塔 实例分割 infrared methane adaptive regulation feature alignment feature pyramids instance segmentation 
光学 精密工程
2023, 31(20): 3034
作者单位
摘要
昆明理工大学 机电工程学院,云南 昆明 650000
视频实例分割是车辆辅助驾驶多目标感知和场景理解的一项关键技术。针对弱监督视频实例分割仅使用边界框对网络进行训练严重制约交通场景大尺度动态范围目标分割精度的问题,本文提出尺度自适应生成调控弱监督视频实例分割网络(Scale Adaptive Generation Regulation weakly supervised video instance segmentation network,SAGRNet)。首先,设计一种多尺度特征映射贡献度动态自适应调控模块,通过动态调整不同尺度特征映射信息贡献度取代原有的线性加权以强化对目标局部位置和整体轮廓的聚焦能力,解决了车辆、行人等目标由于成像距离远近造成的尺度动态范围过大问题;其次,构建目标实例多细粒度空间信息聚合生成调控模块,通过聚合基于不同空洞率提取的多细粒度空间信息生成权重参数以调控各尺度特征,实现了细化实例边界和增强跨通道信息交互掩码特征映射表征能力,有效弥补了实例边缘信息匮乏导致边缘轮廓分割mask连续性缺失问题。最后,为缓解边界框标签监督信息弱化,引入正交损失和颜色相似性损失缩小模型预测mask与真实边界框偏差并计算逐像素点对间标签属性归类模糊问题。Youtube-VIS2019提取的交通场景数据集实验结果表明,SAGRNet相较于弱监督基准网络平均分割精度提升5.1%达到38.1%,为实现多目标感知和实例级场景理解提供了有效算法依据。
辅助驾驶 弱监督 视频实例分割 自适应生成调控 细粒度 assisted driving weakly supervised video instance segmentation adaptive generation regulation fine grain 
光学 精密工程
2023, 31(18): 2736
作者单位
摘要
昆明理工大学 机电工程学院,云南 昆明 650500
视频超分辨率(Video-Super Resolution,VSR)旨在将低分辨率视频帧序列重建为高分辨率视频帧序列。相较于图像超分辨率,VSR由于增加了时间维度的信息,因此通常需要依赖邻近帧高度相关信息实现当前帧的重建。如何对齐相邻帧,并获取帧间高度相关信息,是VSR任务关注的重点问题。本文将VSR任务分为去模糊、对齐、重建三个阶段。在去模糊阶段,将当前帧与相邻帧进行预对齐 ,获取与当前帧高度相关的特征信息,通过强化当前帧的细节以便实现初始阶段更多特征信息的提取。在对齐阶段,通过对输入特征进行二次对齐操作,利用相邻帧中高度相关信息进一步强化当前帧中特征信息。在重建阶段,通过聚合原始低分辨率帧以在网络末端提供更多特征信息。本文利用多层感知机(Multi-Layer Perceptron,MLP)代替传统卷积操作构造特征提取模块,同时对生成的特征信息进行二次对齐,以细化图像特征获得更优的视频帧重建效果。实验结果表明,本文提出的算法在多种公开数据集上的视频帧序列重建精度更高的同时,也取得了更少的网络参数量和更连贯的视频序列重建表现。
计算机视觉 视频超分辨率 多层感知机 注意力机制 光流 帧对齐 computer vision video super-resolution multi-layer perceptron attention mechanism optical flow frame alignment 
光学 精密工程
2023, 31(16): 2430
作者单位
摘要
昆明理工大学机电工程学院, 云南昆明 650000
甲烷是现代化工业生产和社会生活的重要能源之一, 实现其有效探测与分割对于及时发现甲烷泄漏事故并识别其扩散范围具有重要意义。针对红外成像条件下甲烷气体图像的轮廓模糊、泄漏的甲烷气体与背景对比度较低、形状易受大气流动因素影响等问题, 本文提出一种融合注意力分支特征的红外图像分割网络(Attention Branch Feature Network, ABFNet)实现甲烷气体泄漏探测。首先, 为增强模型对红外甲烷气体图像的特征提取能力, 设计分支特征融合模块将残差模块 1和残差模块 2的输出特征与残差模块 3以逐像素相加的方法融合, 获取红外甲烷气体图像丰富细致的特征表达以提高模型识别精度。其次, 为进一步加快模型的推理速度, 将标准瓶颈单元中的 3×3卷积替换为深度可分离卷积, 大幅度减少参数量达到实时检测甲烷气体泄漏。最后, 将 scSE注意力机制嵌入到分支特征融合模块, 更多地关注扩散区域边缘和中心语义信息以克服红外甲烷气体轮廓模糊对比度低等问题提高模型的泛化能力。实验结果表明, 本文提出的 ABFNet模型 AP50@95、AP50、AP60定量分割精度分别达到 38.23%、89.63%和 75.33%, 相比于原始 YOLACT模型分割精度, 分别提高 4.66%、3.76%和 7.04%, 推理速度达到 34.99帧/s, 满足实时检测需求。实验结果验证了本文算法对红外甲烷泄漏检测的有效性和工程实用性。
红外图像分割 甲烷泄漏 注意力分支特征 实时检测 infrared image segmentation, methane leaks, attent 
红外技术
2023, 45(4): 417
作者单位
摘要
昆明理工大学 机电工程学院, 云南 昆明 650500
氨气是重要的基础工业原材料,实现其非接触探测对于及时发现氨气泄漏,避免重大安全事故发生具有重要意义。针对常规氨气泄漏检测装置需等到氨气扩散到一定范围并与传感器接触时才能响应的不足,提出一种混洗自注意力网络(SSANet)模型实现氨气泄漏红外非接触检测。因红外热像仪获取的氨气泄漏图像含噪高、对比度低,故通过非局部均值去噪、限制对比度的自适应直方图均衡化预处理建立氨气泄漏红外检测数据集。SSANet模型在YOLOv5s基础上通过K-means算法聚类分析出适用于氨气泄漏红外检测的候选框以预置模型参数;采用轻量级ShuffleNetv2网络,将其Shuffle Block中的3×3的深度可分离卷积核替换为5×5,采用含有新卷积模块的SK5 Block对特征提取网络进行重构,使模型大小、计算量和参数量实现轻量化的同时提高检测精度;采用Transformer模块代替原网络瓶颈模块中的C3模块实现泄漏区域多头注意力自底向上融合,实现检测精度的再次提升。实验结果表明,SSANet模型较YOLOv5s基础模型大小和参数量分别减少76.40%、78.30%,降为3.40 M、1.53 M;单张图像平均检测速度提升1.10%,达到3.20 ms;平均检测精度提升3.50%,达到96.30%。本文为开发氨气泄漏非接触探测装置以保障涉氨企业的安全生产和稳定运行提供了一种有效的检测算法。
氨气泄漏检测 红外图像 聚类分析 轻量化结构 Transformer模块 ammonia leak detection infrared image cluster analysis lightweight structure transformer module 
中国光学
2023, 16(3): 607
作者单位
摘要
昆明理工大学 机电工程学院,昆明 650500
针对红外图像颜色、纹理等信息不够丰富,导致检测精度相较于可见光图像低;夜间红外行人目标检测模型参数量大、依赖高性能GPU资源,导致检测速度慢等问题,提出一种融合行人目标精细尺度嵌入的多检测层、轻量化实时检测模型。首先为了获取更精确的红外行人位置特征,在原始Yolov4-tiny结构上设计了64×64精细尺度检测层并增加残差结构加深主干网络,以融合红外行人的位置特征;其次针对红外行人目标宽高比相对固定的特点,应用K-means++聚类分析出适用于红外行人检测的先验框预置参数;最后为了减少模型参数,通过通批量归一化层道剪枝实现模型轻量化,同时利用知识蒸馏算法完成TIPRD的微量调控。实验结果表明,轻量化红外行人实时检测模型检测速度达到了88.7 帧/s,平均检测精度达到89.2%,模型大小为4 MB,相较于Yolov4-tiny平均检测精度提升了8.6%,模型大小缩小了19.5 MB,相较于Yolov4缩小了264 MB。在Jetson Nano移动开发平台部署该模型验证了实际工程应用的有效性,对开发汽车辅助驾驶系统以降低夜间交通事故发生率具有重要意义。
红外检测 深度学习 多检测层 模型剪枝 知识蒸馏 Infrared detection Deep learning Multiple detection layers Model pruning Knowledge distillation 
光子学报
2022, 51(9): 0910001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!