作者单位
摘要
北京信息科技大学理学院,北京 100101
针对光场成像的空间域图像分辨率限制,提出一种基于自监督学习的空间域图像超分辨成像方法。利用深度学习中的自编码器,对全部光场子孔径图像同步进行空间域的超分辨重构。设计一种基于多尺度特征结构和全变差正则化的混合损失函数,约束模型输出图像与原始低分辨率图像的相似度。数值实验结果表明,所提方法对噪声具有抑制作用,在光场成像的不同数据集上的超分辨结果平均值超过基于有监督学习的光场空间域超分辨方法。
光场 超分辨 自监督学习 深度学习 
激光与光电子学进展
2024, 61(4): 0411007
Author Affiliations
Abstract
1 School of Instrumentation Science and Engineering, Harbin Institute of Technology, Harbin, China
2 Research Center of Laser Fusion, China Academy of Engineering Physics, Mianyang, China
Segmenting dark-field images of laser-induced damage on large-aperture optics in high-power laser facilities is challenged by complicated damage morphology, uneven illumination and stray light interference. Fully supervised semantic segmentation algorithms have achieved state-of-the-art performance but rely on a large number of pixel-level labels, which are time-consuming and labor-consuming to produce. LayerCAM, an advanced weakly supervised semantic segmentation algorithm, can generate pixel-accurate results using only image-level labels, but its scattered and partially underactivated class activation regions degrade segmentation performance. In this paper, we propose a weakly supervised semantic segmentation method, continuous gradient class activation mapping (CAM) and its nonlinear multiscale fusion (continuous gradient fusion CAM). The method redesigns backpropagating gradients and nonlinearly activates multiscale fused heatmaps to generate more fine-grained class activation maps with an appropriate activation degree for different damage site sizes. Experiments on our dataset show that the proposed method can achieve segmentation performance comparable to that of fully supervised algorithms.
class activation maps laser-induced damage semantic segmentation weakly supervised learning 
High Power Laser Science and Engineering
2024, 12(1): 010000e4
作者单位
摘要
1 南京航空航天大学 民航学院,江苏 南京 211106
2 光电信息控制和安全技术重点实验室,天津 300308
从热红外图像对比度低、细节信息不足等特点出发,提出了一种面向热红外图像的景深估计方法。首先,设计了一种红外特征聚合模块,提高了对目标物边缘和小目标的全方位深度信息获取能力;其次,在特征融合模块中引入了通道注意力机制,进一步融合通道间的交互信息;在此基础上,建立了一种深度估计网络,实现热红外图像的像素级景深估计。消融实验与对比实验的结果表明,该方法在热红外图像像素级景深估计中性能优于其他代表性方法。
红外图像 无监督学习 单目深度估计 特征聚合 通道注意力机制 thermal infrared image self-supervised learning monocular depth estimation feature aggregation channel attention mechanism 
红外与毫米波学报
2023, 42(6): 906
作者单位
摘要
1 北京航空航天大学 仪器科学与光电工程学院 精密光机电一体化教育部重点实验室,北京009
2 季华实验室 智能机器人工程研究中心,广东佛山5800
在室内实例物体目标检测中,传统深度学习需要大量人工标注的训练样本进行网络训练,费时费力,为此提出并实现了一种采用奇异值分解(Singular Value Decomposition,SVD)和协同训练的半监督实例级目标检测网络SVD-RCNN。挑选关键样本进行人工标注并预训练SVD-RCNN,以确保其获取更多先验知识,采用基于SVD的收敛-分解-微调策略,在SVD-RCNN中得到两个较强独立性的检测器以满足协同训练的要求,最后提出一种自适应的自标注策略,获得高质量的自标注及检测结果。在多个室内实例数据集上对该方法进行测试,在GMU数据集上只需人工标注199个样本,均值平均精度(mean Average Precision,mAP)达到了79.3%,相较于需标注3 851个样本的全监督Faster RCNN的81.3% mAP仅下降了2%。消融实验及系列实验证明了本文方法的有效性和普适性,本文提出的方法仅需人工标注5%的训练数据,即可达到与全监督学习相当的实例级目标检测精度,有利于智能机器人高效识别不同实例物体的实际应用。
计算机视觉 目标检测 半监督学习 自标注 computer vision object detection semi-supervised learning self-labeling 
光学 精密工程
2023, 31(13): 2000
作者单位
摘要
浙江大学信息与电子工程学院,浙江 杭州 310027
为提高红外图像中目标检测的精度,提出一种基于CenterNet与OMix增强的半监督红外图像目标检测算法(IRCC-OMix)。针对红外图像中锚框先验信息难以确定的问题,利用CenterNet作为主干模型,通过关键点检测红外图像中的目标。由于红外图像标注成本昂贵,引入基于教师学生网络互学习的半监督学习方法,设计基于CenterNet与基于一致性的半监督红外图像目标检测(IRCC)模型。IRCC模型中的随机擦除(cutout)增强可能导致红外图像中的小目标消失,影响模型检测性能,因此采用一种基于目标的图像混合增强方法,提升算法对小目标的检测能力。在公开数据集FLIR上的实验结果表明,IRCC模型的平均精度均值(mAP)达到55.3%,与仅使用有标签数据训练情况相比,mAP提升1.9个百分点,说明该模型能够充分利用无标签数据、提高模型的鲁棒性。基于OMix增强的IRCC模型的mAP为56.8%,与使用cutout增强的IRCC模型相比提高1.5个百分点,取得了良好的检测性能。
图像处理 目标检测 卷积神经网络 红外图像 半监督学习 
激光与光电子学进展
2023, 60(14): 1428005
作者单位
摘要
1 中山大学物理学院, 广州 510275
2 广东省磁电物性分析与器件重点实验室, 广州 510275
在常压下寻找新型高温超导材料是物理和材料领域共同关注的热点问题。近年来, 机器学习技术和大数据成功地解决了材料特性与复杂物理因素之间关系建模的难题, 在新型材料的优化设计中获得了重要应用。然而利用机器学习在材料数据库中寻找常规Bardeen-Cooper-Schrieffer (BCS)超导材料, 存在可用数据量少的问题, 导致设计出的超导材料种类少, 结构构型单一。结合BCS超导理论和半监督学习方法, 发展了神经网络模型预测BCS超导体。通过充分利用材料数据库中大量的无标签数据, 即未知超导温度但已知电子结构的晶体材料, 使得训练出的分类模型准确性达72%。模型预测出数十种可常压下存在的新型BCS超导材料, 其中B-C和B-C-N体系的超导温度最高可达约60 K, 高于MgB2的39 K超导纪录。
高温超导 半监督学习 材料设计 神经网络 high-temperature superconductors semi-supervised learning materials design neural networks 
硅酸盐学报
2023, 51(2): 411
作者单位
摘要
河北工业大学机械工程学院,天津 300401
针对传统表面缺陷检测无法适应工业复杂背景等问题,提出一种基于特征金字塔匹配和自监督的表面缺陷检测算法。首先,将两个基于通道注意力的残差网络提取的特征构成金字塔,根据网络各层输出的差异找到缺陷。其次,网络预训练的方式上采用了自我引导潜能(BYOL)自监督学习,经过自监督学习的网络可以提取通用特征,并提高缺陷检测方法的泛化性。最后,在遇到模糊图像时,采用基于不同分辨率的蒸馏训练来让学生网络充分学会提取图像的深度特征。对所提算法在3个数据集上进行了测试,实验结果证明,所提方法好于对照组,具有更高的缺陷检测精度。
图像处理 缺陷检测 特征金字塔 自监督学习 知识蒸馏 预训练网络 
激光与光电子学进展
2023, 60(4): 0415006
作者单位
摘要
江南大学人工智能与计算机学院,江苏 无锡 214122
为了能够在图像质量评价领域实现自监督学习,提出一种基于半监督学习的双分支网络训练的无参考图像质量评价算法。它是具有两个分支的训练过程,其中在一个分支使用少量手工标记数据样本来进行有监督学习,在另一个分支进行自监督学习来辅助前者训练同一个特征提取器,自监督学习部分采用几种传统的全参考方法联合为训练样本打上软标签。在6个公开的图像数据库中进行大量实验,结果表明所提算法不仅在合成失真图像数据集上优于目前大多数方法,而且在真实失真图像数据集上具有良好的泛化性能,预测结果与人类主观感知表现一致。
图像质量评价 特征提取 自监督学习 无参考 联合训练 
激光与光电子学进展
2023, 60(4): 0410023
作者单位
摘要
江南大学物联网工程学院轻工过程先进控制教育部重点实验室,江苏 无锡 214122
目前基于图像级注释信息的主流弱监督目标检测算法常常出现局部定位问题,仅仅关注图像中局部高辨别性的区域,却忽略了完整的目标。为了解决这种问题,提出了一种端对端的基于特征自蒸馏的弱监督目标检测网络(FSD-Net),其中可拆卸的特征自蒸馏模块充分利用不同层级特征表示中的细节信息和语义信息,并通过特征自蒸馏损失约束网络训练,在未增加测试期计算代价的前提下增强了检测器综合性能;同时构造回归分支简单却有效地提取并利用特征中隐性位置信息,并通过改善监督信息生成算法、平衡优化损失等策略进一步改善了弱监督目标检测器的局部定位问题。在Pascal VOC 2007、VOC 2012、MS-COCO等大规模公开数据集上的实验结果表明,FSD-Net拥有比Baseline及近年主流方法更好的检测性能,有效地缓解了局部定位问题。
图像处理 目标检测 深度学习 弱监督学习 特征自蒸馏 
激光与光电子学进展
2023, 60(4): 0410009
作者单位
摘要
1 烟台大学 物理与电子信息学院,山东烟台264005
2 天津津航技术物理研究所,天津300308
红外图像的场景感知与分类分级是图像识别的一项关键技术,对于红外侦察与制导具有重要意义。为有效解决红外图像多场景多目标的场景感知及分类分级的问题,本文提出一种基于弱监督学习的多标签红外图像分类算法。将多标签图像分类技术应用于红外前视图像领域,针对多场景的红外图像进行弱监督的图像级标注,使用主干网络Resnet-50对图像进行特征提取;引入类特定的空间残差注意力模块CSRA以捕捉图像中不同类别所占据的不同空间区域,提高类别特征的表达性能;引入先进的损失函数ASL以解决多标签分类中正负标签数量失衡问题,使训练过程中更多地关注阳性样本,提高检测准确率。试验结果表明,本文算法对于多场景多目标的红外图像分类具有更好的适应性和准确率,算法检测率可达90%以上,能够很好地完成红外图像分类分级任务。
弱监督学习 多标签分类 红外图像 场景感知 weakly supervised learning multi-label classification infrared image context awareness 
光学 精密工程
2022, 30(20): 2501

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!