作者单位
摘要
1 中国科学院西安光学精密机械研究所,西安 710119
2 中国科学院大学,北京 100039
针对光路对接准直目标识别算法对双目标粘连状态无法判别的问题,提出了基于二进制大对象(Binary Large Object,BLOB)区域和边缘特征分析的准直图像双光学目标识别方法。首先,对二值化图像进行数字形态学处理,计算全图各BLOB区域的面积、中心、轴长、区域、有效BLOB区域个数等信息。其次,对有效BLOB区域个数大于1的完全分离双目标准直图像,统计各BLOB区域中心分别为位于两个面积最大的BLOB区域内的BLOB数量,数量小的候选BLOB区域为主激光目标,数量大的候选BLOB区域为模拟光目标。然后,对于有效BLOB区域个数等于1的待识别图像,从左、右、上、下4个方向分别提取模板边缘图像的有效坐标序列和待识别边缘图像坐标序列,搜索有效坐标序列和待识别边缘图像坐标序列的最大相关系数对应的有效坐标序列。当4个方向的相关系数全部大于0.95时,待识别图像为模拟光目标;当4个方向的相关系数都小于0.95时,待识别图像为主激光目标;否则待识别图像为粘连图像。实验结果表明:提出的双光学目标识别算法,不仅能够识别完全分离的模拟光目标和主激光目标,误差小于3个像素,处理时间小于1 s,而且能够判别处于粘连状态的光学目标和单个独立的光学目标,满足光路对接准直图像识别算法对于自适应性、精度和效率的要求。
光路对接准直 BLOB区域 边缘特征分析 双光学目标识别 粘连图像识别 Optical path docking collimation BLOB region Edge feature analysis Dual optical target recognition Adhesion image recognition 
光子学报
2024, 53(2): 0210001
周星 1,2陈希 1,*
作者单位
摘要
1 上海理工大学 光子芯片研究院,上海 200093
2 上海理工大学 光电信息与计算机工程学院 人工智能纳米光子学中心,上海 200093
视觉是人类获取信息的主要来源。用于视觉系统模拟的人工图像识别是发展人工智能技术的关键一环。当前,光电突触凭借存算一体式处理光信号的特点被广泛应用于视觉模拟领域,但是突触的光电转换需要对输入光信号进行接触式处理,从而导致大量的能量消耗。针对这个问题,研究了基于光致变色钙钛矿薄膜的全光人工突触,它在紫外和可见光触发下,从光透过率的变化上表现出显著的突触特性,包括配对脉冲易化和学习能力。利用循环神经网络处理随时间变化的透射率数据,实现了对数字图像的二元识别,识别精度从第1个循环就稳定在100%。该器件具有零功耗非接触式信息读取的特点,为视觉系统模拟开辟了一条新的途径。
光致变色材料 钙钛矿 人工突触 图像识别 photochromic materials perovskite artificial synapse image recognition 
光学仪器
2024, 46(1): 55
作者单位
摘要
1 厦门烟草工业有限责任公司,福建 厦门 361022
2 同济大学机械与能源工程学院,上海 201804
烟草行业高端产品规模的扩大与消费者对产品质量需求的提高,给烟草在线检测技术带来了巨大挑战。针对烟草生产过程中烟丝异物难以剔除,影响卷烟口感、烟草叶片病情害种类繁多且病情复杂、卷烟外包装瑕疵难以识别等问题,传统人工在线检测方法效率低下,且正确率难以保证,无法适应我国烟草行业的高质量发展。在阐明基于机器视觉的烟草在线检测原理的基础上,围绕视觉检测原理和深度学习模型两个方面系统地阐述烟草在线检测技术的研究现状与最新进展,结合现有典型应用分析不同视觉模型以及深度学习模型检测方法的优越性和局限性,进而探讨基于机器视觉的烟草在线检测技术的发展趋势和前景。
机器视觉 图像识别 深度学习 在线检测 瑕疵剔除 
激光与光电子学进展
2024, 61(8): 0800003
吴磊 1,2,3韩华 1,2,3黄丽 1,2,3A.A.M.Muzahid 1,2,3
作者单位
摘要
1 上海工程技术大学,电子电气工程学院
2 上海市数据智能技术及其应用协同创新中心
3 上海市制造业数字化转型设计与验证专业技术服务平台,上海 201000
在图像识别的实际应用中, 不考虑人为平衡的因素, 其训练数据往往遵循长尾类分布。针对基于深度学习的长尾图像识别算法识别效果不佳, 中、尾部类别识别准确率不理想的问题, 提出了一种个性化专家识别算法(PMRA)。首先, 在残差网络的基础上集成多个分支构建多专家网络; 接着, 通过为不同专家分配个性化训练数据构建个性化学习模块以提高中、尾部类别的识别准确率, 通过专家信息融合反馈构建个性化信息增强模块处理中、尾部类别信息不足问题;在融合多个模块的专家网络中, 通过两阶段的学习来提高长尾图像的整体识别准确率; 最后, 在CIFAR-10-LT,CIFAR-100-LT,ImageNet-LT,iNaturalist2018基准数据集上的实验结果表明, 该算法在多个数据集上的识别准确率相比其他算法均有较大提升。
图像识别 深度学习 长尾分布 集成学习 个性化学习 image recognition deep learning long-tailed distribution ensemble learning personalized learning 
电光与控制
2023, 30(11):
作者单位
摘要
1 国网辽宁省电力有限公司, 辽宁沈阳, 110000
2 国网辽宁省电力有限公司电力科学研究院, 辽宁沈阳, 110000
3 国网辽宁省电力有限公司营口供电公司, 辽宁营口 115000
4 国网辽宁省电力有限公司锦州供电公司, 辽宁锦州 121000
5 国网辽宁省电力有限公司铁岭供电公司, 辽宁铁岭 112000
电力稳定器在电网中起到稳定电压的作用, 一旦该设备出现异常, 电网运输电力质量会受到直接影响。面对这种情况, 研究一种基于红外成像技术的中低压电网电力稳定器高温运行可靠性图像识别技术。该研究中利用红外成像技术采集电力稳定器图像并实施预处理。分割电力稳定器红外图像, 划分目标区域和背景区域。提取目标区域 5个直方图-阶统计特征。以 5个直方图-阶统计特征为基础, 结合判别系数, 构建分类器, 实现电力稳定器状态识别。针对存在异常的电力稳定器, 计算图像目标区域处的相对温差, 确定可靠性等级。结果表明: 5个测试稳定器中只有 2个稳定器处在异常状态, 具体为稳定器 2中组成部分 3异常, 稳定器 5中组成部分 1异常。稳定器 2组成部分 3相对温差为 82.32%, 对应可靠等级为 2级, 可靠性低; 稳定器 5组成部分 1相对温差为 91.35%, 对应可靠等级为 3级, 可靠性非常低。对比实验结果表明, 所提方法识别准确率达到 92.3%以上, 优于对比方法, 具有更大的应用价值。
红外成像技术 中低压电网 电力稳定器 可靠性 图像识别 infrared imaging technology, medium and low voltag 
红外技术
2023, 45(12): 1351
作者单位
摘要
西南石油大学电气信息学院, 成都 610000
伴随工业自动化的发展, 红外图像识别技术更多地应用于自动化生产领域。红外图像存在噪点多、图像质量差、色彩信息缺失等特点。针对上述特点, 提出一种从红外图像频率信息出发, 对红外图像进行识别的检测方法——红外图像频域检测方法(IFDM)。首先, 有别于传统图像处理, 该方法从频域角度出发, 通过离散傅里叶变换, 将图像信息变换到频域, 有利于更好地把握红外图像特有的结构特征; 其次, 在频域进行可学习的频率信息筛选, 增强了模型的特征提取能力;最后, 引入了Transformer结构, 相较于CNN结构, 该结构能更好地整合图像中的全局信息。通过在3个特有的红外图像数据集上进行测试, 与其他算法在准确率以及模型收敛速度层面进行比较, 验证了该方法的可行性。
红外图像识别 机器学习 频率深度学习 infrared image recognition machine learning Transformer Transformer frequency deep learning 
电光与控制
2023, 30(8): 13
作者单位
摘要
天津理工大学电气工程与自动化学院,天津300384
红外刑侦图像目标识别对刑事侦查具有重要意义,但刑事案件的侦破对时间和置信度要求较高。设计一种保持优异识别精度且具备较快识别速度的轻量级红外刑侦图像目标识别算法,具有十分重要的研究价值。因此借鉴生物免疫的优良特性,设计了免疫原性深度神经网络算法。该算法通过构建先天性免疫网络和适应性免疫网络来提取图像特征,然后设置免疫原性网络增强算法在处理图像特征映射时对不同通道之间优先级的调整能力,从而提高算法的精度和速度。实验结果表明,本文算法有效实现了红外刑侦图像的快速精准识别。与VGG16、VGG19、Resnet34、Resnet50、MobilenetV2等模型相比,本文算法不仅取得了994%的最高测试准确率,而且还具备最快的识别速度。
红外图像 刑侦图像 图像识别 轻量级网络 infrared image criminal investigation image image recognition lightweight network 
红外
2023, 44(10): 0043
作者单位
摘要
1 无锡学院 物联网工程学院,江苏无锡2405
2 长春工业大学 计算机科学与工程学院,吉林长春13001
3 中国北方车辆研究所,北京100072
针对卷积网络模型的稳定性能较差,对抗训练方法会使得网络结构过于复杂并占用大量运算资源的问题,提出了一种基于人体视觉神经系统生物特征的卷积神经网络模型改进方法(VVNet)。在卷积神经网络的基础上,融合人体视觉的结构特征,在不增加网络层数或保持准确率不变的情况下,提高神经网络面对噪声干扰的稳定性。在数据集Cifar10上对3种不同神经网络模型(VVNet,VOneNet以及原网络模型)进行测试。实验结果表明,使用VVNet网络模型、VOneNet网络模型和原始的网络模型DenseNet121对四类图像(噪声图像、模糊图像、遮挡图像和饱和曝光图像)的分类准确率进行对比,验证了提出的VVNet网络结构对不同类型图像的分类准确率几乎不变,在使用对抗样本情况下,VVNet网络结构的图像分类准确率提高了约10%。与深度学习网络相比,基于人体视觉系统结构的网络能够在保持准确率的同时有效地提高神经网络的稳定性,并具有可移植性。
计算机视觉 机器学习 图像识别 视觉皮层 computer vision machine learning image recognition visual cortex 
光学 精密工程
2023, 31(15): 2287
陈龙 1,2张建林 1,*彭昊 1,2李美惠 1[ ... ]魏宇星 1
作者单位
摘要
1 中国科学院光电技术研究所,四川 成都 610209
2 中国科学院大学电子电气与通信工程学院,北京 100049
To improve the performance of few-shot classification, we present a general and flexible method named Multi-Scale Attention and Domain Adaptation Network (MADA). Firstly, to tackle the problem of limited samples, a masked autoencoder is used to image augmentation. Moreover, it can be inserted as a plug-and-play module into a few-shot classification. Secondly, the multi-scale attention module can adapt feature vectors extracted by embedding function to the current classification task. Multi-scale attention machine strengthens the discriminative image region by focusing on relating samples in both base class and novel class, which makes prototypes more accurate. In addition, the embedding function pays attention to the task-specific feature. Thirdly, the domain adaptation module is used to address the domain shift caused by the difference in data distributions of the two domains. The domain adaptation module consists of the metric module and the margin loss function. The margin loss pushes different prototypes away from each other in the feature space. Sufficient margin space in feature space improves the generalization performance of the method. The experimental results show the classification accuracy of the proposed method is 67.45% for 5-way 1-shot and 82.77% for 5-way 5-shot on the miniImageNet dataset. The classification accuracy is 70.57% for 5-way 1-shot and 85.10% for 5-way 5-shot on the tieredImageNet dataset. The classification accuracy of our method is better than most previous methods. After dimension reduction and visualization of features by using t-SNE, it can be concluded that domain drift is alleviated, and prototypes are more accurate. The multi-scale attention module enhanced feature representations are more discriminative for the target classification task. In addition, the domain adaptation module improves the generalization ability of the model.
小样本图像识别 注意力机制 领域自适应 相似性度量 few-shot image classification attention mechanism domain adaptation similarity metric 
光电工程
2023, 50(4): 220232
作者单位
摘要
中国海洋大学物理与光电工程学院,山东 青岛 266100
通过涡旋光束的轨道角动量的叠加态的识别研究,提出了一种在水下无线光通信中运用涡旋光束进行高维信息调制与解调的方法。给出了两种涡旋光束的叠加态的识别方法和流程,并对水信道传输后的叠加态的光强分布图进行了识别,得出叠加态中的拓扑荷数,以此通过实验论证了轨道角动量叠加态可在低拓扑荷数情况下实现16维信息的调制与解调,为涡旋光束在水下无线光通信中的应用提供了一种可行方案。
大气光学与海洋光学 水下无线光通信 涡旋光束 轨道角动量 空间光调制器 图像识别 
激光与光电子学进展
2023, 60(9): 0901001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!