相同关键词【image recognition】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 中国科学院西安光学精密机械研究所，西安 710119

² 中国科学院大学，北京 100039

针对光路对接准直目标识别算法对双目标粘连状态无法判别的问题，提出了基于二进制大对象（Binary Large Object，BLOB）区域和边缘特征分析的准直图像双光学目标识别方法。首先，对二值化图像进行数字形态学处理，计算全图各BLOB区域的面积、中心、轴长、区域、有效BLOB区域个数等信息。其次，对有效BLOB区域个数大于1的完全分离双目标准直图像，统计各BLOB区域中心分别为位于两个面积最大的BLOB区域内的BLOB数量，数量小的候选BLOB区域为主激光目标，数量大的候选BLOB区域为模拟光目标。然后，对于有效BLOB区域个数等于1的待识别图像，从左、右、上、下4个方向分别提取模板边缘图像的有效坐标序列和待识别边缘图像坐标序列，搜索有效坐标序列和待识别边缘图像坐标序列的最大相关系数对应的有效坐标序列。当4个方向的相关系数全部大于0.95时，待识别图像为模拟光目标；当4个方向的相关系数都小于0.95时，待识别图像为主激光目标；否则待识别图像为粘连图像。实验结果表明：提出的双光学目标识别算法，不仅能够识别完全分离的模拟光目标和主激光目标，误差小于3个像素，处理时间小于1 s，而且能够判别处于粘连状态的光学目标和单个独立的光学目标，满足光路对接准直图像识别算法对于自适应性、精度和效率的要求。

光路对接准直 BLOB区域边缘特征分析双光学目标识别粘连图像识别 Optical path docking collimation BLOB region Edge feature analysis Dual optical target recognition Adhesion image recognition

PDF全文 Full Text

光子学报

2024, 53(2): 0210001

薄　膜

基于光致变色钙钛矿材料的非接触式图像识别

周星 ^1,2陈希 ^1,*

作者单位

摘要

¹ 上海理工大学光子芯片研究院，上海 200093

² 上海理工大学光电信息与计算机工程学院人工智能纳米光子学中心，上海 200093

视觉是人类获取信息的主要来源。用于视觉系统模拟的人工图像识别是发展人工智能技术的关键一环。当前，光电突触凭借存算一体式处理光信号的特点被广泛应用于视觉模拟领域，但是突触的光电转换需要对输入光信号进行接触式处理，从而导致大量的能量消耗。针对这个问题，研究了基于光致变色钙钛矿薄膜的全光人工突触，它在紫外和可见光触发下，从光透过率的变化上表现出显著的突触特性，包括配对脉冲易化和学习能力。利用循环神经网络处理随时间变化的透射率数据，实现了对数字图像的二元识别，识别精度从第1个循环就稳定在100%。该器件具有零功耗非接触式信息读取的特点，为视觉系统模拟开辟了一条新的途径。

光致变色材料钙钛矿人工突触图像识别 photochromic materials perovskite artificial synapse image recognition

PDF全文 Full Text

光学仪器

2024, 46(1): 55

综述

基于机器视觉的烟草在线检测技术研究进展

吴玉生 ^1,**李安虎 ^2,*万亚明 ²孟天晨 ²

作者单位

摘要

¹ 厦门烟草工业有限责任公司，福建厦门 361022

² 同济大学机械与能源工程学院，上海 201804

烟草行业高端产品规模的扩大与消费者对产品质量需求的提高，给烟草在线检测技术带来了巨大挑战。针对烟草生产过程中烟丝异物难以剔除，影响卷烟口感、烟草叶片病情害种类繁多且病情复杂、卷烟外包装瑕疵难以识别等问题，传统人工在线检测方法效率低下，且正确率难以保证，无法适应我国烟草行业的高质量发展。在阐明基于机器视觉的烟草在线检测原理的基础上，围绕视觉检测原理和深度学习模型两个方面系统地阐述烟草在线检测技术的研究现状与最新进展，结合现有典型应用分析不同视觉模型以及深度学习模型检测方法的优越性和局限性，进而探讨基于机器视觉的烟草在线检测技术的发展趋势和前景。

机器视觉图像识别深度学习在线检测瑕疵剔除

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0800003

面向长尾图像的个性化专家识别算法

吴磊 ^1,2,3韩华 ^1,2,3黄丽 ^1,2,3A.A.M.Muzahid ^1,2,3

作者单位

摘要

¹ 上海工程技术大学,电子电气工程学院

² 上海市数据智能技术及其应用协同创新中心

³ 上海市制造业数字化转型设计与验证专业技术服务平台,上海 201000

在图像识别的实际应用中, 不考虑人为平衡的因素, 其训练数据往往遵循长尾类分布。针对基于深度学习的长尾图像识别算法识别效果不佳, 中、尾部类别识别准确率不理想的问题, 提出了一种个性化专家识别算法(PMRA)。首先, 在残差网络的基础上集成多个分支构建多专家网络; 接着, 通过为不同专家分配个性化训练数据构建个性化学习模块以提高中、尾部类别的识别准确率, 通过专家信息融合反馈构建个性化信息增强模块处理中、尾部类别信息不足问题;在融合多个模块的专家网络中, 通过两阶段的学习来提高长尾图像的整体识别准确率; 最后, 在CIFAR-10-LT,CIFAR-100-LT,ImageNet-LT,iNaturalist2018基准数据集上的实验结果表明, 该算法在多个数据集上的识别准确率相比其他算法均有较大提升。

图像识别深度学习长尾分布集成学习个性化学习 image recognition deep learning long-tailed distribution ensemble learning personalized learning

PDF全文 Full Text

电光与控制

2023, 30(11):

学术研究

红外图像识别的Transformer频域可学习性方法

赖光明张倬实郭鑫平汪敏

作者单位

摘要

西南石油大学电气信息学院, 成都 610000

伴随工业自动化的发展, 红外图像识别技术更多地应用于自动化生产领域。红外图像存在噪点多、图像质量差、色彩信息缺失等特点。针对上述特点, 提出一种从红外图像频率信息出发, 对红外图像进行识别的检测方法——红外图像频域检测方法(IFDM)。首先, 有别于传统图像处理, 该方法从频域角度出发, 通过离散傅里叶变换, 将图像信息变换到频域, 有利于更好地把握红外图像特有的结构特征; 其次, 在频域进行可学习的频率信息筛选, 增强了模型的特征提取能力;最后, 引入了Transformer结构, 相较于CNN结构, 该结构能更好地整合图像中的全局信息。通过在3个特有的红外图像数据集上进行测试, 与其他算法在准确率以及模型收敛速度层面进行比较, 验证了该方法的可行性。

红外图像识别机器学习频率深度学习 infrared image recognition machine learning Transformer Transformer frequency deep learning

PDF全文 Full Text

电光与控制

2023, 30(8): 13

研究论文

轻量级红外刑侦图像目标识别算法

于晓许靖寓

作者单位

摘要

天津理工大学电气工程与自动化学院，天津300384

红外刑侦图像目标识别对刑事侦查具有重要意义，但刑事案件的侦破对时间和置信度要求较高。设计一种保持优异识别精度且具备较快识别速度的轻量级红外刑侦图像目标识别算法，具有十分重要的研究价值。因此借鉴生物免疫的优良特性，设计了免疫原性深度神经网络算法。该算法通过构建先天性免疫网络和适应性免疫网络来提取图像特征，然后设置免疫原性网络增强算法在处理图像特征映射时对不同通道之间优先级的调整能力，从而提高算法的精度和速度。实验结果表明，本文算法有效实现了红外刑侦图像的快速精准识别。与VGG16、VGG19、Resnet34、Resnet50、MobilenetV2等模型相比，本文算法不仅取得了994%的最高测试准确率，而且还具备最快的识别速度。

红外图像刑侦图像图像识别轻量级网络 infrared image criminal investigation image image recognition lightweight network

PDF全文 Full Text

红外

2023, 44(10): 0043

信息科学

模拟初级视觉皮层增强CNN神经网络结构的稳定性

张丽娟 ^1,2胡梦达 ²张紫薇 ²姜雨彤 ³李东明 ^1,*

作者单位

摘要

¹ 无锡学院物联网工程学院，江苏无锡2405

² 长春工业大学计算机科学与工程学院，吉林长春13001

³ 中国北方车辆研究所，北京100072

针对卷积网络模型的稳定性能较差，对抗训练方法会使得网络结构过于复杂并占用大量运算资源的问题，提出了一种基于人体视觉神经系统生物特征的卷积神经网络模型改进方法（VVNet）。在卷积神经网络的基础上，融合人体视觉的结构特征，在不增加网络层数或保持准确率不变的情况下，提高神经网络面对噪声干扰的稳定性。在数据集Cifar10上对3种不同神经网络模型（VVNet，VOneNet以及原网络模型）进行测试。实验结果表明，使用VVNet网络模型、VOneNet网络模型和原始的网络模型DenseNet121对四类图像（噪声图像、模糊图像、遮挡图像和饱和曝光图像）的分类准确率进行对比，验证了提出的VVNet网络结构对不同类型图像的分类准确率几乎不变，在使用对抗样本情况下，VVNet网络结构的图像分类准确率提高了约10%。与深度学习网络相比，基于人体视觉系统结构的网络能够在保持准确率的同时有效地提高神经网络的稳定性，并具有可移植性。

计算机视觉机器学习图像识别视觉皮层 computer vision machine learning image recognition visual cortex

PDF全文 Full Text

光学精密工程

2023, 31(15): 2287

大气光学与海洋光学

用于水下光通信高维调制与解调的轨道角动量叠加态

下载：532次

刘海达黑小兵杨洋谢元昊 [ ... ]李文东 ^*

作者单位

摘要

中国海洋大学物理与光电工程学院，山东青岛 266100

通过涡旋光束的轨道角动量的叠加态的识别研究，提出了一种在水下无线光通信中运用涡旋光束进行高维信息调制与解调的方法。给出了两种涡旋光束的叠加态的识别方法和流程，并对水信道传输后的叠加态的光强分布图进行了识别，得出叠加态中的拓扑荷数，以此通过实验论证了轨道角动量叠加态可在低拓扑荷数情况下实现16维信息的调制与解调，为涡旋光束在水下无线光通信中的应用提供了一种可行方案。

大气光学与海洋光学水下无线光通信涡旋光束轨道角动量空间光调制器图像识别

PDF全文 Full Text

激光与光电子学进展

2023, 60(9): 0901001

智能技术

基于SURF智能图像识别算法的变电设施管理研究

胡杰白钒何鹏杨超凡 [ ... ]孔硕颖

作者单位

摘要

国网江苏省电力工程咨询有限公司, 江苏南京 210024

我国电网技术正朝向信息化与智能化趋势发展, 针对性的管理平台研究是当前最为行之有效的电力相关工程施工与升级方式之一。基于图像识别与物联网技术设计了一个的变电设施管理系统, 其以SURF识别算法提取图像特征点并通过欧式距离法计算特征向量, 进而快速地识别变电设施图像, 以所建立的变电设施管理系统向现场施工人员提供工程情况、设施状态等多样化信息。同时在混合架构下开发智能应用程序, 以支持多种智能移动终端设备使用。本系统的开发与使用可提高涉及变电设施工程的施工效率, 进而降低相关工程施工、改建与监理成本。最后针对某变电站测试所设计的变电设施管理系统, 验证系统可靠性与有效性。

智能电网图像识别变电设施应用开发管理系统 smart grid image recognition substation facilities application development management system

PDF全文 Full Text

光学与光电技术

2023, 21(1): 129

图像处理

基于特征融合与注意力机制的野生菌细粒度分类

下载：528次

钱嘉鑫余鹏飞 ^*李海燕李红松

作者单位

摘要

云南大学信息学院，云南昆明 650500

鉴别野生菌的种类是预防误食有毒野生菌的重要途径。因此，为了提高野生菌细粒度识别分类的准确率，对卷积模块的注意力机制模块（CBAM）进行改进，提出了一种并行相加卷积模块的注意力机制模块PA_CBAM，将CBAM中的通道注意力模块和空间注意力模块从原来的串行连接改为并行连接并相加，解决了2种注意力模块因串行连接带来的互相干扰问题。另外，参考特征金字塔的思想改进ResNet50，其Top-1和Top-5准确率达到86.03%和97.19%，较原来提升0.86和0.73个百分点；其添加PA_CBAM后在Top-1和Top-5准确率达到88.52%、97.58%，较CBAM模块提高了3.03和0.69个百分点。此外，为了将模型移植到移动端，结合迁移学习，提出了MobileNet_v2+PA_CBAM的识别方法，准确率达到94.87%，较之前提升0.66个百分点。研究表明：提出的注意力机制模块PA_CBAM在野生菌细粒度识别研究中具有更好的识别效果，具有一定的泛用性，并且MobileNet_v2+PA_CBAM训练后模型大小仅为27.8 MB，识别图片的平均耗时仅为1.3 ms，是在移动端部署野生菌识别的理想模型。

图像识别细粒度分类特征融合注意力机制迁移学习

PDF全文 Full Text

激光与光电子学进展

2023, 60(4): 0410004

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索