作者单位
摘要
1 武汉科技大学 信息科学与工程学院,湖北 武汉 430081
2 武汉科技大学 教育部冶金自动化与检测技术工程研究中心,湖北 武汉 430081
为了克服人工抄表效率低和现有图像识别方法对双半字符识别不准的问题,设计了基于窄带物联网(NB-IoT)技术和轻量级卷积神经网络(CNN)的字轮式仪表智能图像抄表系统。首先,图像采集终端用NB-IoT模组将摄像头获取的表盘图像上传至云平台;然后,使用局部特征提取与匹配方法估计仿射变换矩阵,将输入的表盘图像转换至模板图像所在坐标空间并分割出各个读数的字符子图像;最后,使用基于多标签分类的轻量级CNN模型识别这些子图像并通过后处理得到最终表盘读数结果。实验结果表明,系统的图像采集终端休眠电流小于10 μA,可确保2节锂亚电池工作5年以上;所提出的基于多标签分类的CNN模型能准确识别单字符和双半字符,达到了96.36%的字符识别准确率和94.15%的读数识别准确率,优于对比的其他识别算法。
窄带物联网 自动抄表系统 卷积神经网络 双半字符识别 多标签分类 NB-IoT automatic meter reading system CNN double half-character recognition multi-label classification 
液晶与显示
2023, 38(7): 985
作者单位
摘要
1 信息工程大学基础部, 河南 郑州 450001
2 信息工程大学地理空间信息学院, 河南 郑州 450001
文本图像倾斜校正是文字识别前端的重要预处理环节。为了克服现有方法的倾斜角度检测范围只在-90°~90°的缺点,将文本图像倾斜角度检测问题转换为倾斜角度类检测问题,利用深度卷积神经网络的分类功能,选取适当的损失函数,设计了一阶段二分类和多阶段多分类的检测结构,实现了多种文本图像倾斜角度类的检测,进而得到了文本图像的倾斜角度范围。实验结果表明,倾斜角度类的准确率、召回率和精确率都在0.93以上。利用经典深度学习的方法对经过倾斜校正后的文本图像进行文字识别,识别精确率比校正前有大幅度的提升。
图像处理 文本图像 倾斜角度 卷积神经网络 倾斜校正 文字识别 
激光与光电子学进展
2021, 58(14): 1410007
作者单位
摘要
1 State Grid Hunan Electric Power Corporation Limited Research Institute, Changsha 410007, China
2 State Grid Hunan Electric Power Corporation Limited, Changsha 410007, China
3 School of Optical and Electronics Information, Huazhong University of Science and Technology, Wuhan 430074, China
machine vision text detection optical character recognition (OCR) deep learning 
Frontiers of Optoelectronics
2020, 13(4): 418
作者单位
摘要
华侨大学信息科学与工程学院, 福建 厦门 361021
光学字符识别(OCR)难以针对图像中某些特定文本进行识别,尤其在实际场景中,识别结果通常会包含大量噪声文本。针对这一问题,提出一种基于循环神经网络的双向长短时记忆-条件随机场(BLSTM-CRF)模型。首先利用BLSTM网络捕获OCR识别结果中序列的上下文信息,得到特征序列;然后结合CRF建立模型特征与标签的关系,进行标签预测,通过标签即可得到特定文本。实验结果表明,该方法在场景图像数据集YNIDREAL上可以达到88.52%的准确率,相较于CRF模型,准确率提高了16.39个百分点,证明了本方法的可行性和稳健性。
机器视觉 特定文本抽取 光学字符识别 双向长短时记忆网络 条件随机场 
激光与光电子学进展
2019, 56(24): 241501
作者单位
摘要
陆军军事交通学院, 天津 300161
针对道路场景中数字字符高噪声、多视角和难以定位识别的问题,提出了一种稳健的道路场景数字字符定位识别算法。采用基于色彩空间和边缘增强的最大稳定极值区域(MSER)算法来提取候选区域,设计了几何约束滤波器,并与笔画宽度变换(SWT)联合滤除非字符区域,得到字符定位结果。对Lenet-5中的收敛函数和池化窗进行改进,将定位后的字符区域归一化输入网络中,得到最终的字符识别结果。实验结果表明,本文算法的字符召回率达到90.0%,综合性能值达到0.89,字符识别率达到88.6%,优于同类算法性能。
机器视觉 数字字符识别 色彩空间 最大稳定极值区域 笔画宽度变换 卷积神经网络 
激光与光电子学进展
2019, 56(19): 191506
作者单位
摘要
1 天津科技大学 机械工程学院, 天津 300222
2 天津大学 微光机电系统技术教育部重点实验室, 天津 300072
提出了一种新的快速物体检测与识别方法, 用于检测和识别在运动过程中图像尺寸不断变化的物体。该方法基于多级定向执行长度编码法(MORLC)生成一种新的多级字节编码和物体特征样本形式, 其属于字符数据样本, 具有数据量小、占用存储空间少、构造过程简单、可根据不同的应用需求选择不同级次的样本形式等特点。对MORLC方法中二级字节编码和样本的系统理论进行了分析, 给出了利用MORLC二级字节编码和样本检测和识别运动物体的实验数据。对静态背景中的行人及位置进行了检测和识别实验, 结果显示多级字节编码和物体特征样本形式匹配处理速度快, 匹配和识别的鲁棒性好, 不易产生错误匹配。该方法特别适用于场景中由于被探测物体运动产生投影图像比例发生变化的情况, 即对图像大小不敏感。该方法的另一个突出优点是高的执行处理效率。
产品分类 特征检测 特征识别 图像编码 product classification character inspection character recognition image coding 
光学 精密工程
2014, 22(7): 1976
刘爱萍 1,2,*任希锋 1,2
作者单位
摘要
1 中国科学技术大学中国科学院量子信息重点实验室,合肥 230026
2 中国科学技术大学量子信息与量子科技前沿协同创新中心,合肥 230026
通过双探针近场光学扫描显微镜在银纳米线上实现近场激发和近场收集表面等离子体,用一个探针在银纳米线的一端近场激发表面等离子体,另一个探针近场探测银纳米线上的表面等离子体强度分布,得到强度分布图.强度分布图显示表面等离子体在银纳米线的一端被有效激发并且有一部分表面等离子体沿着银纳米线和基底的界面传播到了另一端.用有限元法对银纳米线内的传播模式进行数值模拟,结果显示银纳米线内存在两种表面等离子体传播模式,分别为基模和高阶模.沿着银纳米线和基底介质之间传输的基模表面等离子体由于传输环境稳定,散射损耗小,实际传输长度接近模式传输长度,达10 μm以上;而高阶模表面等离子体由于部分裸露在空气中受表面缺陷散射的影响,散射损耗大,实际传输长度远小于模式传输长度.研究表明: 以能量高度束缚的基模表面等离子体作为载体,不仅可以实现低损耗传输,还可以减小集成器件之间的信号串扰,有效提高信息传输的安全性,在集成光学中具有重要应用.
表面等离子体 集成光学 近场光学扫描显微镜 纳米线 光学性质鉴定 数值分析 光学损耗 Surface plasmon resonance Integrated optics Near field scanning optical microscopy Nanowires Optical character recognition Numerical analysis Optical losses 
光子学报
2014, 43(4): 0424001
作者单位
摘要
1 吉林大学 计算机科学与技术学院,吉林 长春 130012
2 长春师范大学 计算机科学与技术学院,吉林 长春 130032
针对现有车牌识别方法中车牌二值化和车牌字符识别效率不高的问题,提出一种基于分形维数和隐马尔科夫特征的车牌识别算法。该方法基于分形维数和隐马尔科夫特征并利用联合OC_SVM和MC_SVM的方法进行车牌识别。实验中,基于分形维数进行车牌的二值化处理;利用隐马尔科夫特征办法进行字符特征提取,然后利用多重分类器进行字符识别。对字符、英文字母和阿拉伯数字分别进行了800幅、800幅和1600幅图像的识别,得到的结果显示该算法对字符、英文字母和阿拉伯数字的识别率分别为98%、98.5%和98.9%,对各种不同的车牌整体识别的平均识别率高于90.60%。该方法识别效率高、鲁棒性强,为车牌识别的准确性提供了保证。
车牌识别 二值化 字符识别 分形维数 隐马尔科夫特征 联合分类器 license plate recognition binarization character recognition fractal dimension hidden Markov feature joint classifier 
光学 精密工程
2013, 21(12): 3198
作者单位
摘要
1 沈阳理工大学通信与网络工程中心, 辽宁 沈阳 110159
2 沈阳理工大学信息科学与工程学院, 辽宁 沈阳 110159
针对舰船模型其横摆度与纵摆度量的检测问题,研究了一种基于序列图像的复杂背景下字符识别方法用以检测舰船模型的摆度量。首先利用背景图像相邻区域灰度值变化缓慢的特性,采用高斯低通滤波算法对图像背景进行实时更新;其次提出了一种基于差分图像统计信息的自适应阈值分割算法,用以消除光线和环境的变化对背景的影响;最后研究了基于改进扫描线算法与模板匹配算法的字符识别算法。实验结果表明,研究的算法可以在不同光照情况下完整、快速地识别出舰船模型上印刷的字符,完全可以用于摆度量的检测,具有较大的实用价值。
高斯滤波 背景更新 线性扫描 图像分割 字符识别 Gaussian low-pass filter background update linear sweep image segmentation character recognition 
光电技术应用
2012, 27(6): 55
作者单位
摘要
国防科技大学ATR国防科技重点实验室, 湖南 长沙 410073
车牌字符识别是车牌识别系统中的关键环节。采用图像处理和神经网络相结合的方法设计新的车牌字符识别算法,先对分割出的车牌字符进行归一化处理,然后进行SOBEL边缘检测和角点特征提取,最后输入BP神经网络进行训练、识别,其中BP神经网络模型属于改进型神经网络。通过一系列神经网络训练和仿真实验,车牌识别速度和正确率得到了明显的提高。
字符归一化 边缘检测 角点特征 BP神经网络 车牌字符识别 character normalization edge detection operator angular point features BP neural network license plate character recognition 
光学与光电技术
2012, 10(5): 67

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!