相同关键词【Character recognition】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 武汉科技大学信息科学与工程学院，湖北武汉 430081

² 武汉科技大学教育部冶金自动化与检测技术工程研究中心，湖北武汉 430081

为了克服人工抄表效率低和现有图像识别方法对双半字符识别不准的问题，设计了基于窄带物联网（NB-IoT）技术和轻量级卷积神经网络（CNN）的字轮式仪表智能图像抄表系统。首先，图像采集终端用NB-IoT模组将摄像头获取的表盘图像上传至云平台；然后，使用局部特征提取与匹配方法估计仿射变换矩阵，将输入的表盘图像转换至模板图像所在坐标空间并分割出各个读数的字符子图像；最后，使用基于多标签分类的轻量级CNN模型识别这些子图像并通过后处理得到最终表盘读数结果。实验结果表明，系统的图像采集终端休眠电流小于10 μA，可确保2节锂亚电池工作5年以上；所提出的基于多标签分类的CNN模型能准确识别单字符和双半字符，达到了96.36%的字符识别准确率和94.15%的读数识别准确率，优于对比的其他识别算法。

窄带物联网自动抄表系统卷积神经网络双半字符识别多标签分类 NB-IoT automatic meter reading system CNN double half-character recognition multi-label classification

PDF全文 Full Text

液晶与显示

2023, 38(7): 985

图像处理

文本图像倾斜角度检测的深度卷积神经网络方法

下载：1151次

郭从洲 ^1,*李可 ¹朱奕坤 ¹童晓冲 ²王习文 ¹

作者单位

摘要

¹ 信息工程大学基础部, 河南郑州 450001

² 信息工程大学地理空间信息学院, 河南郑州 450001

文本图像倾斜校正是文字识别前端的重要预处理环节。为了克服现有方法的倾斜角度检测范围只在-90°~90°的缺点,将文本图像倾斜角度检测问题转换为倾斜角度类检测问题,利用深度卷积神经网络的分类功能,选取适当的损失函数,设计了一阶段二分类和多阶段多分类的检测结构,实现了多种文本图像倾斜角度类的检测,进而得到了文本图像的倾斜角度范围。实验结果表明,倾斜角度类的准确率、召回率和精确率都在0.93以上。利用经典深度学习的方法对经过倾斜校正后的文本图像进行文字识别,识别精确率比校正前有大幅度的提升。

图像处理文本图像倾斜角度卷积神经网络倾斜校正文字识别

PDF全文 Full Text

激光与光电子学进展

2021, 58(14): 1410007

RESEARCH ARTICLE

A CCD based machine vision system for real-time text detection

Shihua ZHAO ¹Lipeng SUN ¹Gang LI ²Yun LIU ¹Binbing LIU ^3,*

作者单位

摘要

¹ State Grid Hunan Electric Power Corporation Limited Research Institute, Changsha 410007, China

² State Grid Hunan Electric Power Corporation Limited, Changsha 410007, China

³ School of Optical and Electronics Information, Huazhong University of Science and Technology, Wuhan 430074, China

machine vision text detection optical character recognition (OCR) deep learning

PDF全文 Full Text

Frontiers of Optoelectronics

2020, 13(4): 418

机器视觉

基于循环神经网络的图像特定文本抽取方法

下载：1187次

杨恒杰闫铮邬宗玲方定邦段放 ^*

作者单位

摘要

华侨大学信息科学与工程学院, 福建厦门 361021

光学字符识别(OCR)难以针对图像中某些特定文本进行识别,尤其在实际场景中,识别结果通常会包含大量噪声文本。针对这一问题,提出一种基于循环神经网络的双向长短时记忆-条件随机场(BLSTM-CRF)模型。首先利用BLSTM网络捕获OCR识别结果中序列的上下文信息,得到特征序列;然后结合CRF建立模型特征与标签的关系,进行标签预测,通过标签即可得到特定文本。实验结果表明,该方法在场景图像数据集YNIDREAL上可以达到88.52%的准确率,相较于CRF模型,准确率提高了16.39个百分点,证明了本方法的可行性和稳健性。

机器视觉特定文本抽取光学字符识别双向长短时记忆网络条件随机场

PDF全文 Full Text

激光与光电子学进展

2019, 56(24): 241501

机器视觉

智能车道路场景数字字符识别技术

下载：830次

白睿徐友春李永乐 ^*李炯谢枫

作者单位

摘要

陆军军事交通学院, 天津 300161

针对道路场景中数字字符高噪声、多视角和难以定位识别的问题,提出了一种稳健的道路场景数字字符定位识别算法。采用基于色彩空间和边缘增强的最大稳定极值区域(MSER)算法来提取候选区域,设计了几何约束滤波器,并与笔画宽度变换(SWT)联合滤除非字符区域,得到字符定位结果。对Lenet-5中的收敛函数和池化窗进行改进,将定位后的字符区域归一化输入网络中,得到最终的字符识别结果。实验结果表明,本文算法的字符召回率达到90.0%,综合性能值达到0.89,字符识别率达到88.6%,优于同类算法性能。

机器视觉数字字符识别色彩空间最大稳定极值区域笔画宽度变换卷积神经网络

PDF全文 Full Text

激光与光电子学进展

2019, 56(19): 191506

信息科学

基于多级定向执行长度编码快速识别物体特征

王欢欢 ^1,*卞越新 ²王向军 ²

作者单位

摘要

¹ 天津科技大学机械工程学院, 天津 300222

² 天津大学微光机电系统技术教育部重点实验室, 天津 300072

提出了一种新的快速物体检测与识别方法, 用于检测和识别在运动过程中图像尺寸不断变化的物体。该方法基于多级定向执行长度编码法(MORLC)生成一种新的多级字节编码和物体特征样本形式, 其属于字符数据样本, 具有数据量小、占用存储空间少、构造过程简单、可根据不同的应用需求选择不同级次的样本形式等特点。对MORLC方法中二级字节编码和样本的系统理论进行了分析, 给出了利用MORLC二级字节编码和样本检测和识别运动物体的实验数据。对静态背景中的行人及位置进行了检测和识别实验, 结果显示多级字节编码和物体特征样本形式匹配处理速度快, 匹配和识别的鲁棒性好, 不易产生错误匹配。该方法特别适用于场景中由于被探测物体运动产生投影图像比例发生变化的情况, 即对图像大小不敏感。该方法的另一个突出优点是高的执行处理效率。

产品分类特征检测特征识别图像编码 product classification character inspection character recognition image coding

PDF全文 Full Text

光学精密工程

2014, 22(7): 1976

近场研究表面等离子体在银纳米线上的传输

刘爱萍 ^1,2,*任希锋 ^1,2

作者单位

摘要

¹ 中国科学技术大学中国科学院量子信息重点实验室，合肥 230026

² 中国科学技术大学量子信息与量子科技前沿协同创新中心，合肥 230026

通过双探针近场光学扫描显微镜在银纳米线上实现近场激发和近场收集表面等离子体，用一个探针在银纳米线的一端近场激发表面等离子体，另一个探针近场探测银纳米线上的表面等离子体强度分布，得到强度分布图.强度分布图显示表面等离子体在银纳米线的一端被有效激发并且有一部分表面等离子体沿着银纳米线和基底的界面传播到了另一端.用有限元法对银纳米线内的传播模式进行数值模拟，结果显示银纳米线内存在两种表面等离子体传播模式，分别为基模和高阶模.沿着银纳米线和基底介质之间传输的基模表面等离子体由于传输环境稳定，散射损耗小，实际传输长度接近模式传输长度，达10 μm以上;而高阶模表面等离子体由于部分裸露在空气中受表面缺陷散射的影响，散射损耗大，实际传输长度远小于模式传输长度.研究表明: 以能量高度束缚的基模表面等离子体作为载体，不仅可以实现低损耗传输，还可以减小集成器件之间的信号串扰，有效提高信息传输的安全性，在集成光学中具有重要应用.

表面等离子体集成光学近场光学扫描显微镜纳米线光学性质鉴定数值分析光学损耗 Surface plasmon resonance Integrated optics Near field scanning optical microscopy Nanowires Optical character recognition Numerical analysis Optical losses

PDF全文 Full Text

光子学报

2014, 43(4): 0424001

信息科学

基于分形维数和隐马尔科夫特征的车牌识别

耿庆田 ^1,2,*赵宏伟 ¹

作者单位

摘要

¹ 吉林大学计算机科学与技术学院，吉林长春 130012

² 长春师范大学计算机科学与技术学院，吉林长春 130032

针对现有车牌识别方法中车牌二值化和车牌字符识别效率不高的问题，提出一种基于分形维数和隐马尔科夫特征的车牌识别算法。该方法基于分形维数和隐马尔科夫特征并利用联合OC_SVM和MC_SVM的方法进行车牌识别。实验中，基于分形维数进行车牌的二值化处理；利用隐马尔科夫特征办法进行字符特征提取，然后利用多重分类器进行字符识别。对字符、英文字母和阿拉伯数字分别进行了800幅、800幅和1600幅图像的识别，得到的结果显示该算法对字符、英文字母和阿拉伯数字的识别率分别为98%、98.5%和98.9%,对各种不同的车牌整体识别的平均识别率高于90.60%。该方法识别效率高、鲁棒性强，为车牌识别的准确性提供了保证。

车牌识别二值化字符识别分形维数隐马尔科夫特征联合分类器 license plate recognition binarization character recognition fractal dimension hidden Markov feature joint classifier

PDF全文 Full Text

光学精密工程

2013, 21(12): 3198

信号与信息处理

基于序列图像的复杂背景下字符识别技术研究

姜月秋 ¹于大飞 ²高宏伟 ²

作者单位

摘要

¹ 沈阳理工大学通信与网络工程中心，辽宁沈阳 110159

² 沈阳理工大学信息科学与工程学院，辽宁沈阳 110159

针对舰船模型其横摆度与纵摆度量的检测问题，研究了一种基于序列图像的复杂背景下字符识别方法用以检测舰船模型的摆度量。首先利用背景图像相邻区域灰度值变化缓慢的特性，采用高斯低通滤波算法对图像背景进行实时更新；其次提出了一种基于差分图像统计信息的自适应阈值分割算法，用以消除光线和环境的变化对背景的影响；最后研究了基于改进扫描线算法与模板匹配算法的字符识别算法。实验结果表明，研究的算法可以在不同光照情况下完整、快速地识别出舰船模型上印刷的字符，完全可以用于摆度量的检测，具有较大的实用价值。

高斯滤波背景更新线性扫描图像分割字符识别 Gaussian low-pass filter background update linear sweep image segmentation character recognition

PDF全文 Full Text

光电技术应用

2012, 27(6): 55

图像与信号处理

基于BP神经网络的车牌字符识别算法研究

欧阳俊 ^*刘平

作者单位

摘要

国防科技大学ATR国防科技重点实验室, 湖南长沙 410073

车牌字符识别是车牌识别系统中的关键环节。采用图像处理和神经网络相结合的方法设计新的车牌字符识别算法，先对分割出的车牌字符进行归一化处理，然后进行SOBEL边缘检测和角点特征提取，最后输入BP神经网络进行训练、识别，其中BP神经网络模型属于改进型神经网络。通过一系列神经网络训练和仿真实验，车牌识别速度和正确率得到了明显的提高。

字符归一化边缘检测角点特征 BP神经网络车牌字符识别 character normalization edge detection operator angular point features BP neural network license plate character recognition

PDF全文 Full Text

光学与光电技术

2012, 10(5): 67

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索