作者单位
摘要
1 西北民族大学数学与计算机科学学院, 甘肃 兰州 730030
2 西北民族大学中国民族语言文字处理教育部重点实验室, 甘肃 兰州 730030
3 阜阳师范大学计算机与信息工程学院, 安徽 阜阳 236041
版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平滑,寻找连通区域,实现版面分割;根据各版面元素的外轮廓特征,简单区分文本区域与非文本区域;利用藏文文本识别器识别文本区域,再用可扩展标记语言记录版面信息,实现版面描述。在藏文中小学教材文档和铅印版藏文文档图像上的实验表明,该方法能够取得较好的版面分析结果。
图像处理 藏文文档图像 版面分割 版面描述 自适应游程平滑 
激光与光电子学进展
2021, 58(14): 1410006
作者单位
摘要
1 西北民族大学中国民族语言文字信息技术教育部重点实验室, 甘肃 兰州 730030
2 西北民族大学数学与计算机科学学院, 甘肃 兰州 730030
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
图像处理 藏文古籍文档图像 文本行切分 文字核心区域 扩展生长 
激光与光电子学进展
2021, 58(2): 0210008
作者单位
摘要
1 燕山大学 信息科学与工程学院, 河北 秦皇岛 066004
2 燕山大学 河北省测试计量技术及仪器重点实验室, 河北 秦皇岛 066004
3 中国石油天然气管道通信电力工程总公司, 河北 廊坊 065000
本文提出一种新的基于 Curvelet变换的文本图像二值化处理方法, 以消除文本图像中局部高亮度区域对二值化图像质量的影响。首先对具有局部高亮度区域干扰的原始文本图像进行 Curvelet变换, 得到图像在曲波域的 Curvelet系数集; 然后根据各 Curvelet系数所表征的图像特征, 对 Curvelet系数进行非线性增强, 以优化文本图像的直方图分布; 对增强的 Curvelet系数集进行反变换, 得到直方图优化后的时域图像, 进而应用 Otsu方法实现文本图像二值化。应用本文方法对具有带状及点状局部高亮度区域的文本图像进行二值化处理, 并采用 ABBYY FineReader10对二值图像进行 OCR识别。实验结果表明, 通过本文提出的处理方法所得到的二值化图像, 其字符的 OCR识别准确率最高可达 94.81%, 优于其他四种典型的图像二值化处理方法。
文本图像二值化 局部高亮干扰 多尺度处理 Curvelet变换 document image binarization local highlight interference multi-scale processing Curvelet transform 
光电工程
2012, 39(11): 75
作者单位
摘要
上海交通大学,图像处理与模式识别研究所,上海,200030
提出了一种将彩色文本图像分割为背景、图像、文字和图形区域的算法.该算法在一种改进的RGB-椭圆彩色模型上,对每一个分量进行若干次小波变换后的高频小波系数块进行直方图特征分析,并应用粗糙集的分类思想,将彩色文本图像分割为相应的区域.实验结果表明,该算法能得到较好的分割效果.
彩色文本图像分割 图像小波变换 直方图特征分析 RGB-椭圆彩色模型 粗糙集 Color document image segmentation Image wavelet transform Histogram feature analysis RGB-ellipse color model Rough set 
红外与激光工程
2003, 32(6): 617
作者单位
摘要
1 天津大学电子信息工程学院,天津,300072
2 天津津航技术物理研究所,天津,300192
在OCR图像扫描输入的过程中,扫描图像经常会出现某种程度的倾斜,这种倾斜会给下一个字符的切割造成困难,影响字符识别的精度.正是出于检测倾斜文本图像角度的目的,提出一种基于Hough变换的检测图像倾斜度的方法,可以有效地克服几何失真对文字识别系统的影响.为了克服Hough变换计算量大的缺点,该方法采用了提取图像特征点的方法.实验结果表明,该方法能快速准确地测出各类文本图像的倾斜角度,并且具有很好的适应性.
角度检测 Hough变换 文本图像 文字识别 Angle detection Hough transform Document image Character recognition 
红外与激光工程
2002, 31(4): 315

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!