1 武汉职业技术学院, 湖北 武汉 430074
2 广西电力职业技术学院, 广西 南宁 530001
为解决复杂背景中难以有效提取场景文本的问题, 提出了一种基于多特征检测与支持向量回归的图像文本提取方案。为有效区分文本与非文本边缘, 基于图像边缘, 提取场景中三个文本特征。将得到的三个文本特征进行多尺度融合, 利用文本融合特征检测候选文本边界, 有助于检测不同大小的文本, 提高对不同类型的图像退化的鲁棒性。对于每个检测到的候选文本边界, 根据邻域窗口中的像素来估计每个像素的局部阈值, 利用局部阈值自适应分割提取候选字符。引入支持向量回归模型对文本像素与图像背景精确分离, 消除非文本边界, 提取真实字符和单词。实验表明: 与当前文章提取技术相比, 所提方法具有更好的鲁棒性, 能适用各种变化的复杂场景文本提取, 具有更优的Precision-Recall曲线与F测量值。
文本提取 支持向量回归 多特征检测 局部阈值 文本边界 图像边缘 text extraction support vector regression multi-feature detection local threshold text boundary image edge