基于Mask-RCNN无分割手写数字字符串的识别 下载: 1120次
Unsegmented Recognition of Handwritten Numerical Strings Based on Mask-RCNN
1 辽宁工程技术大学电子与信息工程学院, 辽宁 葫芦岛 125105
2 阜新力兴科技有限责任公司, 辽宁 阜新 123000
图 & 表
图 1. Mask-RCNN结构
Fig. 1. Mask-RCNN structure
下载图片 查看原文
图 2. RPN工作机制
Fig. 2. RPN working mechanism
下载图片 查看原文
图 3. ROI Align层算法原理示意图
Fig. 3. Schematic principle of ROI Align layer algorithm
下载图片 查看原文
图 4. 孤立数字集合
Fig. 4. Isolated number set
下载图片 查看原文
图 5. 多位数字字符串集合
Fig. 5. Multi-digit string set
下载图片 查看原文
图 6. 损失变化曲线。(a)网络总损失;(b)边框回归损失;(c)掩模损失;(d)分类损失
Fig. 6. Loss change curves. (a) Total network loss; (b) frame regression loss; (c) mask loss; (d) classification loss
下载图片 查看原文
表 1训练集与测试集的数据量分配
Table1. Data amount distribution of training dataset and test dataset
Type | 1-digit | 2-digits | 3-digits | 4-digits | 5-digits | 6-digits |
---|
Training | 2240 | 1680 | 1120 | 560 | 560 | 560 | Test | 960 | 720 | 480 | 240 | 240 | 240 |
|
查看原文
表 2实验参数设置
Table2. Experimental parameters setting
Parameter | Value |
---|
Number of training datasets | 6720 | Number of test datasets | 2880 | Step per epoch | 30 | Batch | 224 | Epochλ | 3005×10-4 |
|
查看原文
表 3Mask-RCNN在测试数据集上的准确率
Table3. Mask-RCNN accuracy rate on test dataset
Type | 1-digit | 2-digits | 3-digits | 4-digits | 5-digits | 6-digits |
---|
Accuracy rate /% | 99.9 | 98.9 | 98.5 | 97.1 | 96.3 | 95.9 |
|
查看原文
表 4不同识别方法在NIST SD19数据集上的比较
Table4. Comparison of different identification methods on NIST SD19 datasetunit: %
Method | 1-digit | 2-digits | 3-digits | 4-digits | 5-digits | 6-digits | Overall |
---|
Ref. [20] | - | 94.8 | 91.6 | 91.3 | 88.3 | 89.0 | 91.0 | Ref. [21] | - | 97.6 | 96.2 | 94.2 | 94.0 | 93.8 | 95.2 | Ref. [22] | - | 98.9 | 97.2 | 96.1 | 95.8 | 96.1 | 96.8 | Ref. [23] | - | 99.0 | 97.3 | 96.5 | 95.9 | 96.6 | 97.1 | Ref. [6] | 99.6 | 97.6 | 96.2 | 94.6 | - | - | 97.0 | Proposed | 99.9 | 98.9 | 98.5 | 97.1 | 96.3 | 95.9 | 97.8 |
|
查看原文
陶志勇, 韩月明, 林森. 基于Mask-RCNN无分割手写数字字符串的识别[J]. 激光与光电子学进展, 2020, 57(14): 141012. Zhiyong Tao, Yueming Han, Sen Lin. Unsegmented Recognition of Handwritten Numerical Strings Based on Mask-RCNN[J]. Laser & Optoelectronics Progress, 2020, 57(14): 141012.