基于词典的手写体字符串分割与识别及在日文地址阅读中的应用 |
| |
引用本文: | 陈嵩松,施鹏飞.基于词典的手写体字符串分割与识别及在日文地址阅读中的应用[J].图象识别与自动化,2003(1):15-21. |
| |
作者姓名: | 陈嵩松 施鹏飞 |
| |
摘 要: | 本文论述了基于大词汇量词典的日文邮件地址手写体字符串的识别系统,所用词典包含了lll,349个地址短语。在识别过程中,文本行图像与词典入口进行匹配,以获得可靠的分割和合理的地址短语。在预分割中,文本行图像通过连接组件分析和以边缘轮廓线分析为基础的粘连模式分裂被分割为原始的段。词典匹配中,连续的段动态地合并成候选字符模式。一个精确的字符分类器嵌入在词典匹配中,以此从动态分类集中选择候选模式匹配的字符。在词典匹配中,采用了一种Beam搜索策略来荻取实时识别的效果。在测试3589封实际邮件的实验中,本文提出的方法正确率达到了83.86%,而错误率小于l%。
|
关 键 词: | 日文地址阅读 手写体字符串识别 粘连字符分裂 词典匹配 边缘轮廓线 Beam搜索 |
本文献已被 维普 等数据库收录! |