共查询到19条相似文献,搜索用时 62 毫秒
1.
一种手写体大写金额串的分割新方法 总被引:3,自引:0,他引:3
手写体大写金额串的分割将直接影响识别的准确率。为了提高分割的准确率,同时保证较快的分割速度,本文采用了由粗分割和细分割组成的两步分割方法。重点介绍交叉字符和相连字符的分割方法。对于交叉的字符提出了加窗处理的中点连线分割方法,它较其它方法具有简单准确的优点;对于单笔相连的字符,先在细化字符图象上找到候选笔划的候选分割点,然后用本文提出的简明的评价准则来确定最优分割点,提高了粗分割的精度。上述方法应用于银行支票手写体大写金额的分割,取得了很好的分割效果。 相似文献
3.
本文讨论手写体汉字的基本分割问题以及解决该问题需做的一些工作,并提出了一种新的分割方法,用于在线和离线系统识别自由格式手写体汉字的句子。该方法通过调整空间阈值和最小均方差判别以实现基本分割和精细分割,从中可得到五种最可能的分割方案,抽取所有可能的分段并进行识别。由分段建立起栅格点,利用基于Viterbi的算法搜索到最可能的字符序列。本算法对自由格式连续手体汉字的处理具有很强的适应性和灵活性。对自然 相似文献
4.
基于笔划特征的手写体汉字字符识别 总被引:1,自引:0,他引:1
本文提出了一种利用笔划提取骨架结构特征的手写体汉字字符识别方法。首先,以二进制字符模式的直线长度来决定笔划的方向,根据其方向和它们相互关系,将笔划分为笔划段和分叉段,然后提取笔划的骨架,亦称之为骨架段,在提取了所有的轮廓段后,对分叉段进行处理,找到分叉点和分叉角。轮廓段和分叉段在分叉点处相连,这样所有相连的骨架段构成了字符的骨架,根据提取的轮廓和分叉点,我们可以得到用于识别的基本笔划和笔划方向图。 相似文献
5.
本文提出了一种分割单一连接的手写体数字串的方法,粘连的数字为标准的、经预处理的字符图像,并在检测特征点之前已经细化。检测潜在的分割点基于图像中的深度/高度/垂直度估算的判决线,以精确测量分割路径,然后应用于数字的分割。实验采用NIST数据库19、CEDAR CD-ROM取得结果。经与其它文献中提到的方法,并从收集的图像比较中可以看出,我们的算法可获得96%的识别率。 相似文献
6.
7.
本文提出了基于轮廓结构特征分割粘连的手写体数字对的识别方法。选择四种类型的间断点取决于字符间断点的连接和分析后获取的字符轮廓以及六种粘连形式。最后,通过选择分割组合检验,将减少粘连手写体数字对的间断点。此方法的主要优点是,可在多种假设条件的识别中进行可靠的分割组合。通过分割组合检验,减少了基于传统分割识别方法产生的分割误差。根据本文提及的方法,我们采用NIST SDl9数据库中3500个粘连的数字对进行实验,取得了92.5%的识别率。 相似文献
8.
基于笔划包围盒的脱机手写体汉字分割算法 总被引:1,自引:3,他引:1
汉字分割是脱机手写体汉字识别预处理的重要部分,改进了基于笔画包围盒的汉字分割算法。根据方向行程长度提取出汉字的笔画,对所得笔画建立包围盒。使用4种基本合并操作得到汉字的粗略的分割。最后使用动态规划的方法实现汉字的精细分割。实验结果表明,该算法较好地解决了汉字分割中的笔画粘连和重叠问题。 相似文献
9.
为了有效地进行手写体汉字的分割与识别,提出了一种基于假设-证实的离线手写体汉字分割与识别方法,即首先用一个假设分割边界的集合将手写汉字串图象分割成一个顺序排列的段序列;然后对顺序上连续的段被合并后,进行不相似度评价,其正确的分割由不相似度评价结果来证实.具体做法是,首先根据像素及笔划的分布特征,将汉字串分割成一个段序列,然后对分割与识别的决策由最优的相邻段合并后的不相似度评价结果得到.实验证明,该方法对于粘连、交叠、断裂和在书写方向上呈松散结构的汉字的分割与识别是非常有效的. 相似文献
10.
在离线手写体字符识别中,正确切分字符是提高识别性能的关键步骤之一。本文针对离线手写体汉字,提出了一种基于垂直投影法和前景一背景细化的切分算法。首先,本算法利用垂直投影法和背景细化的方法对非粘连字符进行切分,根据周边特性取得代价函数,利用动态规划法合并字块。其次,对于粘连字符,根据背景和前景细化的结果,选取一系列的特征点形成切分路径,然后利用代价函数来选择合适的路径。实验结果表明,提出的切分算法对手写体汉字字符有较好的切分效果。 相似文献
11.
非限定性手写汉字串的分割与识别是当前字符识别领域中的一个难点问题.针对手写日期的特点,提出了整词识别和定长汉字串分割识别相结合的组合识别方法.整词识别将字符串作为一个整体进行识别,无需复杂的字符串分割过程.在定长汉字串分割过程中,首先通过识别来预测汉字串的长度,然后通过投影和轮廓分析确定候选分割线,最后通过识别选取最优分割路径.这两种分割识别方法通过规则进行组合,大大提高了系统的性能.在真实票据图像上的实验表明了该方法的有效性,分割识别正确率达到了93.3%. 相似文献
12.
汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意,极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一些主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。 相似文献
13.
针对古籍古文献中部分汉字易发生粘连现象,提出一种古籍手写汉字多步分割方法.该方法继承了以往粗分割和细分割相结合的思想,首先采用投影进行粗分割,将手写汉字分为粘连字符和非粘连字符两类;然后针对粘连字符串抛弃常用的串行模式,直接采用粗分割的统计信息,设置初始分割路径,并基于最短分割路径的思想,在初始分割路径的局部邻域内基于最小权值搜索并修改分割路径,从而获得最佳的加权分割路径.实验证明该方法解决了字符分割不足和多处粘连字符的分割问题,有效的提高了分割的准确率,且算法的时间复杂度较低,算法效率较高. 相似文献
14.
针对现有的切分算法结构复杂,时间和空间复杂度高等不足,提出了一种基于凹凸特性的非限制粘连手写数字串切分的新方法。首先计算数字串图像的赋值背景,然后从中提取凹凸特性,找到切分区域,最后在切分区域内提取切分线。该方法简单快速,在提高切分正确率的同时也降低了复杂度。利用NISTSD19收集到的样本进行实验,正确率高达97.5%,切分时间也大大缩短。 相似文献
15.
16.
无约束手写体汉字切分方法综述 总被引:6,自引:0,他引:6
汉字切分是手写体汉字识别预处理中的一个难点,切分的正确与否直接关系到汉字识别的准确度。该义对目前无约束手写体汉字识别在行字切分上主要采用的方法作了具体介绍,闸述了各种方法的优缺点,最后根据目前的研究状况,指出今后研究中心需要注意的问题和研究的发展方向。 相似文献
17.
在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。 相似文献
18.
针对单一尺度的Gabor滤波器组只对某一特定粗细的手写体汉字敏感的缺点,提出了一种新颖的多尺度局部Gabor滤波器组。为了评估该方法的识别性能,提出了一个基于Gabor特征的手写体汉字识别系统,实验表明多尺度全局Gabor滤波器组在识别性能上明显提高,局部Gabor滤波器组在基本保持识别性能的情况下,特征维数明显降低,计算量和内存需求减少。该方法的创新之处在于选取局部Gabor滤波器,对863 HCL2000手写体汉字数据库的识别,最高平均识别率达到了92.32%,表明了该方法在手写体汉字识别中的有效性。 相似文献
19.
特征提取是手写体汉字识别的关键环节。论文提出了一种新的特征提取方法,即基于特征融合技术将弹性网格变换和Legendre矩变换结合起来,用弹性网格变换提取局部特征,用正交Legendre矩提取全局特征,然后使用K-L变换进行特征压缩,消除冗余信息。实验证明该方法是行之有效的。 相似文献