共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
The offline recognition of Chinese Characters is a very important research field in OCR. In this paper, the authors propose an effective stroke extraction model for Chinese Character based on Stroke Segmentation and Combination. Comparing with the existed models, the experiments prove that it could improve the precision for the stroke extraction and reduce the computation complexity considerably. 相似文献
3.
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。 相似文献
4.
联机手写汉字识别(OLCCR),是指用笔在图形输入板上写字,人一边写,机器一边认,是一种方便的汉字识别手段。在各种自动识别输入的方法中,OLCCR是能够代替或部分代替人工编码输入的惟一可能的方法。识别中主要是两方面的问题:建立汉字识别库和手写板上笔画轨迹的识别。文中就第二方面即手写笔画识别的问题进行了全面的研究,采用笔画基元帮助分析笔画轨迹,并用可视化编程工具Visual C 6.0实现了基于这种方法的笔画识别过程。 相似文献
5.
6.
7.
利用连续帧图象之间的时序关系,提出了一种基于运动图象的手写笔画时序信息提取方法.根据汉字结构特点和汉字识别的需要,此文首先定义了网格时序和笔顺两种手写汉字的笔画时序信息;然后,应用数学形态学方法确定手写汉字笔画像素点出现的图象帧序,并提取网格时序;最后通过笔段提取与融合获取笔顺.从实验结果看,所提取的笔画时序,尤其是起始和终止笔画是正确的,表明该方法有效的. 相似文献
8.
本文介绍图形系统中解决汉字输出的一种实用技术。提出了动态符号集的概念,汉字图形笔画生成方法和交互式编辑功能,并在三维图形系统NDGRAPHICS的应用中取得了满意效果。最后对其性能作了简单评价。 相似文献
9.
汉字由笔画或子笔画组成,笔画或子笔画特征在手写体汉字识别中得到了广泛应用。论文提出一种模糊子笔画抽取方法,解决了因无限制手写体笔画随意性而使得抽取的子笔画不稳定的问题。计算字符边缘点“横”、“竖”、“撇”、“捺”的模糊子笔画属性特征,并将其与模糊网格相结合,生成模糊子笔画统计特征。银行支票手写体汉字大写金额识别的实验结果表明应用模糊子笔画统计特征能取得更好的识别效果。 相似文献
10.
联机手写汉字识别(OLCCR),是指用笔在图形输入板上写字,人一边写,机器一边认,是一种方便的汉字识别手段.在各种自动识别输入的方法中,OLCCR是能够代替或部分代替人工编码输入的惟一可能的方法.识别中主要是两方面的问题:建立汉字识别库和手写板上笔画轨迹的识别.文中就第二方面即手写笔画识别的问题进行了全面的研究,采用笔画基元帮助分析笔画轨迹,并用可视化编程工具Visual C+ +6.0实现了基于这种方法的笔画识别过程. 相似文献
11.
根据形状相似性的书法内容检索 总被引:4,自引:1,他引:4
提出了一种根据形状相似性来检索书法字的算法:将扫描的书法作品先切分成单个书法字,并提取轮廓特征;接着由形状相似性算法计算相似度,然后按相似程度大小显示同一字不同的书法风格.实验证明,该算法具有很好的效果. 相似文献
12.
13.
高阶N-gram语言模型在OCR后处理方面有着广泛的应用,但也面临着因模型复杂度大导致的数据稀疏,以及耗费较多的时空资源等问题。该文针对印刷体汉字识别的后处理,提出了一种基于字节的语言模型的后处理算法。通过采用字节作为语言模型的基本表示单位,模型的复杂度大大降低,从而数据稀疏问题得到很大程度上缓解。实验证明,采用基于字节的语言模型的后处理系统能够以极少的时空开销获取很好的识别性能。在有部分分割错误的测试集上,正确率从88.67%提高到了98.32%,错误率下降了85.18%,运行速度较基于字以及基于词的系统有了大幅的提升,提高了后处理系统的综合性能;与目前常用的基于词的语言模型后处理系统相比,新系统能够节省95%的运行时间和98%的内存资源,但系统识别率仅降低了1.11%。 相似文献
14.
提出了一种新的一维变形变换方法并将之应用于手写体汉字的整形变换。尽管不同书写风格的同不类手写体汉字存在较大的随意性,但它们的拓扑结构是一致的,因此可将手写体汉字看成是一种可变形物体。通过选择适当的变形参数,该变形变换可以将一个汉字变形为24种不同的收写风格,利用一个变形系数可控制各种风格的变形程序。该变形变换可以矫正手写体中偏左、偏右、偏上、偏下、偏胖、偏瘦等各种位置变形,从而达到对手写体样本进行非线性规范化处理的效果。实验结果表明,手写体汉字经变形变换后,识别率可提高大约1.5%左右,显示了本文所得算法的有效性。 相似文献
15.
口语理解在口语自动翻译和人机对话系统中具有非常重要的作用。本文面向口语自动翻译提出了一种统计和规则相结合的汉语口语理解方法,该方法利用统计方法从训练语料中自动获取语义规则,生成语义分类树,然后利用语义分类树对待解析的汉语句子中与句子浅层语义密切相关的词语进行解析,最后再利用统计理解模型对各个词语的解析结果进行组合,从而获得整个句子的浅层语义领域行为。实验结果表明,该方法具有较高的准确率和鲁棒性,适合应用在限定领域的汉语口语浅层语义理解。 相似文献
16.
一种识别手写汉字的多分类器集成方法 总被引:3,自引:1,他引:3
根据多信源信息处理与字符识别的经验知识,提出了一个识别手写汉字的多分类器线性集成模型.这个模型不仅考虑到不同的分类器对不同字符识别能力的不同,而且还考虑了不同的分类器得出的输入字符与参考模板之间相似度的实际大小对判决的影响,及不同分类器提供的候选字符对判决的支持作用,更重要的是提供了一种通过监督学习,利用计算机程序自动计算模型参数的方法,因而实现了一个较好的集成系统.同时,本文还提供了三个用于集成的分类器,它们集成的结果充分显示了本方法的有效性. 相似文献
17.
多字体多字号印刷汉字识别方法的研究 总被引:2,自引:0,他引:2
本文对多体多字号印别汉字识别的方法进行了研究, 本文提出的方法是首先对不同字号印刷 汉字进行归一化处理, 再抽取汉字四周笔端数特征、改进粗外围特征、笔划穿插次数特征和投影变换特征, 然后对组合特征进行多级分类识别。实验在IBM一PC AT 微型机上进行, 结果表明, 实验系统在识别实际印别文本时识别率大于98%。 相似文献
18.
19.