首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

2.
The offline recognition of Chinese Characters is a very important research field in OCR. In this paper, the authors propose an effective stroke extraction model for Chinese Character based on Stroke Segmentation and Combination. Comparing with the existed models, the experiments prove that it could improve the precision for the stroke extraction and reduce the computation complexity considerably.  相似文献   

3.
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。  相似文献   

4.
俞庆英  吴建国 《微机发展》2004,14(10):68-69,72
联机手写汉字识别(OLCCR),是指用笔在图形输入板上写字,人一边写,机器一边认,是一种方便的汉字识别手段。在各种自动识别输入的方法中,OLCCR是能够代替或部分代替人工编码输入的惟一可能的方法。识别中主要是两方面的问题:建立汉字识别库和手写板上笔画轨迹的识别。文中就第二方面即手写笔画识别的问题进行了全面的研究,采用笔画基元帮助分析笔画轨迹,并用可视化编程工具Visual C 6.0实现了基于这种方法的笔画识别过程。  相似文献   

5.
目前常用的音序汉字序列并不符合中国人对汉字排序的观念,能够反应汉字特征的是汉字的笔画.结合汉字的重编码与汉字笔画排序规则,提出在计算机上实现汉字按笔画序规则排序的方法,根据重编码和内码的性质,在第一次排序结果的基础上再进行一次排序,使得排序搜索速度得到有效提高.  相似文献   

6.
提出了一种笔画分区矩特征的提取方法。根据汉字笔画分布特点,利用小波变换将汉字分解为4个方向笔画分量,用分区矩分别描述4个笔画于图像,并采用K—L变换对特征进行降维处理。采用该特征对有限集手写体汉字进行识别,初步实验结果表明该方法十分有效。  相似文献   

7.
利用连续帧图象之间的时序关系,提出了一种基于运动图象的手写笔画时序信息提取方法.根据汉字结构特点和汉字识别的需要,此文首先定义了网格时序和笔顺两种手写汉字的笔画时序信息;然后,应用数学形态学方法确定手写汉字笔画像素点出现的图象帧序,并提取网格时序;最后通过笔段提取与融合获取笔顺.从实验结果看,所提取的笔画时序,尤其是起始和终止笔画是正确的,表明该方法有效的.  相似文献   

8.
本文介绍图形系统中解决汉字输出的一种实用技术。提出了动态符号集的概念,汉字图形笔画生成方法和交互式编辑功能,并在三维图形系统NDGRAPHICS的应用中取得了满意效果。最后对其性能作了简单评价。  相似文献   

9.
汉字由笔画或子笔画组成,笔画或子笔画特征在手写体汉字识别中得到了广泛应用。论文提出一种模糊子笔画抽取方法,解决了因无限制手写体笔画随意性而使得抽取的子笔画不稳定的问题。计算字符边缘点“横”、“竖”、“撇”、“捺”的模糊子笔画属性特征,并将其与模糊网格相结合,生成模糊子笔画统计特征。银行支票手写体汉字大写金额识别的实验结果表明应用模糊子笔画统计特征能取得更好的识别效果。  相似文献   

10.
联机手写汉字识别(OLCCR),是指用笔在图形输入板上写字,人一边写,机器一边认,是一种方便的汉字识别手段.在各种自动识别输入的方法中,OLCCR是能够代替或部分代替人工编码输入的惟一可能的方法.识别中主要是两方面的问题:建立汉字识别库和手写板上笔画轨迹的识别.文中就第二方面即手写笔画识别的问题进行了全面的研究,采用笔画基元帮助分析笔画轨迹,并用可视化编程工具Visual C+ +6.0实现了基于这种方法的笔画识别过程.  相似文献   

11.
根据形状相似性的书法内容检索   总被引:4,自引:1,他引:4  
提出了一种根据形状相似性来检索书法字的算法:将扫描的书法作品先切分成单个书法字,并提取轮廓特征;接着由形状相似性算法计算相似度,然后按相似程度大小显示同一字不同的书法风格.实验证明,该算法具有很好的效果.  相似文献   

12.
汉字的线性分类实验   总被引:1,自引:0,他引:1  
本文通过实验研究了在汉字识别中应用线性分类器的可能性,考察了汉字之间的线性可分性。实验使用了两种主要的线性分类器: Fisher线性判别和感知器。实验检验每一对汉字的线性可分性。实验结果表明,汉字之间的线性分类性是相当好的。尤其是Fisher线性判别,不能成功线性分类的汉字仅占百万分之4.25 。这显示了在汉字识别中应用线性分类器是有着巨大的潜力的。同时,线性分类实验结果还可用来检验所选取特征的好坏,有利于客观的评价特征。  相似文献   

13.
高阶N-gram语言模型在OCR后处理方面有着广泛的应用,但也面临着因模型复杂度大导致的数据稀疏,以及耗费较多的时空资源等问题。该文针对印刷体汉字识别的后处理,提出了一种基于字节的语言模型的后处理算法。通过采用字节作为语言模型的基本表示单位,模型的复杂度大大降低,从而数据稀疏问题得到很大程度上缓解。实验证明,采用基于字节的语言模型的后处理系统能够以极少的时空开销获取很好的识别性能。在有部分分割错误的测试集上,正确率从88.67%提高到了98.32%,错误率下降了85.18%,运行速度较基于字以及基于词的系统有了大幅的提升,提高了后处理系统的综合性能;与目前常用的基于词的语言模型后处理系统相比,新系统能够节省95%的运行时间和98%的内存资源,但系统识别率仅降低了1.11%。  相似文献   

14.
变形变换及其在手写体汉字整形中的应用   总被引:6,自引:0,他引:6       下载免费PDF全文
提出了一种新的一维变形变换方法并将之应用于手写体汉字的整形变换。尽管不同书写风格的同不类手写体汉字存在较大的随意性,但它们的拓扑结构是一致的,因此可将手写体汉字看成是一种可变形物体。通过选择适当的变形参数,该变形变换可以将一个汉字变形为24种不同的收写风格,利用一个变形系数可控制各种风格的变形程序。该变形变换可以矫正手写体中偏左、偏右、偏上、偏下、偏胖、偏瘦等各种位置变形,从而达到对手写体样本进行非线性规范化处理的效果。实验结果表明,手写体汉字经变形变换后,识别率可提高大约1.5%左右,显示了本文所得算法的有效性。  相似文献   

15.
口语理解在口语自动翻译和人机对话系统中具有非常重要的作用。本文面向口语自动翻译提出了一种统计和规则相结合的汉语口语理解方法,该方法利用统计方法从训练语料中自动获取语义规则,生成语义分类树,然后利用语义分类树对待解析的汉语句子中与句子浅层语义密切相关的词语进行解析,最后再利用统计理解模型对各个词语的解析结果进行组合,从而获得整个句子的浅层语义领域行为。实验结果表明,该方法具有较高的准确率和鲁棒性,适合应用在限定领域的汉语口语浅层语义理解。  相似文献   

16.
一种识别手写汉字的多分类器集成方法   总被引:3,自引:1,他引:3  
根据多信源信息处理与字符识别的经验知识,提出了一个识别手写汉字的多分类器线性集成模型.这个模型不仅考虑到不同的分类器对不同字符识别能力的不同,而且还考虑了不同的分类器得出的输入字符与参考模板之间相似度的实际大小对判决的影响,及不同分类器提供的候选字符对判决的支持作用,更重要的是提供了一种通过监督学习,利用计算机程序自动计算模型参数的方法,因而实现了一个较好的集成系统.同时,本文还提供了三个用于集成的分类器,它们集成的结果充分显示了本方法的有效性.  相似文献   

17.
多字体多字号印刷汉字识别方法的研究   总被引:2,自引:0,他引:2  
本文对多体多字号印别汉字识别的方法进行了研究, 本文提出的方法是首先对不同字号印刷 汉字进行归一化处理, 再抽取汉字四周笔端数特征、改进粗外围特征、笔划穿插次数特征和投影变换特征, 然后对组合特征进行多级分类识别。实验在IBM一PC AT 微型机上进行, 结果表明, 实验系统在识别实际印别文本时识别率大于98%。  相似文献   

18.
提出了一种使用BGP路由表对自治系统进行分类的方法。按照自治系统在Internet中所起的作用,将Internet层次模型分为5层。利用多个BGP路由表生成自治系统拓扑图,根据BGP路由表中自治系统路径的结构特点和传输自治系统的拓扑特点,结合随机扰动方法,对自治系统进行层次分类。与同类算法对比表明,该算法简洁有效。  相似文献   

19.
共指消解是自然语言处理的核心问题之一。本文针对分步消解中分类器全局信息的不足,依据分类信心对全体提及配对进行排序,优先根据可靠的分类结果对提及进行聚集或分离。实验表明,该算法在多个学习框架下显著地改善了系统的整体性能。  相似文献   

20.
结合开发实际,介绍了笔顺输入法中汉字搜索算法和字码表及词码表的生成过程。从排序和查找两方面考虑,首先将汉字字库生成汉字字码表,然后将字码表根据首笔进行分区,当用户输入首笔后由汉字字码表索引文件决定在哪个分区范围内进行查找。实例证明本方法满足查找速度要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号