首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
本文针对基于手写体汉字的成绩单自动识别系统的实际需要,基于目前脱机手写体汉字识别技术的一些研究成果,提出一种新的基于聚类方法和多个分类器的线性集成的综合方法,并且采用分级判决策略,进上步降低误识率,实验结果表明,本系统具有较高的识别率和较低的误识率,并且具有较好的扩展性,具有实用的可行性。  相似文献   

2.
本文从语义,句法模式识别观点,提出一种基于模型指导的有限状态属性自动机,进行特征抽取。对每一种典型的畸变模型设计一个有限状态属性文法及其相应的属性自动机,采用自下而上和自上而下相结合的控制策略,并在低层次引入知识指导,减少了工作量和不确定性。基于上述方法实现的非限制性手写数字识别系统,经过对1100个非限制性手写数字样本的测试,平均识别率达95.2%,拒识率为4.6%,误识率为0.2%。  相似文献   

3.
提出了一种用于机器识字的汉字容错编码方法。该编码采用统计粗分类和结构细分类相结合的方法.定义了易于机器识别的汉字结构字元集,给出了笔划字元的顺序判断规则。构建了37类子结构的编码和冗余容错编码,建立了仿人构字的汉字编码规则和字典。仿真实验表明,这种编码方法易于机器识别,具有容错性,且拒识和误识率较低。  相似文献   

4.
该文实现了线性判别分析在汉语连续语音识别系统中的应用。通过将多帧原始特征联合后进行特征选择,特征之间的帧间相关性得到了有效的利用,从而提高了语音的识别率,实验结果表明,系统误识率下降16.90%。  相似文献   

5.
随着先进光学仪器、精密测量技术的迅速发展,通常利用接触式、非接触式检测方案,对某些光学元件表面存在的缺陷问题进行人工或自动识别.提出了基于光电测量技术的光场复振幅识别、表面轮廓特征识别方案,结合Harris算子角点识别方法,对光学元件涉及到的尺寸、纹理、缺陷位置、缺陷梯度等数据参量,展开全方位的表面检测与识别,自动缺陷识别的误识率小于1%、漏识率小于2%,在识别效率、识别精度方面具有较大优势.  相似文献   

6.
信函自动分拣系统在我国的一、二级邮区中心局普遍使用。系统采用先进的OCR技术识别和人工(单字)补码技术,对六位邮政编码进行识别,并按照不同的分拣方案.对邮件进行自动分拣,为大规模、高效率进行邮件处理提供了保证。计算机技术的迅猛发展,为信函分拣的自动化提供了技术支撑,如采用多种OCR识别模式对打印体的窗口信封、贴条信函等的识别,大大提高了信函分拣的处理率,降低了误识率。  相似文献   

7.
基于最小代价的多分类器动态集成   总被引:2,自引:0,他引:2  
本文提出一种基于最小代价准则的分类器动态集成方法.与一般方法不同,动态集成是根据“性能预测特征”,动态地为每一样本选择最适合的一组分类器进行集成.该选择基于使误识代价与时间代价最小化的准则,改变代价函数的定义可以方便地达到识别率与识别速度之间的不同折衷.本文中提出了两种分类器动态集成的方法,并介绍了在联机手写汉字识别中的具体应用.在实验中使了3个分类器进行动态集成,因此,得到7种分类组合.在预先定义的代价意义下,我们比较了动态集成方法和其它7种固定方法的性能.实验结果证明了动态集成方法的高灵活性、实用性和提高系统综合性能的能力.  相似文献   

8.
张俊  关胜晓 《计算机应用》2015,35(7):2101-2104
针对目前说话人识别系统的效率问题,采用集成算法的策略,提出一种新的说话人识别系统框架。首先,考虑到传统的最大后验概率矢量量化(VQ-MAP)算法中只关注平均矢量而不考虑权重的问题,提出了改进的VQ-MAP算法,使用加权平均向量来代替平均向量;然后,由于支持向量机(SVM)算法相对耗时,故采用最小二乘支持向量机(LS-SVM)替代SVM算法;最后,在说话人识别系统中,利用改进的VQ-MAP算法所得参数集作为LS-SVM的训练样本。实验结果表明,基于改进的VQ-MAP和LS-SVM的集成算法,与传统的SVM算法相比,在均使用径向基函数(RBF)核函数时,对40人样本数据建模时间上减少接近40%;在阈值为1,测试语音时长为4 s时,与传统的VQ-MAP和SVM算法相比,误识率降低了1.1%,误拒率降低了2.9%,识别率提高了3.9%;在阈值为1,测试语音时长为4 s时,与传统的VQ-MAP和LS-SVM算法相比,误识率降低了3.6%,误拒率降低了2.7%,识别率提高了4.4%。结果表明,集成算法能够有效提高算法识别率,明显减少运算时间,同时降低误识率和误拒率。  相似文献   

9.
传统蒙古文和西里尔蒙古文分别是在中国和蒙古国使用的蒙古文,它们的口语基本相同,但是书写形式完全不同。结合传统蒙古文和西里尔蒙古文的构词特点,提出了基于联合序列模型的传统蒙古文和西里尔蒙古文相互转换方法,并做了大量的相互转换实验。实验中,传统蒙古文到西里尔蒙古文转换系统的词误识率和字母误识率分别达到了18.38%和6.75%,西里尔蒙古文到传统蒙古文转换系统的词误识率字母误识率分别达到了18.77%和7.14%,基本达到了实用要求。  相似文献   

10.
针对单特征手指静脉识别中识别率难以继续提高的技术瓶颈,采用多特征融合技术不仅可以提高识别率,而且可以降低误识率.为此提出一种基于Fisher准则的手指静脉融合算法.首先对手指静脉图像进行特征点提取,分别计算待匹配图像特征点与注册图像特征点的正向平均豪斯道夫距离(FMHD)和反向平均豪斯道夫距离(RMHD),然后基于Fisher准则确定FMHD和RMHD的融合参数,将融合得到的豪斯道夫距离作为新的匹配分数;在上述算法的基础上,将得到的食指、中指和无名指3根手指静脉的匹配分数进行融合,以进一步提高手指静脉的识别率.实验结果表明,与通常采用的FMHD相比,采用融合后的豪斯道夫距离的误识率有明显降低;而采用三指静脉融合后,误识率由单个手指的1.95%降低到0.27%.  相似文献   

11.
The use of optical character recognition (OCR) has achieved considerable success in the sorting of machine-printed mail. The automatic reading of unconstrained handwritten addresses however, is less successful. This is due to the high error rate caused by the wide variability of handwriting styles and writing implements. This paper describes a strategy for automatic handwritten address reading which integrates a postcode recognition system with a hybrid verification stage. The hybrid verification system seeks to reduce the error rate by correlating the postcode against features extracted and words recognised from the remainder of the handwritten address. Novel use of syntactic features extracted from words has resulted in a significant reduction in the error rate while keeping the recognition rate high. Experimental results on a testset of 1,071 typical Singapore addresses showed a significant improvements from 24.0% error rate, 71.2% correct recognition rate, and 4.8% rejection rate using raw OCR postcode recognition to 0.4% error rate, 65.1% correct recognition rate, and 34.5% rejection rate using the hybrid verification approach. The performance of the approach compares favourably with the currently installed commercial system at Singapore Post, which achieved 0.7% error rate, 47.8% correct recognition rate, and 51.5% rejection rate for 6-digit postcode using the same test data.  相似文献   

12.
13.
Performance evaluation is crucial for improving the performance of OCR systems. However, this is trivial and sophisticated work to do by hand. Therefore, we have developed an automatic performance evaluation system for a printed Chinese character recognition (PCCR) system. Our system is characterized by using real-world data as test data and automatically obtaining the performance of the PCCR system by comparing the correct text and the recognition result of the document image. In addition, our performance evaluation system also provides some evaluation of performance for the segmentation module, the classification module, and the post-processing module of the PCCR system. For this purpose, a segmentation error-tolerant character-string matching algorithm is proposed to obtain the correspondence between the correct text and the recognition result. The experiments show that our performance evaluation system is an accurate and powerful tool for studying deficiencies in the PCCR system. Although our approach is aimed at the PCCR system, the idea also can be applied to other OCR systems.  相似文献   

14.
针对印刷体维吾尔文文字识别系统中的字符识别正确率较低这一难点问题,采用对字符图像进行横向扫描和纵向扫描生成行和列投影图, 结合三级分类,将目标字符与对应分类中的字符的双投影图逐一归一化并进行相关性均值计算的方法,取均值最大的字符作为最佳匹配识别结果,实现了对维文字符的识别。实验证明这种基于字符归一化双投影互相关性匹配识别算法方法抗干扰性强,简单易行,匹配精度高,使得印刷体维吾尔文字字符识别的正确率有了进一步提高。  相似文献   

15.
集成汉英OCR系统识别中文名片   总被引:1,自引:0,他引:1  
汉英双语混排识别是构造中文自动文档图像处理系统时常会遇到的一个问题。只有采用一种有效的方法集成现有汉英识别引擎,才可能高质量地识别混排文档。该文应用适当干预和多层次语言判断的汉英OCR系统集成原则,集成OCR系统识别中文名片。实验数据表明,利用该原则构造的系统确实能有效集成汉英识别引擎,在纯中文识别率为89.86%,纯英文识别率为91.20%的情况下,使名片最终总体识别率达到了93.45%,较好地解决了汉英混排名片的识别问题。  相似文献   

16.
西文OCR后处理中的有限自动机模型   总被引:1,自引:0,他引:1  
在西文OCR中,从候选结果中挑选最佳结果的后处理操作是必不可少的,并且利用单词拼写检查进行后处理是完全可行的。但是,以往的方法分别在不同程度上具有低可靠性和局限性。为此,该文提出将有限自动机模型应用于西文OCR后处理中,该方法有效地将拼写检查和识别结果信息结合起来,克服了以往方法中存在的低可靠性和局限性,并通过实验验证了该方法的有效性。以识别后处理辅助识别,错误率从0.79%降到0.59%;以识别后处理和系统后处理结合辅助识别,错误率降低到0.55%。  相似文献   

17.
The reading process has been widely studied and there is a general agreement among researchers that knowledge in different forms and at different levels plays a vital role. This is the underlying philosophy of the Devanagari document recognition system described in this work. The knowledge sources we use are mostly statistical in nature or in the form of a word dictionary tailored specifically for optical character recognition (OCR). We do not perform any reasoning on these. However, we explore their relative importance and role in the hierarchy. Some of the knowledge sources are acquired a priori by an automated training process while others are extracted from the text as it is processed. A complete Devanagari OCR system has been designed and tested with real-life printed documents of varying size and font. Most of the documents used were photocopies of the original. A performance of approximately 90% correct recognition is achieved  相似文献   

18.
大规模逻辑神经网络印刷体汉字识别系统   总被引:1,自引:0,他引:1  
逻辑神经网络是一种采用快速学习算法、RAM阵列实现的数字网络。本文描述了采用这种网络模型实现的印刷体汉字识别系统。这是一个初步实用的系统,可识别大约4000个不同字号的宋体汉字及其它字符,其识别率为99%,对于实际书刊,识别率也能达到95%。系统使用了大约384,000个神经节点,是一个复杂的大规模神经网络。和其它同类系统相比,具有适应性、稳固性好,学习速度快以及可用数字集成电路全硬件并行实现等优  相似文献   

19.
20.
We consider the problem of document binarization as a pre-processing step for optical character recognition (OCR) for the purpose of keyword search of historical printed documents. A number of promising techniques from the literature for binarization, pre-filtering, and post-binarization denoising were implemented along with newly developed methods for binarization: an error diffusion binarization, a multiresolutional version of Otsu's binarization, and denoising by despeckling. The OCR in the ABBYY FineReader 7.1 SDK is used as a black box metric to compare methods. Results for 12 pages from six newspapers of differing quality show that performance varies widely by image, but that the classic Otsu method and Otsu-based methods perform best on average.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号