首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 384 毫秒
1.
基于贝叶斯评判子的字体判断   总被引:4,自引:0,他引:4  
支票中的待识别文字既可能是印刷体,也可能是手写体.由于印刷体与手写体文字的预处理方法和识别算法不同,因此准确判断文字的字体(手写体或印刷体)是获得高精度识别结果的关键技术之一.该文根据贝叶斯决策理论的最小错误率判决规则,提出了基于评判子的字体判断方法.利用贝叶斯评判子,该文还提出了一种可分性判据:评判子散度;同时还给出了一种估算评判子函数的方法.在无拒识情况下,对12158张实际银行支票的测试中,该方法的正确率为99.4%.  相似文献   

2.
该文试探一种加权融合流形学习的方法进行人脸识别,该算法通过Haar小波和局部线性嵌入(LLE)加权融合的方式来进行人脸识别。首先通过Haar小波变换对人脸图像进行一级分解,得到四个子图;然后利用LLE算法对四个子图降维处理,并加权融合;最后利用支持向量机(SVM)进行分类判决。通过在ORL库中进行实验,结果表明,该文提出的Haar+LLE识别效率比单独使用主成分分析(PCA)和LLE更高效。  相似文献   

3.
局部线性嵌入算法(LLE)是流形学习中非线性数据降维的重要方法之一。考虑数据点分布大多呈现不均匀性,LLE对近邻点的选取方式将会导致大量的信息丢失。根据其不足,提出一种基于数据点松紧度的局部线性嵌入改进算法——tLLE算法,针对数据点分布不均匀的数据集,tLLE算法能有效地进行维数约简,且具有比LLE更好的降维效果。在人造数据和现实数据上的嵌入以及分类识别结果表明了tLLE算法的有效性。  相似文献   

4.
为了提高人体手部动作的识别性能,针对高维特征数据给模式识别带来的问题,提出了一种基于局部线性嵌入(LLE)算法和支持向量机(SVM)的模式识别方法.该方法从肱桡肌和尺侧腕屈肌上采集两路表面肌电信号(sEMG),通过对样本信号的时域分析和小波分析,提取原始信号的特征,构造特征矢量.再利用LLE算法对原始特征数据进行降维,挖掘出具有内在规律的低维特征.将降维后的特征数据输入SVM分类器进行4种动作的模式识别.实验表明:此方法可以有效、准确地对人体手部动作进行分类.  相似文献   

5.
针对LLE算法在数据密度变化较大时很难降维的问题,提出一种基于密度刻画的降维算法。采用cam分布寻找数据点的近邻,并在低维局部重建时对数据点加入密度信息。对手写体数字图像进行字符特征的降维,再对降维后的特征进行分类识别。实验结果表明,该方法能区分字符,具有较好的识别率,能够发现高维空间的低维嵌入流形。  相似文献   

6.
对手写体汉字识别在特征提取、分类识别及后处理三个阶段主要采用的方法做了简要介绍。SVM具有结构简单,分类稳定可靠,且容错性好等优点。同时和LVQ神经网络分类器识别方法进行了比较,计算机仿真表明,采用SVM用于手写体汉字识别更适合。  相似文献   

7.
针对高维数据分类问题的特点,提出一种基于改进型局部线性嵌入LLE(Locally Linear Embedding)算法的数据降维算法,结合支持向量机SVM(Support Vector Machine)算法实现数据分类。首先,通过LLE算法降维后的数据集,按照数据集内的离差最小化,数据集间的离差最大化的原则,计算得到最优化邻近点个数;其次,将最优邻近点个数所得的降维数据作为最优结果,按一定比例选取训练集,输入SVM算法建立数据分类器;最后,将测试集输入训练完成的分类器中,实现最优化数据分类。选取Iris flower,Yale等多类数据集与传统算法进行对比实验,验证算法的可行性。实验结果表明:所提出的算法可以有效地完成数据分类,针对低维数据和高维数据分类问题具有较好的适用性和优越性,在人脸检测中也取得较好的结果。  相似文献   

8.
本文通过Gabor变换进行人脸表情图像的特征提取,并利用局部线性嵌入(LLE)系列算法进行数据降维操作.LLE算法是一种非线性降维算法,它可以使得降维后的数据保持原有的拓扑结构,在人脸表情识别中有广泛的应用.因为LLE算法没有考虑样本的类别信息,因此有了监督的局部线性嵌入(SLLE)算法.但是SLLE算法仅仅考虑了样本的类别信息却没有考虑到各种表情之间的关系,因此本文提出一种改进的SLLE算法,该算法认为中性表情是其他各种表情的中心.在JAFFE库上进行人脸表情识别实验结果表明,相比LLE算法和SLLE算法,该算法获得了更好的人脸表情识别率,是一种有效算法.  相似文献   

9.
在全球信息化的今天,信息的获取和交流有着特殊的需求,这要求文字识别技术不断地向前发展。文字识别的任务是将人类能够阅读的字符(包括手写体和印刷体文本)图像转换成计算机能够识别的代码(对于拉丁文来说是ASCII码,对于阿拉伯文来说是ASMO码)。文字识别技术可以分联机(on—line)与脱机(off—line)两种方法,而脱机识别又分为印刷体识别(printed)和手写体识别(Handwritten)。  相似文献   

10.
基因表达数据的一个重要应用是给组织样本进行分类。在基因表达数据中,基因的数量相对于数据样本的个数通常比较多;也就是说,可以得到变量数(基因数)远远大于样本数的数据矩阵。过高的维数(变量或基因数)将给分类问题带来极大的挑战。本文提出结合一种新的特征提取方法——非相关线性判别式分析方法(ULDA)和支持向量机(SVM)分类算法,对结肠癌组织样本进行分类识别。并同其它方法作了比较研究,结果表明了该方法的可行性和有效性。  相似文献   

11.
12.
支持向量机经过实践证明在小样本的情况下具有良好的泛化能力。但是在手写体数字识别的实验中,支持向量机被发现其在分类阶段的速度明显比神经网络要慢,因此在不影响支持向量机泛化能力的前提下简化支持向量机的决策函数。从而提高SVM的分类速度是很有意义的研究。利用迭代学习的方法来简化支持向量机的决策函数,实验证明本文的方法能够极大的简化SVM的决策函数,该方法易于实施。  相似文献   

13.
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重叠率规则的整合以及连笔切分,得到一系列字符片段,同时利用笔画个数、宽高比、中心偏离、平滑度等几何特征和识别置信度,对字符片段进行中英文分类。在此基础上,根据分类结果并结合自然语言模型的路径评价及动态规划搜索算法,分别对候选的中、英文字符片段进行合并处理,得到待识别的中、英文字符序列,并将其分别送入卷积神经网络的中、英文识别模型中,得到手写文本识别结果。实验结果表明,在线手写中英文混合文本识别正确率达93.67%,不仅能切分在线手写中文文本行,而且对包含字符连笔的在线手写中英文文本行也有较好的切分效果。  相似文献   

14.
Handwritten text recognition systems commonly combine character classification confidence scores and context models for evaluating candidate segmentation-recognition paths, and the classification confidence is usually optimized at character level. In this paper, we investigate into different confidence-learning methods for handwritten Chinese text recognition and propose a string-level confidence-learning method, which estimates confidence parameters by directly optimizing the performance of character string recognition. We first compare the performances of parametric (class-dependent and class-independent parameters) and nonparametric (isotonic regression) confidence-learning methods. Then, we propose two regularized confidence estimation methods and particularly, a string-level confidence-learning method under the minimum classification error criterion. In experiments of online handwritten Chinese text recognition, the string-level confidence-learning method is shown to effectively improve the string recognition performance. Using three character classifiers, the character correct rates are improved from 92.39, 90.24 and 88.69 % to 92.76, 90.91 and 89.93 %, respectively.  相似文献   

15.
Optical Character Recognition (OCR) is the process of recognizing printed or handwritten text on paper documents. This paper proposes an OCR system for Arabic characters. In addition to the preprocessing phase, the proposed recognition system consists mainly of three phases. In the first phase, we employ word segmentation to extract characters. In the second phase, Histograms of Oriented Gradient (HOG) are used for feature extraction. The final phase employs Support Vector Machine (SVM) for classifying characters. We have applied the proposed method for the recognition of Jordanian city, town, and village names as a case study, in addition to many other words that offers the characters shapes that are not covered with Jordan cites. The set has carefully been selected to include every Arabic character in its all four forms. To this end, we have built our own dataset consisting of more than 43.000 handwritten Arabic words (30000 used in the training stage and 13000 used in the testing stage). Experimental results showed a great success of our recognition method compared to the state of the art techniques, where we could achieve very high recognition rates exceeding 99%.  相似文献   

16.
脱机手写体汉字识别研究综述   总被引:7,自引:2,他引:7  
脱机手写体汉字识别是汉字识别领域中最难的课题。该文对目前脱机手写体汉字识别在预处理、特征提取、分类识别及后处理四个阶段主要采用的方法做了简要介绍,阐述了各种方法的优缺点,并提出了一种将支持向量机有效地用于解决多分类问题的策略。最后根据目前的研究状况,指出今后研究中需要注意的问题和研究的发展方向。  相似文献   

17.
The convenience of search, both on the personal computer hard disk as well as on the web, is still limited mainly to machine printed text documents and images because of the poor accuracy of handwriting recognizers. The focus of research in this paper is the segmentation of handwritten text and machine printed text from annotated documents sometimes referred to as the task of “ink separation” to advance the state-of-art in realizing search of hand-annotated documents. We propose a method which contains two main steps—patch level separation and pixel level separation. In the patch level separation step, the entire document is modeled as a Markov Random Field (MRF). Three different classes (machine printed text, handwritten text and overlapped text) are initially identified using G-means based classification followed by a MRF based relabeling procedure. A MRF based classification approach is then used to separate overlapped text into machine printed text and handwritten text using pixel level features forming the second step of the method. Experimental results on a set of machine-printed documents which have been annotated by multiple writers in an office/collaborative environment show that our method is robust and provides good text separation performance.  相似文献   

18.
This paper develops word recognition methods for historical handwritten cursive and printed documents. It employs a powerful segmentation-free letter detection method based upon joint boosting with histograms of gradients as features. Efficient inference on an ensemble of hidden Markov models can select the most probable sequence of candidate character detections to recognize complete words in ambiguous handwritten text, drawing on character n-gram and physical separation models. Experiments with two corpora of handwritten historic documents show that this approach recognizes known words more accurately than previous efforts, and can also recognize out-of-vocabulary words.  相似文献   

19.
介绍了独立分量分析(ICA)基本原理和算法,提出了一种基于独立分量分析和支持向量机的有限集字符识别新方法。对传统向量机解决多分类问题的“一对一”模式进行了改进,将传统向量机的“一对一”模式存在的不可分区域减小到可以忽略的程度,克服了不可分区域的影响。该算法可应用于车牌字符、手写体英文字母、手写体数字、印刷体字母、印刷体数字等有限集字符的识别。在大量的车牌汉字和手写体英文字母自动识别实验中,取得了高于95%的识别结果,证明该算法在有限集字符识别应用中的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号