首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
王建平  陈军  徐晓冰  王熹徽 《微机发展》2006,16(10):104-107
提出了一种模糊统计方法的脱机手写体汉字特征提取方法,结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

2.
基于SVM的脱机手写汉字机器学习识别方法研究   总被引:3,自引:1,他引:3  
提出了一种模糊统计方法的脱机手写体汉字特征提取方法.结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

3.
脱机手写汉字机器识别方法的研究是人机接口自然化和智能化进程中的一个重要课题。目前,对于印刷体汉字的识别已取得了满意效果,出现了“读”书的机器,但对于脱机手写汉字的识别,还需要进一步探索和研究。本文就将探讨针对这一难题的各种研究方法。◆ 结构模式识别方法结构模式识别是早期脱机手写汉字识别研究的主要方法。集中在如何准确地抽取基元、轮廓、特征点等能够反映汉字结构信息的特征上。通常,抽取笔画需要进行细化处理,但是细化算法不仅速度慢,且易产生伪笔画段,单纯采用结构模式识别方法已不能满足脱机手写汉字识别系统…  相似文献   

4.
基于主曲线的脱机手写数字结构特征分析及选取   总被引:8,自引:0,他引:8  
要提高脱机手写数字识别的识别率,关键是特征的提取与选择.主曲线是主成分分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线.它较好地反映了数据分布的结构特征.在数字特征选取中,首先将主曲线用于训练数据的特征提取;其次在详细分析数字主曲线的结构特点的基础上,选择出用于数字识别的粗分类、细分类特征;最后在对手写数字进行识别时,先进行粗分类再进行细分类.所提方法在Concordia大学的CENPARMI手写体数字数据库上的实验结果表明:利用这些特征能有效区分相似字符,提高了手写数字的识别率,为脱机手写数字识别的研究提供了一条新途径。  相似文献   

5.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

6.
卢达  浦炜  陈琦玮  谢铭培 《计算机应用》2005,25(10):2418-2421
对手写汉字识别问题,提出了一种在识别之前对手写汉字预分类的新方法,该方法用Neocognitron网提取字符笔画特征,然后采用有监督的扩展ART神经网络(SEART)产生一定数量的预分类组并通过基于模糊相似测量的匹配算法进行预分类。实验表明,该方法用于手写汉字分类效果良好,预分类正确率达到98.22%。  相似文献   

7.
童学锋  朱俊 《计算机应用》2006,26(Z1):24-26
以HCL2000手写汉字库为基础,构建了一个实验系统,对一级汉字库3 755个汉字,使用不同的汉字特征和不同的分类距离,进行了一系列比较实验,探讨了大字符集脱机手写体汉字识别的粗分类问题,得到了一些有用的结论.  相似文献   

8.
手写汉字识别是模式识别与机器学习的重要研究方向和应用领域;近年来,随着深度学习理论方法的完善、新技术的层出不穷,深度神经网络在图像识别分类、图像生成等典型应用中取得了突破性的进展,其中,深度残差网络作为最新的研究成果,已成功应用于手写数字识别、图片识别分类等多个领域;将研究深度残差网络在脱机孤立手写汉字识别中的应用方法,通过改进残差学习模块的单元结构,优化深度残差网络性能,同时通过对训练集的预处理,从数据层面实现训练生成模型性能的提升,最后设计实验,验证深度残差网络、End-to-End模式在脱机手写汉字识别中的可行性,分析、总结存在的问题及今后的研究方向。  相似文献   

9.
脱机手写满文笔画基元的提取和识别   总被引:1,自引:0,他引:1       下载免费PDF全文
笔画的正确提取对文字识别结果至关重要。该文提出并实现了一种全新的满文笔画提取方法。基于满文文字的结构和特征,首先对处理目标进行预处理,确定笔画主干,创建笔画生长法对满文文字笔画实现自动提取。对提取得到的笔画进行分类,然后对照笔画特征库进行识别。试验表明,该方法对规整手写的满文文字的笔画提取和识别有令人满意的效果,为进一步脱机手写满文识别研究奠定了坚实的基础。  相似文献   

10.
基于主曲线的脱机手写英文字母结构特征分析及选取   总被引:1,自引:0,他引:1  
要提高脱机手写英文字母识别的识别率,关键是特征的提取与有效鉴别特征的抽取。主曲线是主成分分析的非线性推广,它是通过数据分布"中间"并满足"自相合"的光滑曲线。它较好地反映了数据分布的结构特征。首先将主曲线用于训练数据的特征提取;其次在详细分析字母主曲线的结构特点的基础上,选择出用于字母识别的粗分类、细分类特征;最后在对手写字母进行识别时,先用这些特征进行一级分类;对个别不能很好区分的相似字母用模糊数学方法进行二级模糊分类。所提方法在CEDAR手写体小写字母数据库上的实验结果表明:利用这些特征能有效区分相似字母,提高手写小写英文字母的识别率,不但能为脱机手写小写英文字母识别的研究提供一条新途径,而且能为手写单词识别提供有用信息。  相似文献   

11.
模式特征的提取与选择是提高手写体字符识别率的关键因素。主曲线是主成分分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线,能够很好地描述数据分布的结构特征。利用软K段主曲线算法提取训练数据的特征,在分析手写体字符结构特点的基础上,选出手写体字符识别所使用的粗分类与细分类特征,利用这些分类特征对手写字符进行识别。该方法在CEDAR手写体数字和字符数据库上的实验表明:选取的分类特征能够有效区分相似的手写体字符,提高手写字符的识别率,为脱机手写字符识别研究提供了一种新的方法。  相似文献   

12.
The task of handwritten Chinese character recognition is one of the most challenging areas of human handwriting classification. The main reason for this is related to the writing system itself which encompasses thousands of characters, coupled with high levels of diversity in personal writing styles and attributes. Much of the existing work for both online and off-line handwritten Chinese character recognition has focused on methods which employ feature extraction and segmentation steps. The preprocessed data from these steps form the basis for the subsequent classification and recognition phases. This paper proposes an approach for handwritten Chinese character recognition and classification using only an image alignment technique and does not require the aforementioned steps. Rather than extracting features from the image, which often means building models from very large training data, the proposed method instead uses the mean image transformations as a basis for model building. The use of an image-only model means that no subjective tuning of the feature extraction is required. In addition by employing a fuzzy-entropy-based metric, the work also entails improved ability to model different types of uncertainty. The classifier is a simple distance-based nearest neighbour classification system based on template matching. The approach is applied to a publicly available real-world database of handwritten Chinese characters and demonstrates that it can achieve high classification accuracy and is robust in the presence of noise.  相似文献   

13.
SVM在小字符集脱机手写体汉字识别中的应用研究   总被引:5,自引:2,他引:5  
石繁槐  童学锋 《计算机工程》2002,28(6):154-155,189
提出将SVM方法引入小字符集脱机手写体汉字识别,利用较少的训练样本就可以达到比较理想的识别效果,并在小校本学习的情况下同最小距离法和多重相似度法的识别率和识别时间作了比较,说明SVM方法在小字符集脱机手写体汉字识别中实用性。  相似文献   

14.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

15.
Analysis of stroke structures of handwritten Chinese characters   总被引:3,自引:0,他引:3  
Most handwritten Chinese character recognition systems suffer from the variations in geometrical features for different writing styles. The stroke structures of different styles have proved to be more consistent than geometrical features. In an on-line recognition system, the stroke structure can be obtained according to the sequences of writing via a pen-based input device such as a tablet. But in an off-line recognition system, the input characters are scanned optically and saved as raster images, so the stroke structure information is not available. In this paper, we propose a method to extract strokes from an off-line handwritten Chinese character. We have developed four new techniques: 1) a new thinning algorithm based on Euclidean distance transformation and gradient oriented tracing, 2) a new line approximation method based on curvature segmentation, 3) artifact removal strategies based on geometrical analysis, and 4) stroke segmentation rules based on splitting, merging and directional analysis. Using these techniques, we can extract and trace the strokes in an off-line handwritten Chinese character accurately and efficiently.  相似文献   

16.
In this paper, an off-line recognition system based on multifeature and multilevel classification is presented for handwritten Chinese characters. Ten classes of multifeatures, such as peripheral shape features, stroke density features, and stroke direction features, are used in this system. The multilevel classification scheme consists of a group classifier and a five-level character classifier, where two new technologies, overlap clustering and Gaussian distribution selector are developed. Experiments have been conducted to recognize 5,401 daily-used Chinese characters. The recognition rate is about 90 percent for a unique candidate, and 98 percent for multichoice with 10 candidates  相似文献   

17.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

18.
介绍了一个实用的手写成绩单识别系统,它既可以识别手写的数字成绩单,也可以识别手写的汉字成绩单。对脱机手写汉字的识别,提出了一种基于隐马尔可夫模型的识别方法。  相似文献   

19.
由于手写哈萨克字符结构的特殊性,仅提取几种单一的字符特征进行识别时正确率较低,识别效果较差。由此采用改进的PCA方法定位单词基线位置,对每个字符提取包括笔画密度特征、投影特征、轮廓特征等在内的36种特征,使用K-W检验对各特征的分类能力进行比较,并采用线性判别函数进行分类,取得了较高的识别精度。实验结果表明,该系统针对脱机字符识别率达到94%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号