首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于高等教育自学考试背景,对笔迹鉴别算法进行研究。首先利用多通道的Gabor变换对笔迹纹理图进行特征提取,并通过欧式距离分类器进行分类,在训练样本库中找到与待测样本最相似的5幅笔迹。在此基础上,利用9/7提升小波算法提取出图像高频部分细节特征,对笔迹中的特征单字进行特征提取,综合分析,给出最终鉴别结果。实验结果证明,本算法具有良好的鉴别率。  相似文献   

2.
中文文本分类中特征选择方法的比较   总被引:1,自引:0,他引:1  
在自动文本分类系统中,特征选择是有效的降维数方法.通过实验对中文文本分类中的特征选择方法逐一进行测试研究,力图确定较优的中文文本分类特征选择方法.根据实验得出:在所测试的所有特征选择方法中,统计方法的分类性能最好,其次为信息增益(IG),交叉熵(CE)和文本证据权(WE)也取得了较好的效果,互信息(MI)较差.  相似文献   

3.
本文研究了文档频率DF、信息增益IG、互信息MI、x2分布(CHI)、期望交叉熵、优势率、文本证据权七种不同的特征选取方法。针对DF对高频词过于依赖,以及MI,IG和CHI对低频词过于依赖这一特点,试验了将它们组合起来形成DF—MI,DF-IG两种组合式特征选择方法,同时针对DF的特点提出了新的特征选取方法DFR,用KNN分类器试验了几种组合方法和DFIK方法,实验结果表明DFIK较DF—MI、DF—IG对分类效果有明显的提高,而组合特征选取方法较单个特征选取方法对分类器的分类效果有了很大的提高。  相似文献   

4.
本文研究了文档频率DF、信息增益IG、互信息MI、x2分布(CHI)、期望交叉熵、优势率、文本证据权七种不同的特征选取方法.针对DF对高频词过于依赖,以及MI,IG和CHI对低频词过于依赖这一特点,试验了将它们组合起来形成DF-MI,DF-IG两种组合式特征选择方法-同时针对DF的特点提出了新的特征选取方法DFR-用KNN分类器试验了几种组合方法和DFR方法-实验结果表明DFR较DF-MI、DF-IG对分类效果有明显的提高,而组合特征选取方法较单个特征选取方法对分类器的分类效果有了很大的提高.  相似文献   

5.
基于特征融合的脱机中文笔迹鉴别   总被引:1,自引:0,他引:1  
提出一种基于文本依存笔迹特征融合的文本独立特征构造方法。建立基于方向指数直方图法笔迹特征(文本依存特征)的两因子分解模型。笔迹特征可分解成字符因子和书写因子两部分。通过两因子方差分析与数据挖掘,分离出与字符无关的书写因子,得到基于文本依存方法的文本独立特征。该方法对检材与样本笔迹的字符数量较少,特别是相同字很少或是根本没有相同字的情况下,能取得较理想的笔迹鉴别准确率,为少量字笔迹鉴别提供解决问题的思路。  相似文献   

6.
中文文本分类中特征抽取方法的比较研究   总被引:99,自引:9,他引:99  
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机(SVM)和KNN两种不同的分类器以考察不同抽取方法的有效性。实验结果表明,在英文文本分类中表现良好的特征抽取方法(IG、MI和CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因,并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征抽取方法的有效性。  相似文献   

7.
针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引入可信度函数对单分类器效果进行评价,适时采用辅助分类器对较难分类的文档进行分类投票判决。实验结果表明,相对于单分类器,该方法无论在平面分类和层次分类语料上都获得了更好的分类精度,且具有较好的时间复杂性,有很好的实际应用前景。  相似文献   

8.
针对传统身份识别技术存在的密码记忆难、隐私易泄露、信息易伪造等问题,提出并实现了基于安卓平台的混合特征在线手写笔迹识别算法. 本算法通过迁移传统笔迹采集平台、采用文本相关与文本无关相结合的方式分别对静态纹理特征和动态矢量特征进行提取,弥补了当前笔迹采集困难、信息易伪造、准确性差等缺陷,实现了用户在移动设备上更加快捷安全的进行身份识别和鉴定. 通过实验得出:该笔迹识别算法具有良好的稳定性、高可重复性、优良的准确性和安全防伪能力,能够有效阻止陌生用户的攻击,具有较高的安全保障性能.  相似文献   

9.
特征抽取是中文文本分类的重点和难点,文中比较了不同特征单元对分类性能的影响,将字特征与词特征相结合以期更好地表现文本特征。并在构建的实验系统中比较了不同特征单元的分类准确性,发现采用混合特征来进行分类,能得到较好的分类效果。  相似文献   

10.
在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中,并验证其在中文分类中的效果。相对于目前主流的文本分类方法,基于fastText模型的分类方法在保证分类效果的同时,大大缩短了分类时间。此外,在分类准确率和参数设置方面进行分析并得出相应的优化规则。  相似文献   

11.
This paper compares the current state of the art in online Japanese character recognition with techniques in western handwriting recognition. It discusses important developments in preprocessing, classification, and postprocessing for Japanese character recognition in recent years and relates them to the developments in western handwriting recognition. Comparing eastern and western handwriting recognition techniques allows learning from very different approaches and understanding the underlying common foundations of handwriting recognition. This is very important when it comes to developing compact modules for integrated systems supporting many writing systems capable of recognizing multilanguage documents.Received: January 12, 2002, Accepted: March 6, 2003, Published online: 4 July 2003  相似文献   

12.
在连续手写中文中,有偏旁部首离得较远的单字,单字之间可能会存在粘连、重叠。针对这种情况给出了一种基于识别得分提取单字的演化方法。对行笔划序列进行二进制编码,采用改进的遗传算法实现演化过程。染色体中连续0或1对应的笔划组成候选单字。用汉王手写单字识别器获取它们的识别得分,以单字个数较少和总的识别得分较大为优化目标。遗传算法中的变异概率和交叉概率自适应生成。测试结果表明该方法对连续手写中文具有较好的分割效果。  相似文献   

13.
中文数字墨水文本的分割结果包含单字、文本行和段落三个层次对象,单字在其中占有较大比例,情况复杂。使用自动的分割方法难以提供完全正确的单字提取结果,这时就需要进行人机交互校正单字提取结果。优化的可视化方法可以在人机交互时大大提高校正效率。面向交互校正错误的单字提取结果,针对单字结果间的邻近和重叠等情况,给出了一种自适应的可视化方法。该方法先生成单字的正放最小外接矩形,如果相邻矩形重叠,则改用凸包,仍然重叠,则给单字结果加上颜色。对多种数字墨水文本的单字提取结果进行可视化表示,取得了较好的效果。  相似文献   

14.
Great challenges are faced in the off-line recognition of realistic Chinese handwriting. This paper presents a segmentation-free strategy based on Hidden Markov Model (HMM) to handle this problem, where character segmentation stage is avoided prior to recognition. Handwritten textlines are first converted to observation sequence by sliding windows. Then embedded Baum-Welch algorithm is adopted to train character HMMs. Finally, best character string maximizing the a posteriori is located through Viterbi algorithm. Experiments are conducted on the HIT-MW database written by more than 780 writers. The results show the feasibility of such systems and reveal apparent complementary capacities between the segmentation-free systems and the segmentation-based ones.  相似文献   

15.
手写混合字符集识别的多特征多级分类器设计   总被引:1,自引:0,他引:1  
吴丽芸  王文伟  张平  陈俊 《计算机应用》2005,25(12):2948-2950
针对常用的银行汉字和阿拉伯数字混合字符集的识别,提出了依据不同的分类要求,分别选取不同的分类特征,并采用先聚类再用多层感知器(MLP)神经网络分类的多级分类器进行识别的设计方法。实验结果表明,该方法用于手写体混合字符集的识别是行之有效的。  相似文献   

16.
吴海辉  樊庆林  吴建国 《计算机应用》2008,28(10):2707-2710
设计了一种汉字手写式键盘输入法,给出了基于快速模糊匹配方法的笔画智能生成算法及其实现。该方法在键盘上将汉字笔画模拟表示为笔画轨迹的起点、拐点、中间点和落点的键序列,通过构造笔画的网状搜索空间,实现了键序列到笔画序列集合的转换,进而实现汉字输入。本方法无需记忆键位,会写汉字就会输入。  相似文献   

17.
提出了一种笔段提取新方法,充分利用了撇笔段和捺笔段的轮廓规律,在提取笔段过程中动态改变寻找方向,使提取正确率进一步提高。实验证明了算法的有效性,与传统笔段提取算法相比,正确率由99.3%提高到99.8%以上,为汉字识别创造了更有利的条件。  相似文献   

18.
方应谦  王鲁 《中文信息学报》2000,14(2):26-30,,48,
汉字识别中,以往的分类器设计都是以字为单位的“字分类器”。字分类器的输出总是与待识字结构相似的一个侯选字集合。这是使后级识别容易产生误识的主要原因。为克服字分类器的缺点,本文给出了以词为单位的词分类器设计的策略与方法,并实验验证了词分类器在分类率及分类速度方面均优于字分类器。  相似文献   

19.
提出了一种基于字特征的中文文本分类方法。该方法的出发点是变常用的基于表层的匹配为基于概念的匹配,用汉字特征向量作为文本的表示方法。算法根据文本中汉字的特征建立文本表示矩阵和类别表示矩阵,并通过线性最小二乘算法形成分类矩阵。  相似文献   

20.
The selection of valuable features is crucial in pattern recognition. In this paper we deal with the issue that part of features originate from directional instead of common linear data. Both for directional and linear data a theory for a statistical modeling exists. However, none of these theories gives an integrated solution to problems, where linear and directional variables are to be combined in a single, multivariate probability density function. We describe a general approach for a unified statistical modeling, given the constraint that variances of the circular variables are small. The method is practically evaluated in the context of our online handwriting recognition system frog on hand and the so-called tangent slope angle feature. Recognition results are compared with two alternative modeling approaches. The proposed solution gives significant improvements in recognition accuracy, computational speed and memory requirements.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号