首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
The offline recognition of Chinese Characters is a very important research field in OCR. In this paper, the authors propose an effective stroke extraction model for Chinese Character based on Stroke Segmentation and Combination. Comparing with the existed models, the experiments prove that it could improve the precision for the stroke extraction and reduce the computation complexity considerably.  相似文献   

2.
目前常用的音序汉字序列并不符合中国人对汉字排序的观念,能够反应汉字特征的是汉字的笔画.结合汉字的重编码与汉字笔画排序规则,提出在计算机上实现汉字按笔画序规则排序的方法,根据重编码和内码的性质,在第一次排序结果的基础上再进行一次排序,使得排序搜索速度得到有效提高.  相似文献   

3.
本文提出了一种点阵汉字的笔画字模的描述方法以及基于这种描述方法的汉字笔画提取的算法和实现。  相似文献   

4.
汉字书写的考查是推广规范字的一项重要措施,而汉字的笔顺是体现书写规范的一项标准。汉字笔顺书写等级训练系统是针对高等师范学校大学生设计的。系统根据汉字笔画顺序的特点构建基于汉字笔顺编码的汉字库,同时为学生提供练习汉字笔顺和进行自我测验的平台。  相似文献   

5.
在汉字书写场景中,我们可以通过实时捕捉手写者的手写轨迹数据,并可以通过笔画类型、空间关系等构字要素逻辑地位等评价策略,实现汉字书写质量智能测评,以达到指导学习书写的目的。其中笔画分类是手写字体评估中的重要任务。然而,现有笔画级标注的汉字数据集很少,并缺少轻量化并可以应用于嵌入式设备的笔画分类方案,难以工程化落地。在不同设备上采集用户的手写笔画数据(如会议平板、电子白板、学习机等),并使用特征工程,采用一维深度可分离卷积构建轻量化的快速汉字笔画分类模型,并把模型进行量化部署到嵌入式设备中。模型量化后的tflite格式文件大小仅为11kb,而在数据集上达到了97%的精确度。把量化后的模型部署到嵌入式设备中并进行了商业化上线。  相似文献   

6.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

7.
完全基于结构知识的汉字笔画抽取方法   总被引:16,自引:1,他引:16  
从汉字结构知识出发,提出了一种从汉字图像直接抽取笔画的算法,给出了抽取横、竖、撇、捺4种笔画的完全量化的昨去除不同字体的笔画修饰噪声的规则,该方法较好地解决了各笔画的相交、相连及噪声排队等总理2,综在汉字识别及字体自动生成等汉字信息处理方面有重要作用。  相似文献   

8.
提出了一种获得汉字笔画种类及其拓扑结构的新方法.通过分析TrueType字库存储的汉字字形信息,构造笔画图形并提取出笔画特征,采用统计分类和边界关键点定位相结合的方法,利用综合分类法实现了对二级6763个汉字的笔画种类和拓扑结构的基于XML的语义知识表达,可结合前端输入程序进行快速搜索和定位.为字体变形、字体自动生成、汉字知识挖掘等提供了必需的基本信息.实验表明这种方法能够准确、有效地识别汉字笔画及其拓扑结构.  相似文献   

9.
利用连续帧图象之间的时序关系,提出了一种基于运动图象的手写笔画时序信息提取方法.根据汉字结构特点和汉字识别的需要,此文首先定义了网格时序和笔顺两种手写汉字的笔画时序信息;然后,应用数学形态学方法确定手写汉字笔画像素点出现的图象帧序,并提取网格时序;最后通过笔段提取与融合获取笔顺.从实验结果看,所提取的笔画时序,尤其是起始和终止笔画是正确的,表明该方法有效的.  相似文献   

10.
王建平  蔺菲  陈军 《计算机工程》2007,33(10):230-232,248
提出了手写体汉字笔画宽度提取、基于提取出的笔画宽度归一化手写体汉字的方法,给出手写体汉字笔画重构的思想,实现了一种基于手写体汉字笔画提取的汉字重构并最终识别手写体汉字的算法,构建了手写体汉字的识别系统。实验证实,该方法可保证原有笔画特征信息,且能有效地识别手写体汉字。  相似文献   

11.
为解决办公人员在进行文档写作时存在各种文本格式和内容错误的问题,设计基于深度学习的文本自动纠错系统,用于辅助办公人员的写作和校对工作;分析办公人员的文本纠错需求,并进行文本格式与内容纠错方法研究;设计系统由写作模板生成、文本格式纠错和文本内容纠错三个功能组成;首先,设计文本要素识别与检查算法并基于VBA技术实现文本格式校对;然后基于Seq2Seq深度学习模型训练字词、语法和标点符号查错模型完成公文内容纠错,并根据办公人员工作需求建立纠错辅助字库提升系统纠错准确率;最终,通过系统测试实验结果表明,设计系统能够极大地提升办公人员写作效率并减轻文本校对工作负担。  相似文献   

12.
针对RSSI信号强度定位方法中当发射节点和接收节点之间的无线电传播路径被障碍物阻挡而造成噪声误差,使得节点定位欠精确的问题,设计了一种基于混合高斯模型进行测距误差修正和EM-SOM的节点定位算法;首先,通过混合高斯模型对RSSI获得的测量距离误差进行建模,通过EM方法对混合高斯模型中的各参数即各高斯模型的权值、均值和协方差进行训练,采用自组织的SOM对测量距离样本进行聚类,获得各高斯模型的初始权值,最后,将测量距离输入训练后的高斯模型获得较为真实的距离值,并通过极大似然估计进行节点的定位;实验结果表明文中方法能对具有噪声误差的节点进行定位,且相对其它方法,具有平均定位误差和均方根误差小的优点,具有较大的优越性。  相似文献   

13.
研究了英语语法中冠词错误的计算机自动纠正. 首先对冠词使用的错误进行定义分类, 并考虑到可能出现冠词缺失的情况, 通过采用基于最大熵模型的分类器, 选择包含上下文、上下文词性、短语结构等特征, 在训练集上进行模型预的训练, 然后使用模型对于输入句子进行预测并纠正存在的使用错误. 在NUCLE语料的实验中, 给出了语料处理、模型特点、训练语料的大小对于测试集效果的影响, 并且比较了自然语言处理中非常通用的朴素贝叶斯模型的结果, 还根据英语语法中存在的错误特点对模型进行改进, 最后在测试数据达到35.48%的F值, 相较于CoNLL2013的shared task中最好结果有小幅提升.  相似文献   

14.
英语介词纠错系统,针对英语学习者英语语言中常见的介词错误进行计算机自动纠正.首先,对标注过得语料库中介词错误进行了分类统计,总结出21种常见介词,在英语wiki语料库中利用计算机自动错误插值算法获得训练集合.然后在训练集合基础之上,通过使用基于最大熵模型的分类器,选择了包括上下文、介词补足语等特征,在训练集上进行模型的训练,最后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小、迭代次数对于测试集效果的影响,并且比较了朴素贝叶斯模型的结果,最后在测试数据达到27.68的F值,相对于CoNLL2013的shared task中最好结果有小幅提升.  相似文献   

15.
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。  相似文献   

16.
基于笔划宽度提取的手写体汉字归一化方法   总被引:1,自引:0,他引:1  
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。  相似文献   

17.
基于笔划宽度提取的手写体汉字归一化方法   总被引:1,自引:0,他引:1  
王建平  蔺菲 《微机发展》2006,16(10):29-31
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。  相似文献   

18.
基于小波神经网络的非线性误差校正模型及其预测   总被引:6,自引:0,他引:6  
刘丹红  张世英 《控制与决策》2006,21(10):1114-1118
针对非线性系统的预测问题,在线性和非线性协整理论涵义的基础上,提出利用小波神经网络进行非线性协整系统的非线性误差校正模型的研究,并给出该模型的建模方法.对沪深股市进行实证研究,与线性向量自回归模型进行比较.研究证明,小波神经网络所建立的非线性误差校正模型有较好的预测效果,能够有效地预测非线性经济系统.  相似文献   

19.
当前的英文语法纠错模型往往忽略了有利于语法纠错的文本句法知识, 从而使得英语语法纠错模型的纠错能力受到影响. 针对上述问题, 提出一种基于差分融合句法特征的英语语法纠错模型. 首先, 本文提出的句法编码器不仅可以直接从文本中无监督地生成依存关系图和成分句法树信息, 而且还能将上述两种异构的句法结构进行特征融合, 编码成高维的句法表征. 其次, 为了同时利用文本中的语义和句法信息, 差分融合模块先使用差分正则化加强语义编码器捕获句法编码器未能生成的语义特征, 然后采用协同注意力将句法表征和语义表征进一步融合, 作为Transformer编码端的输出特征, 最终输入到解码端, 从而生成语法正确的文本. 在CoNLL-2014 英文纠错任务数据集上进行对比实验, 结果表明, 该方法的准确率和F0.5值优于基于Copy-Augmented Transformer的语法纠错模型, 其F0.5值提升了5.2个百分点, 并且句法知识避免了标注数据过少问题, 具有更优的文本纠错效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号