首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 843 毫秒
1.
提出一种基于文字结构特征的神经网络手写汉字识别策略 ,根据所提取的文字笔画方向、基本轮廓和交叉点等特征 ,采用基于自组织神经网络的模式聚类该方法完成正规手写文字的识别 .该方法提取的笔画轮廓十分准确有效 ,对手写汉字的约束少 ,可识别的汉字数量大 ,在仿真实验中有效地识别了绝大多数手写汉字  相似文献   

2.
场景文字识别的一个具有挑战性的方面是处理具有扭曲或不规则布局的文字.尤其是侧视文字和曲线文字在自然场景中较为常见,且难以识别.本文提出了一个带有灵活矫正功能的注意力增强网络,将其用于任意形状场景文字识别.此网络由基于卷积神经网络的文字矫正网络和基于注意力增强的识别网络两部分组成.矫正网络自适应地将输入图像中的文字进行矫正,降低识别难度,使基于注意力增强的序列识别网络直接根据矫正后的图像预测字符序列.整个模型可以进行端到端的训练,训练只需要图像和相应的文字真实标签.在各种公开数据集上进行了广泛的实验,包括SVT、ICDAR 2003和CUTE80等数据集,验证了此网络具有优异的性能.  相似文献   

3.
针对采用大样本离线训练的车辆识别分类器在新场景中性能显著下降的问题,提出了一种具有样本自标注能力的车辆识别迁移学习算法,并采用概率神经网络(probability neural netw ork,PNN)进行分类器训练.首先,提出一种基于多细节先验信息的样本标注策略,融合复杂度、垂直平面和相对速度等先验信息实现新样本的自动标注;然后,充分利用PNN训练速度快以及增加新样本时只需分类器进行局部更新的特点,将其引入到分类器训练模型中,取代传统机器学习算法中的Adaboost分类器.实验结果表明:该算法在新场景下的新样本标注准确率高达99.76%.通过迁移学习,新场景的车辆识别分类器性能较通用分类器在检测率和误检率指标上均有显著提升.  相似文献   

4.
印刷体蒙古文字识别技术中切分方法的设计与实现   总被引:1,自引:2,他引:1  
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中.  相似文献   

5.
提出了面向模具零件工程图的孔特征识别与分组统计方法,采用特征识别实现了尺寸功能语义的再现,基于此进一步实现了孔系的自动分组统计.该方法在AutoCAD软件中利用VisualLISP得到实现.测试结果表明所提出的算法可以很好地解决尺寸完整性问题,完善了模具零件尺寸自动标注功能.  相似文献   

6.
针对当前图像文字识别与提取的最新发展状况,提出一种基于K-means的图像文字识别与提取算法,其主要处理步骤包括图像的预处理、像素点聚类处理、图层的选择与优化以及最终的文字切分等。经过上机对算法进行测试,该算法能够有效提高图像文字识别与提取的准确率与执行效率,并可以针对不同环境下的图片文字进行有效识别。  相似文献   

7.
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字...  相似文献   

8.
中文嵌套命名实体识别是自然语言处理中一个比较困难的问题.针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务.联合模型用一种改进的beam search算法作为系统的解码算法,并采用一种在线学习算法平均感知器算法作为训练算法,获得了较快的收敛速度和较好的识别效果.实验结果表明基于联合模型的方法对嵌套命名实体识别取得了更好的效果.  相似文献   

9.
根据工程图尺寸标注、粗糙度标注、形位公差标注的拾取方式,获取其DXF (Drawing Exchange Format)组码信息并挖掘出尺寸标注的关键信息.以此建立尺寸标注与图形结构的关系,提出并实现了一种基于图形特征的尺寸识别算法.通过分析各类标注信息的特点,对其进行分类提取,然后以此为据,对尺寸链进行分层式跟踪识别.根据三等原则建立多视图间联系,以点扩线,实现对一题多解现象的综合识别与纠错.  相似文献   

10.
文字识别作为模式识别的一个重要方面,其研究获得广泛重视。本文基于粗集理论的观点,把文字识别问题看作是模式识别中简化知识表达与信息分类处理问题,提出一种新的文字识别方法,这不仅对模式识别中如何提取有用特征是一种新的探索,而且对简化信息处理也是一种新的方法。本文介绍了基于粗集理论的文字知识表达的方法,探讨了模式识别中的特征提取及最小决策算法,并给出一个文字识别的例子来说明这种有效的方法。  相似文献   

11.
汉字笔画若干数据的统计方法研究与应用   总被引:5,自引:0,他引:5  
统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。  相似文献   

12.
该文给出一种汉字子笔划的提取方法 ,较好地解决了因子笔划相交 ,使提取的同类字符子笔划不稳定问题。引入了字符的固定部件划分方法及特征矩阵的概念。字符部件中包含各类子笔划的位置、长度等信息 ,特征矩阵是这些信息的集中体现。设计了一种新的遗传算法 ,由未知字符一个部件的一类子笔划表示的字符与某类模型的相似度 ,既由与其它 3类子笔划相应的相似度调节 ,又由与周围部件同类子笔划相应的相似度调节。实验表明 ,该手写体汉字识别方法是有效的  相似文献   

13.
兼顾连笔和笔顺的联机手写汉字识别方法   总被引:4,自引:0,他引:4  
为解决联机手写汉字识别技术中兼顾连笔和笔顺的难题,提出了联机手写汉字的模糊属性关系图描述和基于知识的松驰匹配方法。该方法能充分描述汉字结构、对手写变形不敏感,并具有良好的连笔字识别能力和适应不同笔顺的特点。基于上述方法,作者实现了一个联机手写汉字识别系统。实验结果表明,本方法能够有效地增加对于低限制书写汉字的识别正确率,并具有较好的抗噪声能力。经过22530汉字测试,首位识别率达98.8%,前十位识别率达99.7%。  相似文献   

14.
基于笔划和笔顺的汉字识别算法   总被引:4,自引:0,他引:4  
以笔划为基元结构笔划的顺序来表示汉字的结构信息,在此基础上提出了一种笔写汉字识虽的匹配算法,对于结构类似的汉字,该算法可以通过特征关系予以识别,从而提高汉字的识别率。  相似文献   

15.
本文着重介绍了将经过相关处理后的联机手写输入的汉字,以笔画为单位规整化为笔段网格描述字形的相关算法.为进一步的汉字字形分析、计算等处理建立了可靠的基础.  相似文献   

16.
汉字动态生成的结构与风格模型   总被引:1,自引:0,他引:1  
提出一种基于汉字结构和风格的字形生成模型。该模型将汉字字形抽象为汉字结构和汉字风格两种模式,并在结构中将汉字笔画抽象为连续的笔元,通过笔元的特征点构造笔元向量、径向量、弦向量和轭向量,进行笔画风格的重建。通过这种方法,动态产生可用于True type个性化汉字字形设计的字形,实现汉字字形的Web存储和在客户端的特征字形输出,克服了现代汉字由于汉字数量巨大而在字形设计方面的不足,为个性化汉字信息的云端存储和云端字形服务提供了一种有效的策略和方法,为设计更深层次的汉字信息服务奠定了基础。  相似文献   

17.
为充分利用汉字结构、轮廓、笔画、书写顺序等特征识别相似汉字,提出基于特征向量和笔顺编码的字形相似算法,用以解决形近字检索中准确度不高的问题。算法采用图像处理方法及五笔编码规则将汉字转化为特征向量形式和笔顺编码字符串,引入二值化差值算法和改进后的Jaro-Winkler Distance算法分别对其进行相似度计算,2个相似度分别从不同方面反映汉字的相似程度,吸取2种方法的优势对其进行融合,得到最终字形相似度。实验结果表明,该算法在字形检索中较3元组递归算法准确率提高27.8%,较模板匹配算法、结构方法、神经网络算法执行效率平均提高约66.7%,该算法不仅可以有效解决形近字检索中的准确性问题,同时效率也得以优化。  相似文献   

18.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。  相似文献   

19.
七笔形声输入法是一种形码与音码相结合的汉字输入法。它确立横,竖,撇,点,折,钩,方7种笔形,从它们的组合笔形中筛选出26种作为码元,再挑选26个与形码元有联系的代表字,将各形码元和代表字分别配于26年拉丁字母作为代码,按所给编码规则,每个字至多3个形码和1个音码,该输入法限制性因素少,适应范围广,成本低,重码率低,击键次数少,应用广,用户可在通用机上操作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号