排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
基于整体特征的快速手写体数字字符识别 总被引:11,自引:0,他引:11
该文通过模拟人眼识别数字字符的过程,提出了一种基于字符整体特征(凹凸特征)的快速手写体数字字符识别方法。该方法不需要对字符图像做复杂的细化处理,减少了细化形变可能带来的误识和拒识;也不需要进行复杂的笔道特征分析,因此速度非常快。同时,由于不同人书写的数字字符的整体特征都相同,因此该方法的识别率也非常高。 相似文献
2.
3.
基于多重索引模型的大规模词典近似匹配算法 总被引:1,自引:0,他引:1
编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法.传统单索引模式很难在高性能的前提下保证高召回率.词典越大问题越严重.提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划分为若干子词典,对各子词典按照一定策略建立unigram,bigram,trigram,quadgram中的一种或若干种索引,当查找用户模式P的近似匹配时,根据模式P检索特定N-gram索引链,从而得到候选近似匹配集合C,对C中每一个单词W,计算P与W的编辑距离即可输出P的所有最终匹配结果R.实验表明,基于多重索引模型的词典近似匹配算法能够大幅度减少候选近似匹配结果的数量,从而提高词典近似匹配的速度. 相似文献
4.
Kad网络节点资源探测分析 总被引:1,自引:0,他引:1
Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。为深入了解Kad网络上资源尤其是敏感资源的特征,运用Kad网络采集器 Rainbow对节点拥有的文件资源进行探测分析。该文发现 1)文件流行度和文件所对应的文件名数量都近似符合Zipf分布;2)利用同一个“文件内容哈希”(即file-content-hash)的多个文件名的共现词可以更准确地进行敏感判别;3)敏感资源占随机样本的6.34%,且敏感资源中74.8%为video文件。 相似文献
5.
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域。 相似文献
6.
本文描述了现有字符细化算法的思想及其缺陷,并且在分析细化形变根源的基础上给出了一种面向字符识别的快速细化算法。该算法不仅速度非常快,而且不会产生毛刺和伪分支点,细化后字符骨架形变很小。 相似文献
7.
1