首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 22 毫秒
1.
目的 研究手写汉字图像时,骨架是最为常见的切入点之一。利用传统细化算法提取手写汉字骨架,容易在笔画交叉等情况复杂的区域产生形变。针对此问题,提出一种基于局部关联度的手写汉字骨架提取算法。方法 首先对手写汉字图像进行细化以获取原始骨架,按照端点、普通点和复杂点3种类别标注骨架点;利用8邻域窗口扫描相互连通的复杂点,检测并提取复杂区域;删除复杂区域,将原始骨架拆分为若干简单笔画段,形变部分在此过程中被一并移除;提取局部子段,根据笔画段间的方向差异程度和曲率变化程度,计算局部关联度;制定一种局部关联度最优的连接策略,对满足连接条件的笔画段进行插值补偿,从而修正形变,并得到完整的汉字骨架。结果 对于600个实验样本,从骨架直接检测复杂区域所得结果十分接近理想情况,而轮廓法所得数量是理论值的2.5倍;基于局部关联度重组笔画段,绝大多数形变得到修正,重组后的骨架符合真实拓扑结构;以标准骨架为参考,骨架提取准确率达到了98.41%。结论 局部关联度最优的手写汉字骨架提取算法,能够有效检测复杂区域,对形变具有良好的修正作用,提取所得骨架能够正确反映复杂笔画间的位置结构关系,是一种实用有效的骨架提取方法。  相似文献   

2.
一种现代藏文笔段提取算法   总被引:7,自引:0,他引:7  
针对藏文字符笔段的几何特征和拓扑结构,本文提出了一种基于字符轮廓信息的藏文笔段提取算法:通过链码跟踪的方法得到笔段轮廓的点列,然后从点列中提取特征点并利用特征点切分出笔段,最后用笔段的轮廓线代替骨架线来表征藏文的笔段。本算法用于印刷体藏文笔段提取,取得了良好的效果,避免了传统细化算法所造成的畸变,提高了笔段提取的抗干扰能力,并减小了计算量,加快了特征提取的速度。  相似文献   

3.
基于骨架点分布规律的汉字笔段提取算法   总被引:4,自引:0,他引:4       下载免费PDF全文
提出了一种提取汉字笔段的新方法。从形态学骨架算法生成的骨架点出发,通过分析骨架点的半径分布及不同半径骨架点的位置,发现了笔段提取中产生的毛刺和畸变与骨架点半径之间的规律,进而以此规律为基础提出了一种克服毛刺和畸变的汉字笔段提取方法,最后给出了手写体和印刷体汉字笔段提取的实验结果。实验表明,该方法是行之有效的。  相似文献   

4.
脱机手写满文笔画基元的提取和识别   总被引:1,自引:0,他引:1       下载免费PDF全文
笔画的正确提取对文字识别结果至关重要。该文提出并实现了一种全新的满文笔画提取方法。基于满文文字的结构和特征,首先对处理目标进行预处理,确定笔画主干,创建笔画生长法对满文文字笔画实现自动提取。对提取得到的笔画进行分类,然后对照笔画特征库进行识别。试验表明,该方法对规整手写的满文文字的笔画提取和识别有令人满意的效果,为进一步脱机手写满文识别研究奠定了坚实的基础。  相似文献   

5.
现有的手写汉字脱机笔迹鉴别方法存在只能针对特定字符或需要大量样本字符等问题,为此提出一种基于笔画曲率特征的笔迹鉴别方法。首先运用数学形态学对采集的笔迹图像进行预处理,在横、竖、撇、捺四个方向提取具有代表性的笔画骨架,然后对笔画骨架进行圆的重构,提取四个方向笔画圆的曲率作为特征值组成笔迹特征矩,根据待鉴别的笔迹特征矩与数据库中笔迹特征矩向量夹角相似性度量结果对样本做出判断。实验结果表明该文方法对于待鉴别样本字符的内容没有要求,样本字符数量要求低、应用范围广、鲁棒性强。  相似文献   

6.
在手机中实现哈萨克文手写输入是新疆地区哈萨克族用户的需求.基于手机手写屏尺寸的局限性,哈萨克文在手机上以字母为单位输入.在研究了哈萨克文字母结构特征基础上,提出将哈萨克文字符分成主体笔画与附属笔画两部份.利用字符的笔画数做第一级分类,一笔以上的字符按附件二级分类.提取字符的笔画落笔抬笔象限、笔画x方向最大穿越次数、笔画环、笔画x、y方向变化次数及落笔、抬笔走势等20个特征为特征集.通过采集当前手写输入字符的xy坐标序列,提取相应的特征组成用二进制表示的特征数据,与样本库中的样本逐个异或运算比对,取运算后1的个数最少的样本为识别样本,经进一步检验后得到识别的字符及相近的侯选字符.  相似文献   

7.
利用连续帧图象之间的时序关系,提出了一种基于运动图象的手写笔画时序信息提取方法.根据汉字结构特点和汉字识别的需要,此文首先定义了网格时序和笔顺两种手写汉字的笔画时序信息;然后,应用数学形态学方法确定手写汉字笔画像素点出现的图象帧序,并提取网格时序;最后通过笔段提取与融合获取笔顺.从实验结果看,所提取的笔画时序,尤其是起始和终止笔画是正确的,表明该方法有效的.  相似文献   

8.
基于ANN的哈萨克文手写文字识别系统的研究   总被引:2,自引:0,他引:2  
光学字符识别系统在自动处理,人机交互,办公自动化以及商业领域中有非常广泛的应用。论文主要讨论如何结合结构方法和神经网络的技术,来实现哈萨克语手写文字识别系统的实现。该方法有以下几个优点:方法使用了基于规则(结构)的方法和分类测试;方法更加适合于像哈萨克文字一样具有较大的字符集和字符尺寸不一致的字符集;特征提取的代价较低,运行时间主要由字符尺寸和字体决定。该系统使用一个五层的人工神经网络对字符进行分类,使用10个用户的不同的手写字体进行测试,正确识别率为91%。  相似文献   

9.
一种笔段网格汉字字形描述方法   总被引:7,自引:0,他引:7  
现有计算机汉字字形描述方法在特征选取、字形比对计算方面存在缺陷,无法解决输入错字、古籍异体字、拼合字和自动比对字形等问题.面向应用提出一种具有颗粒度适当、无歧义、规范化基元特征,能描述一切可能字形(包括错字、异体字、拼合字)骨架异同的笔段网格汉字字形描述方法,并基于该描述给出了简单笔画、复合笔画分类及自动提取、结构关系计算等算法.实验表明,该方法可用于支持各种字形的描画输入和字形整体、局部比对计算.  相似文献   

10.
提出笔触特征三角形方法,它为手写字字形骨架添加毛笔书法效果,以达到美化手写字的目的。该方法首先 提取手写数据中的书法特征和字形结构特征点集,构成字形骨架;然后通过添加笔触特征三角形序列生成笔画宽度信 息;最后利用I3-样条曲线对生成的手写字轮廓线进行平滑,得到最终美化结果。该方法仅利用计算机采集到的手写 汉字的点线坐标信息,以三角形方法为手写汉字添加书法特征,适用于各种手写汉字采集设备。  相似文献   

11.
由于目前计算机缺乏对汉字字形统一有效的形式化描述和比对计算方法,致使无法描画输入所需的各种可能汉字,也无法利用计箅机对字形进行比对分析.提出一种具有颗粒度适当、无歧义、规范化基元,能描述各种可能字形(包括错字、古籍异体字、拼合字)骨架异同的笔段网格汉字字形描述方法;并基于该方法给出了字形比对算法,它能自动提取字形包含的简单笔画和复合笔画,根据字形的不同自适应地选取复合笔画或简单笔画,并以此为单位进行比对;最后将计算两字形最优配对笔画间的向量距离总和作为比对结果.实验结果表明,该方法具有很强的字形描述能力,字形比对算法对结构规范字形的比对准确牢较高,可用于支持各种汉字的描画输入及面向字形比对分析的各种应用.  相似文献   

12.
基于笔划特征的手写体汉字字符识别   总被引:1,自引:0,他引:1  
本文提出了一种利用笔划提取骨架结构特征的手写体汉字字符识别方法。首先,以二进制字符模式的直线长度来决定笔划的方向,根据其方向和它们相互关系,将笔划分为笔划段和分叉段,然后提取笔划的骨架,亦称之为骨架段,在提取了所有的轮廓段后,对分叉段进行处理,找到分叉点和分叉角。轮廓段和分叉段在分叉点处相连,这样所有相连的骨架段构成了字符的骨架,根据提取的轮廓和分叉点,我们可以得到用于识别的基本笔划和笔划方向图。  相似文献   

13.
针对传统手写英语字体存在语法错误检测准确率低,导致语法纠错效果不佳的问题。提出基于机器视觉的手写英语自动翻译语法错误检测系统。首先触发采集传感器,利用工业相机对手写英语字体进行拍摄和字体采集;然后利用处理算法对手写英语字体轮廓进行提取和识别定位;之后对识别字体特征进行重排序处理;最后通过训练后的基于BERT的英语语法错误检测模型进行语法错误检测。实验表明,对比于其他语法错误检测模型,本模型在测试集上的检测精确度明显更高,其最高可达90%。在120幅不同类别的英语手写图像中,本系统的英语语法检错正确率高达99.62%,比传统的人工检测方法高出了41.66%,且本系统进行语法错误检测的所用时间控制在25 s以下,相较于人工检测方式低了5倍。由此可知,本系统可实现手写英语字体的准确识别和分类,通过本模型能够提升手写英语语法错误检测率和效率,从而进一步提高了语法纠错效果。  相似文献   

14.
吕新桥 《软件学报》2008,19(Z1):52-58
汉字的基本特征表示是笔段,提出一种基于多边形逼近和有限状态机的笔段提取-合并算法.该算法首先找到笔画的拐点(最小内角值小于指定阈值),然后分别寻找拐点两侧曲线段上的拐点,反复执行,直到再也找不到拐点为止.依次连接一个笔画中所有曲线的起点和终点,就形成了该笔画的笔段系列.随后,运用有限状态机描述并判定笔段的状态,并以此判定笔段的合并要求,以最大限度地减少冗余笔段.实验表明,这种算法具有较低的计算复杂度和很好的逼近效果,能适应手写汉字的笔段提取合并要求.  相似文献   

15.
为解决现有汉字细化算法中的骨架断裂、交叉点畸变等问题,提出一种K-P (Kmeans++-PCA)算法,优化现有的手写汉字细化算法。提出交叉点匹配模板,减少骨架毛刺去除时对非交叉点的遍历,借助主成分分析算法与端点距离对骨架断点进行连接判断,对骨架交叉点畸变进行处理,使用点到边界方向距离算法提取交叉区域后结合Kmeans++聚类对畸变区域进行分析,利用笔画走势信息对骨架进行修复并使用B样插值算法完成骨架重建。将优化后的算法在手写汉字数据集上进行实验,验证了优化后的算法优于优化前的算法。  相似文献   

16.
针对手写汉字笔画提取的重点和难点--模糊区域的识别和解析问题,提出了一种新的基于模糊区域检测的笔画提取算法.该算法首先利用细化算法提取的fork候选点和fork候选点附近的轮廓信息来检测模糊区域;然后利用图模型来对子笔画和模糊区域进行建模,同时通过构造贝叶斯分类器来分析子笔画对的连续性,并通过路径搜索来得到子笔画序列;最后通过进行B样条插值来提取细化后的笔画.对比实验结果表明,该算法不仅能够有效地用于模糊区域检测和笔画提取,而且能够避免细化结果在模糊区域内的形状畸变.  相似文献   

17.
由于对字符提取骨架往往会失去受污损部位的重要信息,因此本文提出了一种基于蚁群算法的现代藏文字符轮廓提取算法,旨在用字符的轮廓线代替骨架线来表征字符。本算法用于印刷体藏文轮廓提取,取得了良好的效果,避免了传统细化算法造成的畸变,提高了轮廓提取的抗干扰能力,并且减小了计算量,加快了特征提取的速度。  相似文献   

18.
刘世龙  马智亮 《图学学报》2021,42(5):816-822
当前预制构配件钢筋骨架质量检查主要依靠人工,存在效率低、容易出错的问题。建筑信息模 型(BIM)、三维重建等技术为改进预制构配件钢筋骨架质量检查方法提供可能。运用这些技术时,有必要由钢 筋骨架 BIM 模型生成可区分每根钢筋的点云。为此,提出了语义设计点云的概念,并构建了基于 BIM 的钢筋 骨架语义设计点云自动生成算法。该算法首先从钢筋骨架 BIM 模型中提取每根钢筋并分别存储于不同的文件, 然后对每根钢筋所在文件进行格式转换,接着生成每根钢筋的语义设计点云,最后基于每根钢筋的语义设计点 云生成钢筋骨架语义设计点云。分别用简单钢筋骨架和复杂钢筋骨架对基于 BIM 的钢筋骨架语义设计点云自 动生成算法进行实验验证,结果表明,该算法能够自动并快速地生成准确的钢筋骨架语义设计点云。   相似文献   

19.
TrueType字库是Windows操作系统的通用轮廓字体文件,女书字形轮廓的提取对建立女书TrueType轮廓字库具有重要的意义。该文介绍了一种按照TrueType字库格式提取女书字形轮廓的算法,主要包括女书预处理、轮廓提取、轮廓数据有序化跟踪、轮廓特征点提取等主要步骤。实验结果表明:该算法效果良好,提取的字形轮廓能写入女书Tru-eType字库中,为下一步自动生成TrueType字模打下了基础。  相似文献   

20.
信息的连续采集会造成部分字符存在连笔,进而影响字符识别率.为此,提出一种基于连笔消除的空间手写字符识别方法.将空间手写字符平面化,提取字符拐点和笔画方向特征.为避免笔画的误消除,利用支持向量机把未知字符分为带连笔字符和非连笔字符,通过连笔的书写特征消除连笔,将空间字符轨迹转化为平面字符轨迹,直接用平面字符分类器进行字符识别.实验结果表明,该方法连笔消除效果显著,利用现有字符库即可获得较高的字符识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号