首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对以往车牌字符分割算法在复杂情况下分割准确率低的问题,提出了一种基于新邻域模板的连通域算法的车牌字符分割算法。采用基于新模板的连通域算法粗分割字符;通过自适应阈值投影法进行字符细分割;同时使用区域合并算法保证字符的完整性。实验结果表明,该算法将连通域法与投影法有效结合,能够同时解决汉字不连通、字符粘连和边框粘连等复杂情况,该算法对车牌字符进行分割正确率达99.5%。  相似文献   

2.
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要.文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别.  相似文献   

3.
针对文本图像中的文字难以提取分割的问题,文章提出了一种基于连通域的算法。算法通过连通域阀值分析,将文本块联通,继而将文字成功分割。实验结果表明本算法能快速准确地分割文字。  相似文献   

4.
针对现有字符分割方法应用于非规则排列汉字文本时分割正确率低的问题,提出一种基于连通区域捆绑规则的汉字字符分割方法.首先,提取文本前景并标记连通区域;其次,通过计算连通区域的质心及半径构建其包围圆;然后,根据包围圆大小判断并剔除错误的连通区域;最后,基于汉字的结构特征制定文本连通区域捆绑规则,实现汉字字符的分割.实验表明,与现有方法相比,文中方法在处理非规则排列汉字文本时具有更高的分割正确率,且该方法对规则排列汉字文本的字符分割也具有良好的适用性.  相似文献   

5.
为获得准确的单个车牌字符,提出了一种将连通域法和垂直投影法相结合的车牌字符分割算法。该方法首先根据车牌中每个字母或数字的连通性特点,按照一定的像素准则与相邻像素之间的连通关系扫描目标像素的相邻像素点,找出各自的连通区域;然后对车牌进行垂直投影找出汉字区域,精确地分割出单个字符。实验结果表明,该算法对车牌字符分割的准确性和处理速度都有较大提高,能满足系统实时性和准确性的要求。  相似文献   

6.
针对自然场景中中文文本的提取效率不足的问题,提出了一种基于ISODATA聚类和支持向量机(SVM)结合的自然场景中文文本提取算法。根据文本颜色和笔画的特征通过ISODATA聚类算法和局部分割的方法,分割出类文本区域;利用有效的几何特征,通过连通域分析去除部分非文本域;利用中心聚合方法使结构分离的中文文本合并后,将文本连接成行,提出行级特征用SVM分类出正确文本行及相应文本。实验结果表明,该算法对中文文本具有很好的提取效果和综合性能。  相似文献   

7.
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在...  相似文献   

8.
对车牌图像的二值图进行连通域提取可以解决倾斜带来的问题.提出了一种基于快速连通域标记的字符分割方法.先用改进的Otsu法对车牌图像进行二值化分割,之后基于快速连通域标记算法进行连通域标记,最后对各个连通域进行后续处理提取出全部车牌字符连通域.实验表明,改进的快速连通域标记算法克服了倾斜问题,而且有效地提高了连通域提取的速度,获得较好的字符分割的鲁棒性和实时性.  相似文献   

9.
基于连通分量特征的文本检测与分割   总被引:3,自引:0,他引:3       下载免费PDF全文
自然背景中的文本识别具有巨大的应用价值,但其应用却一直受到文本检测和分割技术的限制。为了更有效地进行文本检测与分割,提出了一种基于连通分量特征的自然场景中文本检测分割算法。该算法首先将原始图片通过Niblack方法分解为许多连通分量;接着,用一个级联分类器和一个SVM组成的两阶段分类模块来验证这些连通分量的文本特征。由于文本连通分量和非文本连通分量在特征上存在差异,大多数非文本会被级联分类器丢弃,而SVM则能在此结果上做进一步的验证,因此最终输出只有文本的二值图像。最后用该算法在测试数据上进行了评估实验,评估结果表明,检测精度超过90%,响应超过93%。  相似文献   

10.
车牌字符分割一直是智能交通领域的一个重要研究方向。在实际应用中有其独特的价值。本文主要研究的是车牌字符的分割算法,应用MATLAB软件,进行深入的分析和仿真研究。为将车牌字符分割为单个字符,首先经过连通域寻找到字符的宽度,然后按照投影的方法找到分割点的位置,最后再通过宽度创建模板以此来进行分割。文中,将连通域法、垂直投影法、模板匹配法相结合,适用于任何通用情况下,算法合理,实验结果表明在理想测试条件下,可以取得较好的分割结果。  相似文献   

11.
针对古代汉字文档的特点,提出了适合于古文档的列切分方法和字切分方法。提出的列切分方法直接对文档的笔画投影进行分析,采用一种基于分层投影过滤和变长间隙阈值的递归切分算法。该算法在列间隔较小、列与格线存在粘连、文档具有一定程度的倾斜的情况下,也能准确地抽取出列,尤其对短列的切分达到了较好的效果。提出的字切分方法分为两步,进行粗切分确定大致的切分位置,采用基于连通域分析与粘连点判断的方法做进一步的细切分。该算法对具有较多粘连和重叠汉字的列,也能较好地切分出完整的单字。实验结果表明,提出的方法用于古代汉字文档切分能够获得较好的效果。  相似文献   

12.
为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法。针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法。利用连通域的删除、合并、拆分等操作对文字进行切分。使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作。对于粘连字,采用改进的滴水算法进行有效切分。实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作。该算法的列切分准确率为97.69%,字切分准确率为87.79%。  相似文献   

13.
数字视频中文字分割算法的研究   总被引:1,自引:2,他引:1  
文章对三种文字分割算法,包括基于阈值的二值化算法、基于分裂/合并的算法和基于纹理的算法,进行了分析、实验与评价,最后提出一种边缘检测——投影——局部区域二值化的文字分割算法,并给出与前面一些算法的比较。  相似文献   

14.
从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态规划,寻找最小能量线,并通过中线区域约束得到不损坏满文文字部件的最佳分割线;最后,依据分割线提取独立满文文本列进而提取满文单词。结果表明,该方法在满文文档图像数据库上取得了较好的分割和提取效果。  相似文献   

15.
16.
Two novel approaches to extract text lines and words from handwritten document are presented. The line segmentation algorithm is based on locating the optimal succession of text and gap areas within vertical zones by applying Viterbi algorithm. Then, a text-line separator drawing technique is applied and finally the connected components are assigned to text lines. Word segmentation is based on a gap metric that exploits the objective function of a soft-margin linear SVM that separates successive connected components. The algorithms tested on the benchmarking datasets of ICDAR07 handwriting segmentation contest and outperformed the participating algorithms.  相似文献   

17.
结合笔画方向信息与SVM的英文文字检测   总被引:1,自引:0,他引:1       下载免费PDF全文
文字检测是文字信息提取系统中最重要的环节。针对在非均匀光照或背景图案复杂等恶劣环境下文本行难以被检测的难题,设计一种通用的基于笔画方向信息图的通用文字检测算法,该算法采用由粗到细的实现框架。在粗的文字行定位中,利用Haar小波和LBP描述符,建立与原图像相对应的笔画方向信息图,经滤波,连通域分析以及PPA后得到候选的文字行;在文字行精确分类中,利用SVM分类器,并结合多种文字的纹理特征,确认最终的文本行区域。针对图片数据库ICDAR03的实验表明该算法能在不同条件下快速,准确地检测出文字区域,文字检测的精确率为0.64,召回率为0.67。  相似文献   

18.
目的 手写文本行提取是文档图像处理中的重要基础步骤,对于无约束手写文本图像,文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。利用传统的几何分割或聚类的方法往往无法保证文本行边缘的精确分割。针对这些问题提出一种基于文本行回归-聚类联合框架的手写文本行提取方法。方法 首先,采用各向异性高斯滤波器组对图像进行多尺度、多方向分析,利用拖尾效应检测脊形结构提取文本行主体区域,并对其骨架化得到文本行回归模型。然后,以连通域为基本图像单元建立超像素表示,为实现超像素的聚类,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现超像素的聚类与所属文本行标注。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。结果 在HIT-MW脱机手写中文文档数据集上进行文本行提取测试,检测率DR为99.83%,识别准确率RA为99.92%。结论 实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。  相似文献   

19.
Text line segmentation in handwritten documents is an important task in the recognition of historical documents. Handwritten document images contain text lines with multiple orientations, touching and overlapping characters between consecutive text lines and different document structures, making line segmentation a difficult task. In this paper, we present a new approach for handwritten text line segmentation solving the problems of touching components, curvilinear text lines and horizontally overlapping components. The proposed algorithm formulates line segmentation as finding the central path in the area between two consecutive lines. This is solved as a graph traversal problem. A graph is constructed using the skeleton of the image. Then, a path-finding algorithm is used to find the optimum path between text lines. The proposed algorithm has been evaluated on a comprehensive dataset consisting of five databases: ICDAR2009, ICDAR2013, UMD, the George Washington and the Barcelona Marriages Database. The proposed method outperforms the state-of-the-art considering the different types and difficulties of the benchmarking data.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号