首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 69 毫秒
1.
目前影响OCR系统识别率的一个重要因素就是字符切分.印刷体字符有一种特殊的字符切分:即斜体字的字符切分.由于斜体字本身的倾斜,所以通过投影特征的信息是很难切分开的.为了进行斜体字的切分,就需要知道斜体字的倾斜角度.本文正是出于寻找斜体字倾斜角度的目的,提出了一种基于Hough变换的中文斜体字倾斜角度的柱测算法.该算法在Hough变换的基础上,对算法作了一定的改进来进行倾斜角度的检测.  相似文献   

2.
斜体印刷字倾斜校正是光学字符识别中字符列切割的重要步骤,为了解决传统算法难以满足字符多样性等问题,提出了一种新的斜体印刷字倾斜角度检测算法.算法将文本行中所有斜体字看成一个整体,首先采用水平模糊去除字符多样性影响的同时保留足够多的倾斜角度信息,再通过垂直投影统计分析测得倾斜角度,从而实现斜体印刷字的倾斜检测与校正.理论分析及仿真结果表明,算法对中文、英文、数字及不同字体的倾斜字符均有效,测角正确率高、计算量小,具有良好的应用前景.  相似文献   

3.
高性能的多体印刷英文识别系统的实现   总被引:3,自引:0,他引:3  
提高低质量文本图像的识别率是现今文字识别研究的重要方向。文章对倾斜文本行的切分算法,断裂、粘连、交叠字符的切分算法以及后处理作了较为深入的研究,提出一些新的算法。该系统能够识别多达260种字体,包括黑体、斜体等字体,对训练集的识别率达到98.5%,并在实际应用中取得了良好效果。  相似文献   

4.
多知识综合判决的字符切分算法   总被引:3,自引:0,他引:3  
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。  相似文献   

5.
文本行字符基线的精确测定算法   总被引:1,自引:0,他引:1  
本文给出了精确测定文本行字符基线的算法 ,讨论了基线检测的容差 .该算法也可用于手写字符的分析 .实验结果表明 ,我们的基线检测算法对不同大小的字符有满意的处理结果 .  相似文献   

6.
鲁棒的多体印刷英文识别系统的实现   总被引:6,自引:1,他引:5  
文章讨论了设计一个实用的多体英文识别系统中解决的主要问题。该系统能识别多达260种字体,包括斜体和黑体等字体,对训练集的识别率达到99%,对实际文本测试的错误率比TH-OCR2000低56%。文章详细阐述了文本行字切分,特征提取和分类器设计,以及后处理所使用的常用技术,对各种技术的特点进行了分析和比较,并提出了一些新的技术。文章对于OCR系统的设计具有一定的指导意义。  相似文献   

7.
刘阳兴 《计算机应用研究》2011,28(10):3998-4000
针对粘连和搭接字符切分算法的不足,提出一种基于折线切分路径的字符切分算法。该算法利用投影法将粘连搭接字符与非粘连搭接字符分离开,而后结合粘连搭接字符独有的外形特征,通过引入惩罚权重的路径搜索算法快速而准确地得到粘连搭接字符间的折线切分路径;为了避免一些字符在以上的切分过程中被误切碎,利用识别反馈信息对一些字符子图像进行合并。实验结果表明,该算法对印刷体日英混排字符切分有很强的适应性,取得了较理想的切分效果。  相似文献   

8.
魏湘辉  马少平 《计算机科学》2004,31(11):199-201
字符切分是字符识别系统的一个重要环节。粘连则是指字符图像问有笔画接触的情况,它普遍存在于手写和低质量的印刷文档中。然而普通切分算法很难处理粘连字符。本文综述了主要的粘连字符切分算法以及切分路径的评价方法,在详细介绍算法流程的基础上,对每种算法的优缺点以及粘连字符切分的未来工作进行了探讨。  相似文献   

9.
基于模具的手写数字串切分算法及其应用   总被引:3,自引:0,他引:3  
张洪刚  吴铭  刘刚  郭军 《计算机学报》2003,26(7):819-824
提出了一种基于模具的手写数字串切分算法,该算法通过总结手写数字串中字符之间的连接特点,归纳出一套合理的切分曲线类型,并根据这些曲线类型设计出多种切分模具,从而将字符的切分过程变为各种模具的试用和优选过程.通过在银行票据OCR系统中的应用,验证了算法的有效性.  相似文献   

10.
一种视频中字符的集成型切分与识别算法   总被引:3,自引:0,他引:3  
杨武夷  张树武 《自动化学报》2010,36(10):1468-1476
视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率.  相似文献   

11.
计算机光学乐谱识别技术是将传统的纸质型乐谱转化为计算机能够“读懂”的数字音乐,在计算机音乐领域中具有重要的应用价值、乐谱识别系统的输入是乐谱扫描图像,而扫描过程中出现的图像倾斜现象,会给识别过程中的谱线定位和谱段切割带来诸多困难,必须对图像作有效的倾斜校正以保证系统的性能。为此,提出了一种快速的乐谱图像倾角检测方法。该方法首先利用乐谱文档的自身结构特点,对图像进行预处理,滤除乐谱图像中不具备方向性的干扰像素,然后通过多组图像水平投影队列间的交叉相关性计算对倾角进行检测。其特点是在确保检测倾角精度的同时具有非常高的执行效率。实验结果表明这一方法是有效、实用的。  相似文献   

12.
一种快速的文本倾斜检测方法   总被引:2,自引:0,他引:2  
文本的倾斜检测是将文本转换成数字形式的过程中的第一步工作,也是很重要的一步工作。因为后续的很多工作都是基于摆正的文本。文章提出了一种全新的倾斜检测与纠正方法。其特点在于:一、与文本的纹理无关,从而适应各种图文混排及各种书写方向并存等复杂情形;二、运算量小,只需进行一次旋转和四次对图像的部分投影。  相似文献   

13.
基于直线拟合的文本倾斜检测算法   总被引:6,自引:0,他引:6  
在文本扫描输入的过程中,文本图像不可避免地会发生倾斜,而布局分析及字符识别算法对页面倾斜十分敏感,因此倾斜检测和校正是文档分析预处理中的重要环节。提出了一个基于直线拟合的倾斜检测方法,它对文本图像二值化、分块,进行Fourier变换获得Fourier光谱,提取Fourier光谱中反映倾斜角的特征点,然后对特征点进行拟合处理,最后获得页面倾斜角。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受文本布局、行间距以及字体的影响。  相似文献   

14.
灰度名片图像快速倾斜检测和校正方法   总被引:4,自引:1,他引:4  
本文针对名片OCR系统的要求,提出了一种新的根据图像扫描时产生的黑色边缘来检测灰度名片图像倾斜角度的方法。该方法先检测出名片的四条边缘拟合直线,由四条边缘拟合直线的倾斜角度来确定名片图像倾斜角度,然后采用逐段整块搬移的方法来对图像进行倾斜校正,再根据边缘拟合直线位置去除黑边。实验表明,该方法具有很快的速度和很高的正确率,是一种实用价值较高的方法。而且,该方法能推广应用于其它灰度和彩色扫描图像的倾斜检测和校正。  相似文献   

15.
圆形指针式仪表的倾斜,不利于仪表数字参数区域字符图像的定位和识别。提出一种基于检测仪表名称倾斜的方法来获得圆形指针式仪表的倾斜角度。该方法将仪表表盘上的仪表名称看成一个整体,结合Canny算子、形态学与Hough变换算子来检测其倾斜角度,然后根据该倾斜角度绕仪表表盘中心点对表盘进行旋转校正,使仪表参数区域字符回到固定位置,方便仪表数字参数区域字符的定位与提高数字字符识别的正确率。实验结果表明:该算法能快速准确地检测出圆形指针式仪表图像的倾斜角度,有一定的实用价值。  相似文献   

16.
一种改进的中文文档图像倾斜检测方法   总被引:4,自引:0,他引:4  
孙楠  刘志文 《计算机仿真》2006,23(9):184-187
图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在Visual C++下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。  相似文献   

17.
一种对于横竖混排中文版面倾斜的校正算法   总被引:2,自引:0,他引:2  
文章提出了一种对于横竖混排中文版面倾斜的校正方法。通过对数字图像进行遍历,得到版面上的所有连通体。然后切分横竖混排区域,并以连通体行为单位先计算每行的倾斜角度,获得直方图,并作平滑处理,得到版面实际的倾斜角,最后进行相关的变换校正。文章最后给出了测试数据及结果分析。  相似文献   

18.
在硬盘装配过程中,通常需要对磁头间的磁头偏置误差进行预校准,并实施有效的补偿措施以减少磁头切换时的寻址误差,提高读写效率。然而,由于剧烈震动或不当操作等因素的影响,校准好的磁头偏置可能偏离预校准值,从而导致硬盘寻址或读写性能的下降以及伺服启动时间的延长。提出了一种在硬盘正常启动过程中快速有效的磁头偏置的检测和补偿算法,设计了与磁盘扇区绑定磁头偏置滤波方案。实验表明此方法可以快速有效地识别磁头偏置,并启动相应的校准操作,提高了硬盘在剧烈震动后的伺服性能。  相似文献   

19.
Hough变换在中文名片图像倾斜校正中的应用   总被引:15,自引:0,他引:15  
近来,文档图像的计算机自动理解已取得很多进展。但是,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片版面复杂,名片中文字行以及每行字符较少,使得现有的倾斜校正算法在处理名片图像时效果很不理想。Hough变换可用于一般文档图像的倾斜校正。但是,Hough变换在名片图像中的应用还有待研究。本文提出一种二级Hough变换算法,并应用于名片图像理解系统,利用名片图像自身的特点提高Hough变换的精确度和速度。这一方法的效果已被实验结果所证实。  相似文献   

20.
A Document Skew Detection Method Using the Hough Transform   总被引:4,自引:0,他引:4  
Document image processing has become an increasingly important technology in the automation of office documentation tasks. Automatic document scanners such as text readers and OCR (Optical Character Recognition) systems are an essential component of systems capable of those tasks. One of the problems in this field is that the document to be read is not always placed correctly on a flatbed scanner. This means that the document may be skewed on the scanner bed, resulting in a skewed image. This skew has a detrimental effect on document on document analysis, document understanding, and character segmentation and recognition. Consequently, detecting the skew of a document image and correcting it are important issues in realising a practical document reader. In this paper we describe a new algorithm for skew detection. We then compare the performance and results of this skew detection algorithm to other publidhed methods form O'Gorman, Hinds, Le, Baird, Posel and Akuyama. Finally, we discuss the theory of skew detection and the different apporaches taken to solve the problem of skew in documents. The skew correction algorithm we propose has been shown to be extremenly fast, with run times averaging under 0.25 CPU seconds to calculate the angle on the DEC 5000/20 workstation. Received: 21 November 1998, Received in revised form: 25 August 1999, Accepted: 20 October 1999  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号