首页 | 官方网站   微博 | 高级检索  
     

文档处理中背景字符的去除
引用本文:张重阳,杨静宇,李伟,孙明明.文档处理中背景字符的去除[J].计算机科学,2006,33(8):229-231.
作者姓名:张重阳  杨静宇  李伟  孙明明
作者单位:1. 南京理工大学计算机科学与技术系,南京210094;中创软件工程股份有限公司博士后工作站,济南250014
2. 南京理工大学计算机科学与技术系,南京210094
摘    要:识别域图像的提取是文档自动处理系统中一个重要的预处理过程。在实际应用中,用户填写的信息常常与版面中的框线和背景字符存在交叠现象,严重影响了系统的性能。本文提出了基于点边距离分析的背景字符去除算法。首先通过灰度图像匹配的方法精定位背景字符子图像;然后利用形态学方法结合笔画的宽度信息对背景字符子图像进行二值化;最后分析像素点到边界距离的变化确定需要填充的像素位置,并通过形态学方法计算像素的填充值。实验采用了真实票据图像中的日期域,实验结果表明本文的方法获得了基本令人满意的效果,背景字符像素被成功去除。

关 键 词:图像处理  文档图像分析  图像匹配  二值化  数学形态学

Removing of Preprinted Characters in Document Image Processing
ZHANG Chong-Yang,YANG Jing-Yu,LI Wei,SUN Ming-Ming.Removing of Preprinted Characters in Document Image Processing[J].Computer Science,2006,33(8):229-231.
Authors:ZHANG Chong-Yang  YANG Jing-Yu  LI Wei  SUN Ming-Ming
Affiliation:1.Department of Computer Science and Technology, Nanjing University of Science and Technology, Nanjing 210094; 2.CVIC SE Co. Ltd. , Jinan 250014
Abstract:Extraction of recognition item is an important preprocess procedure in a Document image analysis system. In reality, user fill-in data usually cross or touch the preprinted lines and characters, creating tremendous problems for the recognition engines. In this paper, we proposed a practical preprinted character removing method. Image matching algorithm is applied to locate the position of the preprinted character, and then the character image is binarized by mathematical morphology method combing with stroke width information. Last, the preprinted character is removed based on the varying of stroke contours. Experiment results on real-life check images demonstrate the efficient of the proposed method.
Keywords:Image processing  Document image analysis  Image matching  Binarization  Mathematical morphology
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号