首页 | 官方网站   微博 | 高级检索  
     

一种基于连通域搜索的英文单词切分方法
引用本文:尹芳,李全通,周昕,金飞虎.一种基于连通域搜索的英文单词切分方法[J].哈尔滨理工大学学报,2014,19(5):109-112.
作者姓名:尹芳  李全通  周昕  金飞虎
作者单位:1. 哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150040;哈尔滨理工大学仪器科学与技术博士后科研流动站,黑龙江哈尔滨150040
2. 哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨,150040
基金项目:黑龙江省教育厅科学技术研究项目
摘    要:英文文本识别系统中单词切分效果直接影响系统识别准确率.提出一种有效利用单词中的连通域以实现单词切分的方法,该方法首先对给定的图像文件进行扫描,搜索图像中所存在的所有连通域,然后根据连通域的坐标、尺寸等影响因素,对有效的连通域进行合并,并过滤掉噪声等因素所产生的连通域碎片,以实现有效的英文单词区域的正确分割,从而实现英文单词的正确切分.实验结果表明,针对相同的英文文本图像,该方法对英文单词切分的准确率达95%以上,与垂直投影切分法最高准确率27%相比有较大幅度的提高,证明该方法可以很好解决垂直投影法无法解决的字母之间相互交迭的单词切分问题.

关 键 词:连通域搜索  单词切分  文本识别

A Connected Domain Research Method for English Word Segmentation
YIN Fang,LI Quan-tong,ZHOU Xin,JIN Fei-hu.A Connected Domain Research Method for English Word Segmentation[J].Journal of Harbin University of Science and Technology,2014,19(5):109-112.
Authors:YIN Fang  LI Quan-tong  ZHOU Xin  JIN Fei-hu
Affiliation:YIN Fang, LI Quan-tong , ZHOU Xin , JIN Fei-hu ( 1. School of Computer Science and Technology, Harbin University of Science and Technology, Harbin 150040, China; 2. Instrument Science and Technology Postdoctoral Research Station, Harbin University of Science and Technology, Harbin 150040,China)
Abstract:The word segmentation effect of the English text recognition system directly affects the system identification accuracy.This paper puts forward a connected domain search based word segmentation method,which firstly search whole image to record all the connected domain,then merge connected domain according to the location,size of connected domain.The experimental result shows that the method can better solve the word segmentation with overlapping between the letters than vertical projection method
Keywords:connected domain  word segmentation  text recognition
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号