首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
黄海凌  刘列根  张宇 《计算机工程》2008,34(15):231-233
文档图像处理技术是实现对网络上以“图片化”形式发送的垃圾邮件进行检测和过滤的有效手段。该文对彩色文档图像的版面进行分析,目的是分割出图像中的特定目标,便于分析并检测出文档图像中是否含有特别字符信息,从而使得网络垃圾邮件过滤系统可以根据这些信息判断是否过滤该邮件。实验结果表明,上述方法可以在不同颜色深度和不同几何结构的彩色文档图像中进行有效的检测,具有较好的实用性和应用价值。  相似文献   

2.
本原元和本原多项式是有限域理论中的2个重要的概念.本原元的求解问题是解决实际密码序列问题的前提条件,而本原元的求解问题又可以归结为本原多项式的求解问题.该文结合求解最小多项式的方法给出一个在二元有限域上本原多项式的求解算法,在求解过程中同时给出了相应的最小多项式,并给出了算法相应的效能分析.  相似文献   

3.
介绍了一种基于版面结构距离的文档图像检索算法,使用版面特征作为文档图像的特征检索图像.先将文档图像进行梯度和最大梯度差(MGD)计算,然后使用MGD值作为一个窗口对文本区域进行融合,将文档图像以行线的形式标示出来.同时给出了检索的匹配方法,并对匹配方法进行了实验.实验结果表明,该检索方法具有较高的查准率,具有很好的抗倾斜和抗缩放效果.  相似文献   

4.
针对传真图像,为了提高版面分割与分类准确率,提高处理速度,以连通区域为处理元素,通过合理设定阈值,将水平和垂直相邻连通区域进行合并,快速准确地分割图像。并且将版面分割过程与分类过程相结合,根据连通区域的大小建立矩阵,提取能够表征区域信息的八维特征,然后使用BP神经网络将版面区域分为文字区域和非文字区域两类。实验中得到版面分割准确率为89.2%,版面分类准确率为94.22%。实验结果证明,该算法能够快速准确地对传真图像进行分割和分类,具有较强的实用价值。  相似文献   

5.
韩冰 《计算机时代》2005,1(10):24-26
从应用角度出发,结合当前文档影像管理系统的特点,分析了常见的文档影像纠偏算法及各自的优缺点,并在此基础上有针对性地提出了文档影像的快速纠偏算法.目前文档影像管理系统主要应用于各行业的档案管理部门,文档影像内容的不确定性很强,加之高速文档扫描仪的自动馈纸机制使在扫描过程中难免会产生文档影像的倾斜,在很大程度上限制了整个系统的运行效率,增加了建立索引环节的工作强度.文章提出的纠偏算法具有适应性好、鲁棒性强、纠偏速度快等特点,有很大的应用价值.  相似文献   

6.
汉字识别系统中的版面分析算法   总被引:2,自引:0,他引:2  
本文在简要介绍版面分析技术发展状况和常见版面分析技术路线的基础上,提出了一种将“自底向上”与“自顶向下”分析路线相结合的版面分析算法。  相似文献   

7.
表格结构定位是文档图象版面结构分析中的重要研究内容.为了准确进行普通文档图象中表格结构的自动定位,提出了一种基于数据分隔符、线条连通区域的表格结构定位算法,并建立了系统的表格结构检查机制,该算法不仅能够有效克服表格结构多样性、不稳定性造成的定位错误,而且能保证表格结构定位的准确和完整.经包含101页实际文档图象的样本集进行测试,该方法的定位正确率达到97.72%.  相似文献   

8.
介绍了一种改进的二值图像连通域快速标记方法。该算法首先找出二值图像中每行的像素直线段,接着利用链表来确定它们之间的连通关系,以此来克服同类算法中像素重复标记和标记归并需大量运算等缺陷,具有一定的使用价值。  相似文献   

9.
针对文本图像中的文字难以提取分割的问题,文章提出了一种基于连通域的算法。算法通过连通域阀值分析,将文本块联通,继而将文字成功分割。实验结果表明本算法能快速准确地分割文字。  相似文献   

10.
一个基于规则的图书逻辑结构提取算法   总被引:1,自引:0,他引:1  
在数字图书馆建设中,一个急需解决的问题是如何自动化地将海量的纸张图书数字化为电子文档。对于生成图书电子文档而言,除了文档内容信息以外,文档版面信息和文档逻辑信息同样重要。该文提出了一种基于规则的图书逻辑结构提取算法。从多页图书文档的模型描述出发,通过采用基于规则的推理方法,提取出图书中的逻辑元素并确定各元素间的层次关系和相互联系,从而得到了整本图书的逻辑结构。实验结果证明了算法的有效性。  相似文献   

11.
伪随机序列中本原多项式生成算法   总被引:5,自引:0,他引:5  
吕辉  何晶  王刚 《计算机工程》2004,30(16):108-109,165
伪随机序列在现代通信技术中有着非常重要的作用,其技术关键是实现本原多项式。该文根据本原多项式的定义和相关代数理论,给出了寻找本原多项式的通用算法和计算机实现方法,并通过验,证明了算法的正确性。  相似文献   

12.
提出一种基于游程标号回传的二值图像连通体标记算法,该算法以游程为处理对象,将目标结构中的标号传播到游程结构中,进行游程连通性判断,将与当前游程连通的游程中最小值回传到对应的目标结构中,确保在同一连通域中有相同的根标号,进而完成二值图像标记。该算法对二值图像可以实现一次性标记,同时完成连通区域的面积、质心等特征信息的提取。具有占用内存小、实现简单、能标记任意复杂连通区域的优点,可用于红外弱小目标的检测。  相似文献   

13.
针对扭曲中文文本图像文字识别率不理想这一问题,提出一种基于连通域的文本图像快速扭曲校正方法。根据汉字结构特征合并连通域,实现切分文字;利用就近聚合文字的方法定位文本行,按行垂直校正每个文字位置,获得被校正的图像。实验结果表明,该方法校正速度快,对严重扭曲的中文文本图像能取得较好的校正效果,校正后图像的OCR识别率明显提高。  相似文献   

14.
胡明晓 《计算机工程》2010,36(18):197-199
为实现局部文档集抄袭的识别,将基于回退数与前跳数的广义编辑距离的近似值定义为文档抄袭距离,分析该文档抄袭距离满足三角不等式成立和弱三角不等式成立时的充分条件,提出一种快速全文识别算法,能识别出文档集内涉嫌抄袭的所有文档有序对。实验结果表明,相比其他算法,该算法在兼顾识别召回率的同时效率提高了3倍~5倍。  相似文献   

15.
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。  相似文献   

16.
为了改进全搜索分形编码过程匹配耗时长而导致难以实用的缺点,新定义了规范块灰度值力矩来反映图像块的特征,根据匹配均方根误差与规范块灰度值力矩间的关系,建立一个预先剔除条件来排除许多不大可能匹配range块的domain块.对一个待编码range块,仅在与该range块灰度值力矩数值最接近的domain块的自适应搜索邻域范围内找它的最佳匹配块.仿真结果表明,与全搜索分形图像编码算法相比,三幅测试图像在重建图像质量更好的情况下,能够平均加快它的编码速度58倍.  相似文献   

17.
为提高二值连通域标记的速度,将地址-事件表示AER(Address Event Representation)思想引入到二值图像处理,提出了一种基于事件对等价标号的二值连通域标记方法。该算法无需多次遍历图像中的背景点和冗余目标点,首先将待标记的连通域以AER“事件对”的方式编码保存,通过“事件对”的遍历生成临时标号和等价标记表;然后根据等价表修改临时标号;完成标号映射后最终实现连通域标记。整个算法只处理极低冗余的事件信息,避免了对全图像素的重复扫描与处理。实验结果表明,图像以AER“事件对”方式存储,数据量仅为全帧图像的10%~35%,有较高的压缩比;且该算法速度快,可达到了传统基于等价标号算法的1.5~8倍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号