首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
图像文本定位是图像中文本识别的关键步骤。介绍了文本图像的分类及特征,分析了图像文本定位常用算法的应用范围及优缺点,提出了文本定位算法的评价方法,阐述了文本定位的应用领域,并对今后文本定位的研究方向进行了分析。  相似文献   

2.
图像中的文本定位技术研究综述   总被引:1,自引:0,他引:1  
介绍了图像中文本定位技术的研究现状,依据定位所利用的特征进行分类,分析了其中几种典型算法,并对文本定位算法的性能评价标准进行了深入讨论。  相似文献   

3.
阐述了利用图像特征实现文本图像语种识别的基本过程.该过程分为两个步骤,即文字的识别和语种的识别,文字识别的目的是区分出亚洲文字和拉丁文字,在此基础之上分别应用不同的方法实现具体语种的识别.该方法对本文所讨论的拉丁语种的识别率都在95%以上,对亚洲语种的识别率平均在96%以上.  相似文献   

4.
基于信息度量的图像特征与文本图像分类   总被引:3,自引:1,他引:2  
童莉  平西建 《计算机工程》2004,30(17):143-145
作为一种基本图像类型,文本图像在电子商务等方面得到了广泛应用。针对图像数据库中文本图像识别与分类的应用需求,依据文本图像数据与连续色调图像的总体灰度分布差异,该文提出了一种基于图像信息度量(Picture Information Measure IPIM)的图像特征和基于该特征的文本图像分类方法。约2G、800幅网络图像数据库的分析和实验表明,图像的PIM特征可以显著区分文本图像和连续色调图像,识别和分类效果好。  相似文献   

5.
提出了一种基于模式分析的二值文本图像隐写分析算法。在深入研究当前国内外二值图像信息隐藏和隐写分析算法的基础上,提出了图像"模式"的概念,并将图像模式按照修改其中心像素对人体视觉的影响程度分成三类,建立了二值图像最佳嵌入位置模式库;通过分析二值文本图像的模式在嵌入信息前后的变化特征,提出了基于模式分析的二值文本图像隐写分析算法。实验证明该算法是一种性能较佳的二值文本图像隐写分析算法。  相似文献   

6.
本文提出了一种基于统计模型和相邻字符的学习,在图像中提取多种语言文本的方法。三种相邻字符可以用高斯混合模型和通过“伪概率”定义的贝叶斯结构识别来表示。基于该模型,完整的文本提取由二值化图像根据相邻字符或非字符的判别,标识每个相连部件,基于数字结构的方法用来检测和连接每个分割的字符。Voronoi分割方法考虑建立相邻的连接部件。在本文的提取算法中,进一步提出了运用基于最大——最小相似性(MMS)训练算法的判别标准来评估参数。提取中英文文本的实验结果表明,在试验数据集中,MMS训练算法可实现93.56%的准确率和98.55%的重复利用率。实验也显示了MMS提供的重要特性,并与最大相似性(ML)标准和最大分类误差(MCE)训练作了比较。  相似文献   

7.
视频和图像文本提取方法综述   总被引:1,自引:0,他引:1  
文本提取在视频和图像中具有重要的应用价值。近年来,大数据时代带来了海量信息检索的迫切需求,大量视频和图像中文本的提取方法涌现出来。回顾了视频和图像中文本提取的算法,从文本提取流程出发,将其分为文本区域检测定位和文本分割两大步骤。在每个步骤中,分析并比较了现有算法的使用范围及相对优缺点,讨论了图像公用数据库,列举了近些年来图像中文本提取的重要应用,指出了当前研究中存在的问题,展望了视频和场景图像文本提取方法的发展趋势。  相似文献   

8.
文本提取和相似反馈的互联网图像检索研究   总被引:1,自引:0,他引:1       下载免费PDF全文
使用基于文本的互联网图像检索技术是互联网图像检索最实用的方式,也对其他方式的互联网图像检索有重要辅助作用,但如何利用周边文本来对图像进行准确描述一直是一个难题。利用TFIDF为基础提出了一个基于句法和文本重要性分类的图像关键词权重计算方法,并尝试通过图像的相似性因素作为反馈进一步优化搜索结果,为用户返回最贴切的搜索结果。  相似文献   

9.
为解决现有文本引导图像修复模型在处理文本图像融合时模态间信息缺乏高效融合导致修复结果不真实且语义一致性差的问题,提出一种通过条件批量归一化融合图像文本特征实现文本引导的图像修复模型BATF。首先,通过空间区域归一化编码器对破损和未破损区域分别归一化,减少了直接特征归一化对均值方差偏移的影响;其次,将提取的图像特征与文本特征向量通过深度仿射变换进行融合,增强了生成器网络特征图的视觉语义嵌入,使图像和文本特征得到更有效的融合;最后,为增强修复图像的纹理真实性及语义一致性,设计了一种高效鉴别器并引入了目标感知鉴别器。在CUB brid这个带有文本标签的数据集上进行定量和定性实验表明,提出的模型在PSNR(peak signal-to-noise ratio)、SSIM (structural similarity)以及MAE(mean absolute error)度量指标分别达到了20.86、0.836和23.832。实验结果表明,BATF模型对比现有的MMFL和ALMR模型效果更好,修复的图像既符合给定文本属性的要求又具有高度语义一致性。  相似文献   

10.
二值文本图像信息隐藏分析   总被引:2,自引:0,他引:2       下载免费PDF全文
孟妍妍  高宝建  强媛 《计算机工程》2009,35(15):146-148
通过大量实验发现,基于块中心跳转的二值文本图像密写算法,其二值文本干净图像和密写图像的游程统计特性差别较大,而二值文本密写图像和二次密写图像的游程统计特性差别较小。基于该规律提出一种二值文本图像信息隐藏分析方法,对待测图像进行二次密写,计算待测图像和密写图像游程统计函数的差异值,当差异值大于门限时,待测图像是干净图像,否则是密写图像。通过分类实验的方法确定了几种典型字体的判决门限。实验结果表明,利用该方法和相关判决门限,密写检测率可达99.9%。  相似文献   

11.
金相图像处理与分析   总被引:1,自引:0,他引:1  
采用双门限二值化技术和形态学变换技术对金相图像进行处理,使其晶粒和晶界显得清晰,并且探讨了用Freeman链码编码进行图像压缩的有关技术,并给出了一个适合Freeman链码生成的晶界跟踪算法。提出了填充剔除计数法,用于统计图像中晶粒的颗数,也给出了一个晶粒平均面积和直径的估算公式,为金相的进一步分析打下坚实的基础。  相似文献   

12.
康普顿背散射图象重建算法设计与分析   总被引:2,自引:1,他引:1  
本文阐述了康普顿背散射的基本原理及图像重建时的离散化计算公式,在此基础上进行算法设计,对算法实现的细节进行了讨论,并对几种情况下算法空间复杂度及时间复杂度进行了详细的分析。  相似文献   

13.
基于概念的文本结构分析方法   总被引:25,自引:1,他引:25  
本结构分析是本处理领域中的重要内容,它可以有效地改进本要、本检索以及本过滤的精度、中简要描述了本的物理结构和逻辑结构以及本分析的背景,提出了本结构分析中的层次分析方法。该方法保证了层次是分的有序性,可操作性强,便于解释,不依融于具体领域。其基本思想是对于输入本,首先识别出本的物理结构,然后在概念映射、要领密度和概念消歧的基础上,将本依据主题划分为若干层次;最终获得本的逻  相似文献   

14.
基于混合模式的文本过滤模型   总被引:16,自引:1,他引:15  
文本过滤旨在帮助用户处理自己感兴趣的文本,提出了基于混合模式的文本过滤模式,其基本思想是将基于内容的过滤方法和合作过滤方法结合起来,给出了用户评沪的权威性和一致性度是,以便更好地运用用户的评注信息,在此基础上,结合用户的个人兴趣,给出了文硒特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制,该方法不依赖于具体的领域知识库,大大降低“噪音”影响,并可以适用于多媒体类型文件的过滤和信息服务。  相似文献   

15.
面部表情图像的分析与识别   总被引:24,自引:2,他引:24  
高文  金辉 《计算机学报》1997,20(9):782-789
本文通过对若干类面部表情图像的分析,建立了基于部件分解组合的人脸图像模型。根据对部件形状和相对位置的分析,提出了表情的分类树,建立了表情模型的向量表示。根据能量优化原理,利用模板匹配方法提取目标特征,得到人脸表情的表征向量,由模式分类方法实现表情的识别。  相似文献   

16.
需求分析与获取的方法学与技术   总被引:3,自引:0,他引:3  
本文给出需求工程的一般框架,在对需求分类的基础上主要讨论非功能性(即非行为性)需求,提出对软件需求规范和分析技术的要求,并强调对现有相关工作评价的其中两个方面。  相似文献   

17.
基于对象的彩信图像检索系统是继图像检索和彩信检索结合的新一代信息检索技术,介绍了目前热门的基于对象的图像检索系统的概念,以及应用到彩信检索领域的工作原理.在基于对象的图像检索基础上,加入了对图像中区域对象的识别过程,并将识别结果存入图像属性索引数据库,然后在检索过程中根据用户输入的对象查询请求,到数据库里进行检索,最终将检索结果返回给彩信用户.  相似文献   

18.
本文提出了一种基于线性四分树表示的二值图象四邻域寻找的快速算法。与前人的方法相比,该方法占用机器时间和内存空间都较小,而且该方法能方便地推广到八邻域的寻找。  相似文献   

19.
针对传统的桥梁水下结构缺陷检测方法的弊端,在深入分析缺陷图像像素特征的基础上,提出一种新的基于大津法和最大互信息量相结合的图像分割算法。依据轮廓跟踪原理,计算出桥梁水下结构破损区域的面积、周长等参数。在Visual C++ 6.0开发环境中进行了算法的实现。实验结果表明,该算法在提取图像破损边缘的同时有效地滤除了噪声,精确地计算出破损区域的几何参数,为桥梁水下结构缺陷的定量化识别提供了一种有效的手段。  相似文献   

20.
Textual data is very important in a number of applications such as image database indexing and document understanding. The goal of automatic text location without character recognition capabilities is to extract image regions that contain only text. These regions can then be either fed to an optical character recognition module or highlighted for a user. Text location is a very difficult problem because the characters in text can vary in font, size, spacing, alignment, orientation, color and texture. Further, characters are often embedded in a complex background in the image. We propose a new text location algorithm that is suitable in a number of applications, including conversion of newspaper advertisements from paper documents to their electronic versions, World Wide Web search, color image indexing and video indexing. In many of these applications, it is not necessary to extract all the text, so we emphasize on extracting important text with large size and high contrast. Our algorithm is very fast and has been shown to be successful in extracting important text in a large number of test images.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号