首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 145 毫秒
1.
针对序列图像中的维吾尔文字区域检测问题,提出了一种Harris角点和基线特征相结合的有效方法:首先,将输入的彩色图像灰度化,然后对图像进行Harris角点检测,根据角点分布进一步确定文字基线位置,再对基线位置上的角点进行形态学膨胀操作,最终实现了文本区域的定位。在较大规模的序列图像情况下进行了文本区域检测试验,给出了实验结果与同类算法的对比分析,论证了本算法的有效性和可行性。  相似文献   

2.
为了提高手写维吾尔文本图像的可读性与识别精度,对其倾斜校正显得非常重要.本文以克服传统Hough方法需要手动设置不同参数、计算量繁重等缺点为出发点,在原始启发式学习方法的基础上,确定文本行核心区域、下基线,最终完成倾斜校正,采用大津算法计算阈值,确定文本行核心区域,而后使用最小二乘拟合技术得到文本行下基线;每个倾斜角在合理间隔范围内,对图片采用旋转算法完成倾斜校正.这种技术首次运用在手写维吾尔文本行的倾斜校正中,初步得到了非常明显的实验结果.  相似文献   

3.
字符切分是藏文古籍文档图像分析与识别中重要的一环,针对乌金体藏文古籍文本行倾斜,字符之间笔画交叠、交叉、粘连以及不同程度的笔画断裂、噪声干扰等问题,提出了一种基于结构属性的乌金体藏文字符切分方法.首先,建立了乌金体藏文古籍字符区块库.然后,利用音节点位置信息或结合水平投影与直线检测的方法检测出字符区块的局部基线,并根据基线将字符区块切分为上下两部分;利用改进的模板匹配算法检测基线上方笔画的粘连及其类型,利用多方向、多路径粘连切分算法切分交叉、粘连笔画.最后,根据藏文结构属性对各笔画进行归属,完成字符切分.实验结果表明,本方法能有效解决字符切分中遇到的问题,字符切分的召回率、精确率以及F-Measure可分别达到96.52%、98.24%、97.37%.  相似文献   

4.
针对视频传输过程中,出现误码引起的视频质量严重下降的问题,提出一种改进的视频错误隐藏中的凸集投影算法.该方法主要包括:对丢失块周围的完好块进行能量检测来确定丢失块的类型;根据所确定的丢失块的类型建立闭凸集;迭代求解.实验结果表明,与经典的凸集投影算法相比在信噪比相差不大的情况下大大减少了计算量.  相似文献   

5.
基于笔画特征的叠加文字检测方法   总被引:2,自引:0,他引:2  
提出一种利用笔画线条的统计特征基于支持向量机进行图像中叠加文字检测的方法。该算法首先通过一种改进的线段检测算子提取出笔画线段;然后对笔画线条通过区域合并定位出候选文字块;接着对候选文字块提取一个反映文字笔画线条空间分布特点的32维特征,并通过支持向量机建立的模型对候选文字块进行确认分类。以汉字为例的初步实验表明所提出笔画纹理特征对较多字符构成的文字区域具有很好的性能。  相似文献   

6.
刘鹏  黄炎  田破荒 《通信技术》2010,43(11):72-73,77
文字二值化是实现提取视频文字信息的重要步骤。在复杂背景下,现有二值化方法不仅难以有效抑制背景干扰,而且对文字定位精度要求过高。提出一种复杂背景下稳健的视频文字二值化方法,首先,引入了穿越线的概念,通过找到一条穿越文字行的穿越线,在笔画中植入关键点。进而,充分利用文字笔画的连通性,利用区域生长的方法,完成二值化过程。实验表明,该方法能够在复杂背景下得到较理想的文字二值化图像,不受文字颜色、字体、大小等因素的影响。  相似文献   

7.
提出了一种基于混合高斯模型拟合选取阈值和区域生长的图像分割方法:首先利用笔画方向算子对文字笔画进行抽样,再利用混合高斯模型拟合其灰度直方图,确定样本的最佳分割阈值,最后利用样本的标准差作为生长规则的判断依据分割文字。该算法计算量小,实时性和分割精度均有一定优势,在提取目标的同时,残留背景像素极少,使下一步的目标识别更为简单。  相似文献   

8.
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。  相似文献   

9.
《现代电子技术》2017,(4):120-123
针对复杂背景下维吾尔文字图像分割时产生缺陷和干扰问题,提出一种自适应二值势函数目标模糊C均值算法。首先,使用自适应势目标二值函数聚类方法来获取集群的维吾尔文字二值图像分割和聚类中心,然后利用其隶属度矩阵的最佳数量确定模糊计算维吾尔文字图像分割模糊聚类的维吾尔文字图像。实验结果表明,该算法可以实现维吾尔文字图像的自适应分割,准确地分割出维吾尔文字区域部分,同时极大地减少了计算复杂性,有利于实现维吾尔文字图像处理的准确度。  相似文献   

10.
基于时空分布特征的新闻字幕检测改进算法   总被引:2,自引:0,他引:2  
在分析视频字幕时空分布特征的基础上,采用帧间差分方法提取字幕候选区域,再采用双峰阈值法对字幕区域二值化处理,最后采用积分投影法对字幕区域作行列分割,提取出用于OCR识别系统的单个文字图像.实验表明算法有较高的准确率,能满足视频检索中获取语义信息的需求.  相似文献   

11.
维、汉、英是特点完全不同的文字。该文依据多层次语言判断和适当干预的多语言字符识别系统设计原则首次实现了维、汉、英混排文本识别系统。识别系统首先根据维、汉、英文字的各自特点实现字符块语言属性的初步判断,然后针对每种文字设计不同的字符切割算法。字符识别可信度用来判断字符语言属性和字符切分结果是否正确。实验结果表明,各种维、汉、英混排文本识别率达到96.4%以上。  相似文献   

12.
命名实体识别在自然语言处理实践中具有高度重要的作用,而且也是信息提取等各种自然语言方式的基础工具.本文采用条件随机场模型(Conditional Random Fields,CRF)对维吾尔语音乐实体识别进行初步的探讨.首先维吾尔语网站上收集数据,进行一系列预处理后得到纯文本,然后制定语料标注规则对实体进行人工标注,再利用上下文、关键字、词典等一系列特征进行训练,制定一个适合的模板来进行音乐实体的识别.实验结果证明,此方法在维吾尔语音乐领域不仅可行、而且有效.  相似文献   

13.
根据文档图像的文本行和竖直笔画边界,提出了一种基于数学形态学的分层校正算法,可以有效地恢复文档图像的正面平行视图。首先,利用最近邻链(NNC)构造局部自适应的线状结构元,通过方向平滑的闭运算(DSCA)把连通体(CCs)聚类为文本行,并利用文本行的中心线精确地定位水平消隐点。其次,根据局部邻域内CCs的平均高度,提出了一种基于行程开运算(RLOA)的目标函数,通过估计竖直笔画边界的偏斜方向定位竖直消隐点。最后,为了避免竖直消隐点对水平消隐点的影响,提出了一种新的分层校正方法以消除文档图像的透视失真。各种类型文档图像的实验表明,该方法明显改进了消隐点的定位精度,并具有较高的鲁棒性。  相似文献   

14.
维哈柯文网页嵌入技术以维哈柯文OpenType字库为基础,通过特定的SDK工具将其转换为Web通用的网页嵌入字体格式,结合维哈柯文输入法,完美的解决了维哈柯文在网络时代的快速、准确、优美的传播。使用本技术,客户端无需在额外安装本地维哈柯文字库,解决了维哈柯文在网络时代进行在线收集、管理、检索、录入、编辑、保存等问题。  相似文献   

15.
通过分析维吾尔文字母自身的书写特点,为了进一步提高识别率,在原先的外围轮廓特征基础上,再提取了附加笔划形状特征、字母上下左右密度比例特征、笔画数特征以及主体部分和附加部分的位置关系特征,进行了诸多特征有效组合下的字母识别实验。其中,最高识别率达到了75.7%,比原先在单个特征下的识别率提高了近10个百分点。这表明,不同特征的有效组合是可行的,而且具有继续研究的潜力。  相似文献   

16.
基于最小合成单元的维吾尔音库设计   总被引:1,自引:1,他引:0  
为了实现容量小、可懂度和自然度较好的波形拼接式维吾尔语语音合成系统,结合维吾尔语的特点,完成了文本设计、录音、语音标注、以及音库建设过程。其中,把音节作为基本的合成单元建立了音节语音库;为了弥补音库中不存在音节的合成问题,又建立了音素作为合成单元的音素语音库。实验结果表明,以音节和音素为最小合成单元的波形拼接式维吾尔语语音合成系统除了音库容量相对少等特点之外,还具有良好的可懂度。  相似文献   

17.
总结了维吾尔地名结构及其特点,并结合维吾尔地名内部结构特征,手动建立了基于新疆维吾尔自治区的地名词典库、首词库、中间词库和特征词库,研究了基于规则的维吾尔语地名识别方法和技术。以包含地名的较大规模维吾尔文本作为测试样本,利用地名内部结构和相邻词信息,通过匹配算法进行了地名识别,并用Visual C++编程工具实现了维吾尔语地名识别算法。最后,给出了实验结果,并分析了出错原因及相应的对策。  相似文献   

18.
Web页面的维文在线输入技术,能够在浏览器中脱离本机输入法而进行维文输入,实现维文网络在线文字交互,为网络系统提供跨平台的维文输入解决方案。阐述了Web页面维文在线输入技术的工作原理及基本设计思想,介绍了维文在线输入法的设计原则和输入法流程,对维文输入法进行了系统分析,给出实现模型,论述浏览器内嵌维文字体信息技术,实现在线、即时的维文输入。  相似文献   

19.
Video text information plays an important role in semantic-based video analysis, indexing and retrieval. Video texts are closely related to the content of a video. Usually, the fundamental steps of text-based video analysis, browsing and retrieval consist of video text detection, localization, tracking, segmentation and recognition. Video sequences are commonly stored in compressed formats where MPEG coding techniques are often adopted. In this paper, a unified framework for text detection, localization, and tracking in compressed videos using the discrete cosines transform (DCT) coefficients is proposed. A coarse to fine text detection method is used to find text blocks in terms of the block DCT texture intensity information. The DCT texture intensity of an 8×8 block of an intra-frame is approximately represented by seven AC coefficients. The candidate text block regions are further verified and refined. The text block region localization and tracking are carried out by virtue of the horizontal and vertical block texture intensity projection profiles. The appearing and disappearing frames of each text line are determined by the text tracking. The final experimental results show the effectiveness of the proposed methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号