共查询到19条相似文献,搜索用时 145 毫秒
1.
针对序列图像中的维吾尔文字区域检测问题,提出了一种Harris角点和基线特征相结合的有效方法:首先,将输入的彩色图像灰度化,然后对图像进行Harris角点检测,根据角点分布进一步确定文字基线位置,再对基线位置上的角点进行形态学膨胀操作,最终实现了文本区域的定位。在较大规模的序列图像情况下进行了文本区域检测试验,给出了实验结果与同类算法的对比分析,论证了本算法的有效性和可行性。 相似文献
2.
3.
字符切分是藏文古籍文档图像分析与识别中重要的一环,针对乌金体藏文古籍文本行倾斜,字符之间笔画交叠、交叉、粘连以及不同程度的笔画断裂、噪声干扰等问题,提出了一种基于结构属性的乌金体藏文字符切分方法.首先,建立了乌金体藏文古籍字符区块库.然后,利用音节点位置信息或结合水平投影与直线检测的方法检测出字符区块的局部基线,并根据基线将字符区块切分为上下两部分;利用改进的模板匹配算法检测基线上方笔画的粘连及其类型,利用多方向、多路径粘连切分算法切分交叉、粘连笔画.最后,根据藏文结构属性对各笔画进行归属,完成字符切分.实验结果表明,本方法能有效解决字符切分中遇到的问题,字符切分的召回率、精确率以及F-Measure可分别达到96.52%、98.24%、97.37%. 相似文献
4.
5.
6.
7.
提出了一种基于混合高斯模型拟合选取阈值和区域生长的图像分割方法:首先利用笔画方向算子对文字笔画进行抽样,再利用混合高斯模型拟合其灰度直方图,确定样本的最佳分割阈值,最后利用样本的标准差作为生长规则的判断依据分割文字。该算法计算量小,实时性和分割精度均有一定优势,在提取目标的同时,残留背景像素极少,使下一步的目标识别更为简单。 相似文献
8.
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。 相似文献
9.
10.
基于时空分布特征的新闻字幕检测改进算法 总被引:2,自引:0,他引:2
在分析视频字幕时空分布特征的基础上,采用帧间差分方法提取字幕候选区域,再采用双峰阈值法对字幕区域二值化处理,最后采用积分投影法对字幕区域作行列分割,提取出用于OCR识别系统的单个文字图像.实验表明算法有较高的准确率,能满足视频检索中获取语义信息的需求. 相似文献
11.
12.
命名实体识别在自然语言处理实践中具有高度重要的作用,而且也是信息提取等各种自然语言方式的基础工具.本文采用条件随机场模型(Conditional Random Fields,CRF)对维吾尔语音乐实体识别进行初步的探讨.首先维吾尔语网站上收集数据,进行一系列预处理后得到纯文本,然后制定语料标注规则对实体进行人工标注,再利用上下文、关键字、词典等一系列特征进行训练,制定一个适合的模板来进行音乐实体的识别.实验结果证明,此方法在维吾尔语音乐领域不仅可行、而且有效. 相似文献
13.
根据文档图像的文本行和竖直笔画边界,提出了一种基于数学形态学的分层校正算法,可以有效地恢复文档图像的正面平行视图。首先,利用最近邻链(NNC)构造局部自适应的线状结构元,通过方向平滑的闭运算(DSCA)把连通体(CCs)聚类为文本行,并利用文本行的中心线精确地定位水平消隐点。其次,根据局部邻域内CCs的平均高度,提出了一种基于行程开运算(RLOA)的目标函数,通过估计竖直笔画边界的偏斜方向定位竖直消隐点。最后,为了避免竖直消隐点对水平消隐点的影响,提出了一种新的分层校正方法以消除文档图像的透视失真。各种类型文档图像的实验表明,该方法明显改进了消隐点的定位精度,并具有较高的鲁棒性。 相似文献
14.
维哈柯文网页嵌入技术以维哈柯文OpenType字库为基础,通过特定的SDK工具将其转换为Web通用的网页嵌入字体格式,结合维哈柯文输入法,完美的解决了维哈柯文在网络时代的快速、准确、优美的传播。使用本技术,客户端无需在额外安装本地维哈柯文字库,解决了维哈柯文在网络时代进行在线收集、管理、检索、录入、编辑、保存等问题。 相似文献
15.
16.
17.
18.
Web页面的维文在线输入技术,能够在浏览器中脱离本机输入法而进行维文输入,实现维文网络在线文字交互,为网络系统提供跨平台的维文输入解决方案。阐述了Web页面维文在线输入技术的工作原理及基本设计思想,介绍了维文在线输入法的设计原则和输入法流程,对维文输入法进行了系统分析,给出实现模型,论述浏览器内嵌维文字体信息技术,实现在线、即时的维文输入。 相似文献
19.
《Signal Processing: Image Communication》2007,22(9):752-768
Video text information plays an important role in semantic-based video analysis, indexing and retrieval. Video texts are closely related to the content of a video. Usually, the fundamental steps of text-based video analysis, browsing and retrieval consist of video text detection, localization, tracking, segmentation and recognition. Video sequences are commonly stored in compressed formats where MPEG coding techniques are often adopted. In this paper, a unified framework for text detection, localization, and tracking in compressed videos using the discrete cosines transform (DCT) coefficients is proposed. A coarse to fine text detection method is used to find text blocks in terms of the block DCT texture intensity information. The DCT texture intensity of an 8×8 block of an intra-frame is approximately represented by seven AC coefficients. The candidate text block regions are further verified and refined. The text block region localization and tracking are carried out by virtue of the horizontal and vertical block texture intensity projection profiles. The appearing and disappearing frames of each text line are determined by the text tracking. The final experimental results show the effectiveness of the proposed methods. 相似文献