首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于小波变换的图像中维吾尔文字定位   总被引:3,自引:0,他引:3       下载免费PDF全文
在对维吾尔文字结构特点分析的基础上,研究维吾尔文字在小波变换中的特征,依据这些特征提出基于小波变换的视频图像中维吾尔文字定位的方法。用具有良好的时频局部和变尺度特性的小波分析方法,提取出纹理清晰、具有不同空间分辨率、不同方向的边缘子图像,用数学形态学的方法对提取出的细节图像进行进一步的形态运算,消除噪声,得到最终的文本目标区域。实验表明该方法简单有效,适合于背景较复杂的维吾尔文字定位。  相似文献   

2.
概率图模型及其应用作为一个具有挑战性的研究领域目前已成为一个新的研究热点。概率图模型为解决智能信息领域的不确定性问题提供了重要途径。尽管目前概率图模型还处于不断发展之中,但近年来基于概率图模型的图像和视频智能信息处理的应用研究受到人们的关注,出现了许多有效的算法,这些算法为解决一些传统的图像和视频智能信息处理问题提供了新的途径。本文首先对概率图模型的3种重要表现形式、特性和主要技术进行了分析和讨论,在此基础上,以概率图模型在图像和视频中的应用为线索,对目前基于概率图模型的图像和视频智能信息处理的主要技术进行了概述和比较研究;最后对概率图模型所存在的一些问题及进一步的发展进行了展望。  相似文献   

3.
皮桂林  赵晖 《计算机工程》2012,38(18):147-150
延迟笔画处理是维吾尔文联机手写体单词识别中的难点,样本数据格式为一串具有时序性的序列,造成字母主笔画和延迟笔画在序列位置上多半不连续,很大程度上增加了延迟笔画处理和单词识别的难度。为此,提出一种维吾尔文延迟笔画处理方法,其中包括延迟笔画查找与投影,实验结果证明该方法具有良好的效果,单词识别准确率达到93.71%。  相似文献   

4.
如何自动选取种子点的位置是基于区域生长法分割文字的关键问题。该算法通过横向线段检测算子提取出文字条中所有的横向线段;统计线段在饱和度、亮度上像素点的分布,根据统计分布使用Otsu法提取出纯净的文字基线,将它作为区域生长种子点的位置;通过生长法则分割文字。实验在四类不同的背景集中测试算法,其中花卉测试集的字母提取率达到72.31%。  相似文献   

5.
在维吾尔文联机手写识别过程的训练阶段,单词被切分成字母,经过特征提取和聚类形成特征向量作为模型的输入。构造出以字符为基元的隐马尔可夫模型(HMM),将其嵌入到识别字典网络中。通过基于HMM的分类识别器,最终得到识别结果。首次将消除延迟笔画、建立有延迟笔画和无延迟笔画的字典的方法应用于维吾尔文手写识别中,取得了较高的识别率。  相似文献   

6.
研究了图像定位的问题,由于存在污渍干扰等影响图像定位,针对以往单一特征进行图像文字定位及识别的系统中容易受到各种环境因素干扰的缺陷,提出了一种利用轴对称窗口进行边缘检测的图像文字检测算法。首先将利用轴对称滑动窗口提取水平和竖直方向上的边缘特征,利用连通域确定初始的图像文字位置;通过对可能的图像文字区域进行颜色色调验证,区域内垂直方向直方图投影,从而确定最终的图像文字位置。由于利用多种特征综合检测图像文字进行仿真。仿真结果表明改进方法能准确检测出复杂场景下图像文字所在区域。  相似文献   

7.
图像和视频中的文字获取技术   总被引:6,自引:0,他引:6       下载免费PDF全文
许多图像都包含丰富的文字信息,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别,对图像高层语义内容的自动理解、索引和检索非常有价值,因此引起国内外众多学者的研究兴趣。为使人们对该领域有一个系统的了解,并使该领域研究人员有所借鉴,在对目前国内外图像和视频中文字获取技术相关文献综合理解的基础上,综述了该领域的发展现状,同时从文字检测、抽取和文字识别两个方面,重点讨论了其主要的技术方法及应用优缺点,并结合当前面临的问题,指出今后可进一步研究的方向。  相似文献   

8.
针对现有动作识别中对连续动作识别研究较少且单一算法对连续动作识别效果较差的问题,提出在单个动作建模的基础上,采用滑动窗口法和动态规划法结合,实现连续动作的分割与识别。首先,采用深度置信网络和隐马尔可夫结合的模型DBN-HMM对单个动作建模;其次,运用所训练动作模型的对数似然值和滑动窗口法对连续动作进行评分估计,实现初始分割点的检测;然后,采用动态规划对分割点位置进行优化并对单个动作进行识别。在公开动作数据库MSR Action3D上进行连续动作分割与识别测试,结果表明基于滑动窗口的动态规划能够优化分割点的选取,进而提高识别精度,能够用于连续动作识别。  相似文献   

9.
为了提高视频手写签名认证的准确率,确保身份认证的严谨性,需要对隐马尔可夫(Hidden Markov Models,HMM)模型下视频手写签名认证算法进行改进设计;使用当前算法对视频手写签名进行认证时,存在认证判断误差大、效率低的问题;提出基于HMM模型下视频手写签名认证算法;该算法将使用Wacom手写板采集手写签名特征点及压力数据,对采集到的手写签名特征与压力数据进行预处理,消除采集过程中环境和手写板产生的影响,并且规范采集的视频手写签名特征位置、尺寸,提取手写签名特征与压力数据,再以HMM模型对已提取的视频手写签名特征点与压力数据进行认证与计算,确定签名的真实度;实验仿真证明,所提算法提高了视频签名认证的性能。  相似文献   

10.
复杂背景下维吾尔文字符的分割算法   总被引:4,自引:0,他引:4       下载免费PDF全文
在视频或图像中包含丰富的文字信息,这些文字信息与视频或图像的内容密切相关,因此可以作为视频片断或者图像的内容标识和索引。以视频维吾尔文为例,首先用Canny算子将彩色图像转换为灰度化的边缘图像,其次对图像中的文字进行定位,再对图像进行边缘点彩色分割,然后进行文字图像行区域和列区域的检测,最后基于候选文本区的特征从不同复杂度的彩色图像中提取文本信息,实验结果表明了算法的有效性。  相似文献   

11.
维吾尔语连续语音识别技术研究   总被引:1,自引:0,他引:1  
维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术.主要包括声学模型和语言模趋。在声学模型中,主要介绍基于隐马尔可夫模型(Hidden Markov Model,HMM)的维吾尔语筵续语音识别声学建模。在语言模型中,主要对比基于文法和基于统计这两种方法的优劣。  相似文献   

12.
给出了一个基于HMM和GMM双引擎识别模型的维吾尔语联机手写体整词识别系统。在GMM部分,系统提取了8-方向特征,生成8-方向特征样式图像、定位空间采样点以及提取模糊的方向特征。在对模型精细化迭代训练之后,得到GMM模型文件。HMM部分,系统采用了笔段特征的方法来获取笔段分段点特征序列,在对模型进行精细化迭代训练后,得到HMM模型文件。将GMM模型文件和HMM模型文件分别打包封装再进行联合封装成字典。在第一期的实验中,系统的识别率达到97%,第二期的实验中,系统的识别率高达99%。  相似文献   

13.
基于隐Markov模型的文本分类   总被引:1,自引:0,他引:1       下载免费PDF全文
把基于序列模型的隐Markov模型引入文本分类领域。把待分类文本描述成一系列状态演化的隐Markov过程,其中状态以特定的概率产生代表文本的特征项。用序列模式来描述文本类,文本序列通过与隐Markov模型的匹配,求出其对应状态序列和最大输出概率。比较各个文本类的结果,达到文本分类的目的。最后通过和简单向量算法,KNN,Naive Bayes分类算法的比较,说明本算法的在文本分类中的成功应用。  相似文献   

14.
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。  相似文献   

15.
基于条件随机域的生物命名实体识别   总被引:1,自引:1,他引:0       下载免费PDF全文
提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测试结果表明,引入距离依赖后,系统的识别性能比只利用单特性的条件随机域方法提高2.54%,可获得较好的识别效果,提高了系统的识别效率。  相似文献   

16.
通过人走路的姿势实现对个人身份的远距离识别和认证是当前生物特征识别研究领域的一个研究热点。算法利用步态轮廓图像边界到重心的距离矢量对步态轮廓图像进行人体运动的静态形状描述,采用连续隐马尔可夫模型对人体运动时从一个动作到另一个动作的过渡进行动态描述。算法在CMU数据库上面进行实验取得了较高的正确识别率。  相似文献   

17.
隐马氏模型(HMM)的参数估计是隐马氏模型各种应用的关键。经典的Baum-Welch算法容易陷入局部最优,对初始参数的要求苛刻。HMM参数估计的Gibbs抽样法,充分利用模型先验信息,借助马氏链蒙特卡洛方法(MCMC)的强大计算功能,避免了陷入局部最优,有更好的效果。  相似文献   

18.
杜修平  何丕廉 《计算机工程》2006,32(13):190-192
介绍了自动标绘系统的需求和系统流程,并对语音采集、语音识别和自动标绘3个阶段的技术难点及解决方案进行了详细介绍。重点介绍了采用语音自动重叠技术以减少语音切割失误,提高识别精度。描述了对识别出的数字串运用打分系统进行智能切分,提取数据点以提高标绘精度。系统采用VC.NET和SQL Server实现,稳定环境下语音识别精度达到97%以上,标绘正确率达到95%,较好地实现了系统需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号