首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
汉语语音识别研究中,识别单元的选取是很重要的。该文提出一种基于声韵母分割的,以韵母为基本识别单元的大词汇量孤立词的语音识别方法,并与以汉语词为基本识别单元的语音识别方法进行比较识别实验。结果表明,基于韵母为基本识别单元的语音识别性能优于以汉语词为基本识别单元的语音识别方法。  相似文献   

2.
一种基于分形理论的语音分割新方法   总被引:1,自引:0,他引:1  
语音是由混沌的自然音素组成的,而分形可以很好地为成混沌状态的自然音素建模.语音波形具有分形特征,将分形用于改善语音识别技术越来越受到重视.语音的特性决定了每一个音素展现其固有模式,因此相邻音素之间的分维值不同.通常求取语音波形的分维值轨迹可把人的发音分割成句子、词、甚至音素.实验证明,该方法在语音分割中取得了很好的效果.  相似文献   

3.
本文中我们定义特征矢量的分布为d维高斯密度,语音序列为状态转换的马尔可夫过程,这个假设区别于标准的HMM,主要表现在状态密度函数是由具有音素标识的特征矢量进行有监督学习,每种音素标识对应于语音生成机构的一个物理状态。特征矢量由对应于各音素的语音波形段中得到。其特征空间对应于m个d维高斯密度,一个特征矢量对于每个音素状态有与之相联系的有限的生成概率。我们提出一种训练HMM=(П,A,B,)的新方法,П是一个m维的初始状态概率矢量,A是m×m的状态转移概率矩阵,B描述系统处于某一状态时出现的一定观测值的一组概率密度函数,它在本算法中不需要参加模型的优化训练。  相似文献   

4.
提出短时能频值(EFV)的新概念,设计了用短时能频值的参量来估计语音起止点的新的有效算法,提高了语音信号与背景噪声的分辨力。运用基于短时能频值EFV估计语音起止点的算法,研究汉语普通话音素的区别特征,上机计算分析证明了EFV门限能够很好地从噪声中分辨出语音信号,有着较好的稳定性和较高的语音-噪声分辨力。  相似文献   

5.
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。  相似文献   

6.
为了提高中小词汇量语音识别系统在噪声环境下的识别性能,以10个汉语数码语音为对象,利用汉语数码语音信号区别于噪声信号的准周期特性,提出了一种汉语数码语音频谱包络峰值特性的提取方法,首先用基频对语音频谱采样得到由谐波值构成的包络以提高信噪比,然后再对所得包络进行峰值提取得到汉语数码语音的峰值特征。实验结果表明,在信噪比大于5dB时,用该方法得到的峰值特征具有一定的抗噪性。  相似文献   

7.
8.
音素HMM语音识别是当前语音识别领域的一个热点。本文在简单介绍音素识别的相关理论后,着重讨论了一种新的极低速率语音编解码器的原理、方法和其在音素识别上的应用。最后给出相关的实验结果。  相似文献   

9.
高性能汉语数码语音识别算法   总被引:13,自引:0,他引:13  
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% .  相似文献   

10.
在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。  相似文献   

11.
在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96.4%的切分正确率,比原算法提高5.2%.  相似文献   

12.
多重分形维数在语音分割和语音识别中的应用   总被引:4,自引:0,他引:4  
语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可作为分析语音信号的数学工具.由于传统的Hausdorff-Besicovitch 维数没有考虑关于集合中点的分布信息,本文引入多重分形维数来克服上述缺点.实验表明,多重分形维数语音分割方法明显好于单一Hausdorff-Besicovitch 分形维数的语音分割方法  相似文献   

13.
一种基于段间距离测度的语言自动分割方法   总被引:5,自引:0,他引:5  
根据连续语音中不同类语音段之间内在的相异性,提出了段间距离的概念,并基于特征矢量距离给出了段间距离的一种测度。在此基础上,提出一种新的语音自动分割方法,它根据语音段间距离曲线的峰值点对语音音素进行分割,而不需要关于语音单元的先验知识或参考模型,在该方法中,语音特征矢量按帧计算,通过采用适当的帧重迭度,可以使语音分割具有较高的时间分辨率,实验结果表明,该方法具有较高的分割精度和速度。  相似文献   

14.
给出了一种将基于统计与基于词典方法融合而成的混合中文分词方法,利用统计方法进行词典的动态扩展,克服了基于词典算法对"完全词典"的依赖;利用词典对统计的一些参数进行估计,避免了以往靠实验得到这些参数的不确定性,同时将RMM算法与统计算法结合起来.最后通过仿真说明该混合算法比传统的基于词典和基于统计的方法更有效.  相似文献   

15.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。  相似文献   

16.
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.  相似文献   

17.
提出针对汉语连续语音识别中的大型HMM进行修正。在模型中加入双词法约束,然后给出洁约束下的新的识别算法,新识别算法基于Viterbi算法和分层构筑思想之上。经实验测试,识别率有较大提高。  相似文献   

18.
为解决手写汉字文本的自动切分问题,提出了一种基于动态规划的联机手写汉字分割方法.该方法根据手写笔画的结构特征、笔顺信息以及神经网络分类器给出的类概率构造代价函数,并将其分别应用于手写句子的预分割和基于识别的分割过程,然后利用动态规划算法寻找最佳分割路径.预分割在保持较低误分割率的前提下,可以有效地降低候选分割块的数量,以加速分割过程.实验结果表明,预分割的误分割率为0.57%,过分割率仅为11.1%;在未应用语言模型的情况下,最终的正确分割率为88.2%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号