期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

闫凯宋烨刘瑜杨莉张浩源《信息与电脑》2023,(2):120-122

我国语音识别技术已达国际水平,但是针对低资源语音识别的研究成果较少。文章以粤语方言为例,建立老年方言语料库,并基于神经网络方法构建高斯混合模型(Gaussian Mixture Model,DNN)-隐马尔可夫模型(Hidden Markov Model,HMM)处理语料库声学特征,使用N-gram语言模型解码特征状态。经实验证明,设计方法识别准确率较高,在以语音识别为核心的智能居家养老系统中具有一定的应用价值。相似文献

2.

基于深层神经网络的藏语识别

袁胜龙郭武戴礼荣《模式识别与人工智能》2015,(3):209-213

文中首次涉及藏语的自然对话风格大词汇电话连续语音识别问题.作为一种少数民族语言,藏语识别面临的最大的困难是数据稀疏问题.文中在基于深层神经网络(DNN)的声学模型建模中,针对数据稀疏的问题,提出采用大语种数据训练好的DNN作为目标模型的初始网络进行模型优化的策略.另外,由于藏语语音学的研究很不完善,人工生成决策树问题集的方式并不可行.针对该问题,文中利用数据驱动的方式自动生成决策树问题集,对三音子隐马尔可夫模型(HMM)进行状态绑定,从而减少需要估计的模型参数.在测试集上,基于混合高斯模型(GMM)声学建模的藏字识别率为30.86%.在基于DNN的声学模型建模中,采用三种大语种数据训练好的DNN网络作为初始网络,并在测试集上验证该方法的有效性,藏字识别正确率达到43.26%. 相似文献

3.

关于HMM相对可靠性量度 总被引：1，自引：0，他引：1

谢锦辉高雨青《自动化学报》1993,19(5):637-640

一、引言隐Markov模型(Hidden Markov Models,HMM)是近年来在语音处理领域中十分活跃的方法。但是,由于HMM参数很多,一般难以提供足够多的训练数据,以得到良好的模型。在大词汇量语音识别时,尤其如此。因此,很有必要对两个或多个针对同一事件的表示不同程度的细节和鲁棒性的模型进行合并。这样,确定每个HMM的相对可靠性,以便给出合并时每个HMM相应的权值,就是一个十分重要的问题。本文首先基于作者已做的语音识别中HMM训练算法工作,从著名的HMM训练算法——Baum-Welch算法着手,导出了一种HMM相对可靠性量度公式,然后,介绍了作者在法国LIMSI-CNRS的一个大词汇量连续语音识别系统上给出的相应实验验证。相似文献

4.

基于小波分析和HMM的语音识别模型建立与仿真

张丽王福忠张涛《计算机与现代化》2007,(9):72-75

利用隐马尔可夫模型HMM优异的时序建模能力及小波变换可以对信号进行多尺度分析并有效提取信号的局部信息的特点,建立了混合语音识别模型.在语音信号的识别过程中考虑到了信号的非平稳性,采用并行识别的方法分别获取分类信息,根据混合模型的识别算法做出识别决策,减小了系统对环境的依赖性,提高了其自适应能力.仿真实验结果表明,混合模型识别结果比单一HMM模型或小波模型识别结果更佳,提高了整体的识别速度和识别率. 相似文献

5.

基于动态贝叶斯网络的连续语音识别框架及其Token传递模型

苗夺谦王睿智冉巍《计算机研究与发展》2008,45(11)

近年来,由于动态贝叶斯网络(DBN)相对于传统的隐马尔可夫模型(HMM)更具可解释性、可分解性以及可扩展性,基于DBN的语音识别引起学者们越来越多的关注.但是,目前关于基于DBN的语音识别的研究主要集中在孤立语音识别上,连续语音识别的框架和识别算法还远没有HMM成熟和灵活.为了解决基于DBN的连续语音识别的灵活性和可扩展性,将在基于HMM的连续语音识别中很好地解决了上述问题的Token传递模型加以修改,使之适用于DBN.在该模型基础上,为基于DBN的连续语音识别提出了一个基本框架,并在此框架下提出了一个新的独立于上层语言模型的识别算法.还介绍了作者开发的一套基于该框架的可用于连续语音识别及其他时序系统的工具包DTK. 相似文献

6.

利用HMM提取连续语音中的口型信息

茅力群《微计算机信息》2006,22(2):201-202

本文主要研究利用改进的HMM模型从非特定人的连续语音中识别出声母、韵母,以及每个音的持续时间,提出了这些语音信息与嘴巴的扩张程度、嘴型和持续时间等口型信息的关系,以便把它们传送给步进电机,(以驱动实物模型。相似文献

7.

基于HMM和遗传神经网络的语音识别系统 总被引：1，自引：0，他引：1

包亚萍郑骏武晓光《计算机工程与科学》2011,33(4):139

本文提出了一种基于隐马尔可夫(HMM)和遗传算法优化的反向传播网络(GA-BP)的混合模型语音识别方法。该方法首先利用HMM对语音信号进行时序建模,并计算出语音对HMM的输出概率的评分,将得到的概率评分作为优化后反向传播网络的输入,得到分类识别信息,最后根据混合模型的识别算法作出识别决策。通过Matlab软件对已有的样本数据进行训练和测试。仿真结果表明,由于设计充分利用了HMM时间建模能力强和GA-BP神经网络分类能力强等特点,该混合模型比单纯的HMM具有更强的抗噪性,克服了神经网络的局部最优问题,大大提高了识别的速度,明显改善了语音识别系统的性能。相似文献

8.

混合语音识别模型的设计与仿真研究

宋志章马丽刘省非李奇楠《计算机仿真》2012,29(5):152-155

研究语音识别率问题,语音信号是一种非平稳信号,含有大量噪声信息,目前大多数识别算法线性理论,难以正确识别语音信号非线性变化过程,识别正确率低。通过将隐马尔可夫模型(HMM)和SVM相结合组成一个混合抗噪语音识别模型(HMM-SVM)。同时用HMM模型对语音信号时序进行建模,并得到待识别语音信号的输出概率,然后将输出概率作为SVM的输入进行学习,得到语音分类信息,最后通过利用HMM-SVM识别结果做出正确识别决策。仿真结果表明,HMM-SVM提高语音识别正确率,尤其在低信噪比环境下,明显改善了语音识别系统的性能。相似文献

9.

利用空间相关性的改进HMM模型 总被引：1，自引：0，他引：1

苏腾荣吴及王作英吕萍《计算机工程与设计》2010,31(5)

语音识别领域中所采用的经典HMM模型,忽略了语音信号间的相关信息.针对这一问题,利用语音信号的空间相关性对经典HMM模型进行补偿,得到一种改进模型.该方法通过空间相关变换,描述了当前语音特征与历史数据之间的空间相关性,从而对联合状态输出分布进行建模.改进模型的解码算法利用空间相关性变换的参数更新算法在经典ⅧⅥM的解码算法基础上得到.实验结果表明,上述方法在说话人无关连续语音识别系统上获得了明显的性能改进. 相似文献

10.

基于HMM/SVM两级结构的汉语易混淆语音识别

王欢良韩纪庆李海峰郑铁然《模式识别与人工智能》2006,19(5)

基于HMM的汉语语音识别中,易混淆语音的识别率仍然不高.在分析HMM固有缺陷的基础上,本文提出一种使用SVM在HMM系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节,提高系统性能和效率.通过充分利用Viterbi解码获得的信息来构造新的分类特征,从而解决标准SVM难以处理可变长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和SVM识别器构造等问题.语音识别实验的结果显示,与采用HMM/SVM混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使识别率有明显提高.这表明所提出的具有置信估计环节的HMM/SVM两级结构用于易混淆语音识别是可行的. 相似文献