首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
语音识别说话人自适应研究现状及发展趋势   总被引:12,自引:0,他引:12  
说话人自适应是提高非特定人语音识别系统识别性能的有效手段.本文介绍了说话人自适应研究的现状,包括自适应的不同方式和不同算法,并详细介绍了目前应用最为广泛的MLLR算法和MAP算法.本文还给出了对说话人自适应研究发展趋势的预测.  相似文献   

2.
HMM 在说话人识别中的应用   总被引:9,自引:0,他引:9  
本文介绍了隐马尔可夫模型在自动说话人识别中的应用,指出了目前说话人识别技术中存在的一些问题和今后需要的课题。  相似文献   

3.
介绍了说话人自适应技术中的特征语音(Eigenvoice,EV)方法。用最大后验概率特征分解(Maximum a Posteriori Eigen-decomposition,MAPED)法来计算线性组合系数,代替了传统方法中的最大似然特征分解(Maximum Likelihood Eigen-decomposition,MLED)的方法。实验对这两种方法的性能进行了比较。结果证明使用MAPED这种方法比用MLED的方法错误识别率有一定的降低,增强了系统的鲁棒性。  相似文献   

4.
基于HMM的说话人辨认系统及其改进   总被引:2,自引:0,他引:2  
对基于隐马尔可夫模型(HMM)的说话人辨认系统进行了讨论,完成了系统设计。对系统中矢量量化这一关键性环节进行了改进,提出了一种新的基于遗传算法的码本生成方法。测试结果表明,改进后的系统具有较高的正确识别率,特别是在与文本无关的情况下。  相似文献   

5.
基于码本的说话人自适应方法   总被引:1,自引:0,他引:1  
吕津  赵明生  王作英 《电子学报》2001,29(4):456-460
本文提出了一种基于码本的说话人自适应方法.它可以将变换方法和Bayes估计法这两大类说话人自适应方法的优点有机的结合起来,既能实现快速的说话人自适应,还具有良好的一致渐进性.自适应过程可分为两个阶段:在第一阶段,用由大量参考说话人的语音码本构成的线性组合来逼近用户的语音码本.此时只需要很少的自适应训练数据就可以用基于Rosen梯度投影法的优化算法计算出线性组合中各码本的最佳权值.在第二阶段,码本的最佳线性组合被用作用户码本的先验估计值.随着更多自适应训练数据的获得,系统对用户码本进一步进行Bayes估计,从而可以实现累进的自适应.作者将该方法应用于说话人无关的连续汉语语音识别系统.一系列的对比实验表明该自适应方法很有前途.  相似文献   

6.
尉洪  杨鉴  普园媛  赵征鹏 《信号处理》2005,21(Z1):196-199
说话人自适应是提高非特定人语音识别系统识别性能的有效手段,本文针对非母语说话人,结合常规的自适应技术MLLR和MAP,探索云南纳西族和傈僳族两种母语说话人的汉语普通话语音识别问题,实验结果显示有显著效果.  相似文献   

7.
探讨了HMM(隐马尔可夫模型)在说话人识别领域中的应用,并对说话人确认系统中的关键问题-确认阈值的确定,提出了一种新的解决方法。实验结果表明,该方法较好地解决了不同说话人的确认阈值的确定问题。  相似文献   

8.
基于FVQ的说话人识别系统的DSP实现   总被引:5,自引:3,他引:2  
运用TMS320C5416实现了说话人自动识别系统,系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用模糊矢量量化技术实现了与文本有关的说话人识别。实验结果表明系统具有识别精度高、识别速度快等特点,是一种有效的说话人自动识别的硬件实现方法。  相似文献   

9.
王坚 《中国新通信》2007,9(11):60-63
针对语音识别中快速说话人自适应问题,对已有的说话人支持权重算法进行改进,利用支撑向量机(Support Vector Machines,SVM)参与支持说话人选择过程,并采用最大后验概率(Maximum a Posteriori,MAP)代替最大似然(Maximum Likelihood,ML)准则进行支撑说话人权重的估算,最后对测试说话人进行线性组合。与现有的相关自适应方法相比,该算法能够有效提高自适应数据较少时的性能。实验结果表明,在仅有一句自适应语句的情况下系统汉字正识率从原有非特定人(Speaker Independent,SI)系统的45.67%到58.05%,相对原有说话人支持权重算法提高4.67%。  相似文献   

10.
该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人相关模型限制在这组基矢量所张成的说话人子空间中,通过求解每一个基矢量对应的系数从而进行说话人自适应。与经典的基于子空间的说话人自适应方法不同,该文中的说话人子空间是在自适应阶段动态选取的,所需要估计的参数更少,在少量自适应数据下可以得到更稳健的自适应结果。在基于微软语料库的连续语音识别自适应实验中,给定极少量自适应数据(小于5 s),在有监督和无监督条件下,该文方法均优于经典的本征音自适应方法和基于最大似然线性回归的方法。  相似文献   

11.
循环相关匹配滤波器设计   总被引:10,自引:0,他引:10  
李虎生  刘加  刘润生 《电子学报》2003,31(1):103-108
在谱相关分析的基础上,讨论了对循环平稳信号进行最佳滤波的问题,推导得到了基于最大输出信噪比准则的循环相关匹配滤波器的解析表式.然而,由于该滤波器性能与所选取的循环频率是相关的,单循环频率循环相关匹配滤波器存在固有的缺陷-信号能量利用不充分.为此,研究了多循环频率循环相关匹配滤波器组的设计方法,在最大输出信噪比准则约束下确定了滤波器组的优化结构.仿真实验比较了谱相关分析方法和循环相关匹配滤波方法,对调幅信号和BPSK信号的仿真实验结果证实了文章理论分析得到的结果.  相似文献   

12.
 在文本无关的说话人确认中,规整算法能够有效地调整测试得分的分布.另外,利用前面已经得到的测试语句的得分来调整规整的参数可以取得更好的效果,这种规整叫做非监督得分规整.在本文中,借用开发集得分来建立说话人和冒认者得分的两个先验高斯分布函数,在实际的测试中,利用最大后验概率准则来对规整的模型参数进行调整.在采用因子分析的情况下,在NIST 2006说话人识别测试1conv4w-1conv4w数据库上,能够取得等错误率5.26%.  相似文献   

13.
吕萍  王作英  陆大 《电子学报》2001,29(Z1):1759-1761
快速说话人自适应算法在非特定人连续语音识别的应用中有重要意义.现在流行的自适应算法多数只考虑均值的自适应.本文提出的自适应算法可以快速的对协方差矩阵进行自适应.该算法是用高斯相似度度量协方差矩阵间的距离,并由此测度建立了反映协方差矩阵结构关系的二叉决策树.树的每个中间节点包含一个类质心.在决策树基础上,训练多个与特定人模型相关的类质心.自适应时,通过对这些类质心进行线性插值得到自适应的协方差矩阵.实验结果表明,该方法能够在仅有一句自适应数据的情况下,使系统误识率由29.49%下降到27.55%.  相似文献   

14.
提出了一种新的适用于离散HMM说话人辨认系统的VQ码本训练方法,码本的训练准则是使码本中各码字的利用率趋于均等.将新方法训练的码本与用LBG算法训练的码本进行了比较,实验表明,在基于离散HMM的说话人辨认系统中,用新方法训练的码本性能优于用LBG算法训练的码本,特别是在与文本无关的情况下,使系统的正确辨认率显著提高.  相似文献   

15.
谢锦辉 《通信学报》1994,15(2):83-87
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS  相似文献   

16.
基于连续HMM的孤立语音鲁棒性识别方法   总被引:5,自引:1,他引:5  
对于基于连续稳马尔可夫模的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_MFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。  相似文献   

17.
主要介绍了现阶段国内外有关信道补偿的主要技术方法、研究现状及未来发展方向,同时着重讨论了信道补偿技术在说话人识别上的应用。首先简述经验补偿和盲补偿两种方法以及它们的优缺点,然后分别讨论在特征空间、模型空间和得分空间上信道补偿技术在说话人识别上的应用。最后讨论了信道补偿技术在未来的发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号