首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
高阶MFCC的话者识别性能及其噪声鲁棒性   总被引:6,自引:0,他引:6  
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量.本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性.基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量.实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性.  相似文献   

2.
从线性预测HMM到一种新的语音识别的混合模型   总被引:1,自引:0,他引:1       下载免费PDF全文
欧智坚  王作英 《电子学报》2002,30(9):1313-1316
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式.  相似文献   

3.
一种适于非特定人语音识别的并行隐马尔可夫模型   总被引:2,自引:0,他引:2  
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。  相似文献   

4.
王金明  张雄伟 《信号处理》2003,19(1):117-120
噪声鲁棒性是话者确认系统实用化的关键问题之一,本文设计了一种基于子带加权和GMM的话者确认系统,该系统将语音谱分为若干子带,采用基于短时能量分布的算法估计各子带噪声强度,并根据噪声强度来进行子带加权,最终生成具有更高鲁棒性的语音特征,语音识别模型采用简化的GMM.实验表明,上述方法能有效提高话者确认系统的性能,增强其噪声鲁棒性,而且在低噪声环境下,仍能保证系统性能不下降.  相似文献   

5.
基于连续HMM的孤立语音鲁棒性识别方法   总被引:5,自引:1,他引:5  
对于基于连续稳马尔可夫模的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_MFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。  相似文献   

6.
话者识别系统的时间鲁棒性是影响话者识别系统实用化的关键问题之一。为了提高系统的时间鲁棒性,本文提出了基于子带矢量量化及人工神经网络的话者模型。将语音文本的有效频段划分为几个子带,分别求取子带上的知闰量化码本,利用BP 工神经网络对训练数据在各个子带上的量化误差进行拟合,即可训练出话者模型(SBVQ码本及BPNN的权值矩阵 、确认阈值)该话者模型反映了不同频段对话者识别系统性能的不同影响,并可将时间  相似文献   

7.
基于末制导雷达搜索舰艇编队目标时获得的目标大角域高分辨距离像(HRRP)信息,该文建立了描述单个HRRP样本内向量之间统计关系的各态历经空间隐马尔可夫模型(SHMM)和描述HRRP样本之间统计关系的从左到右时间隐马尔可夫模型(THMM)。与对一类目标全方位角训练数据只建立一个THMM模型的方法相比,该方法充分利用目标的大角域HRRP信息,提高了识别性能。通过对5类舰船目标的仿真和3类民用船只的外场实测数据分析表明该方法的有效性。  相似文献   

8.
对于采用高斯混合模型(GMM)的与文本无关的说话人识别,出于模型参数数量和计算量的考虑 GMM的协方差矩阵通常取为对角矩阵形式,并假设观察矢量各维之间是不相关的。然而,这种假设在大多情况下是不成立的。为了使观察矢量空间适合于采用对角协方差的GMM进行拟合,通常采用对参数空间或模型空间进行解相关变换。该文提出了一种改进模型空间解相关的PCA方法,通过直接对GMM的各高斯成分的协方差进行主成分分析,使参数空间分布更符合使用对角化协方差的混合高斯分布,并通过共享PCA变换阵的方法减少参数数量和计算量。在微软语音库上的说话人识别实验表明,该方法取得了比常规的对角协方差GMM系统的最优结果有相对35%的误识率下降。  相似文献   

9.
10.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

11.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。  相似文献   

12.
Audio-based speaker identification degrades severely when there is a mismatch between training and test conditions due either to channel or to noise. In this paper, we explore various techniques to combine video based speaker identification with audio-based speaker identification to improve the performance under mismatched conditions. Specifically, we explore techniques to optimally determine the relative weights of the independent decisions based on audio and video to achieve the best combination. Experiments on video broadcast news data show that significant improvements can be achieved by the fusion in acoustically degraded conditions.  相似文献   

13.
一种改进的模糊C-均值聚类算法在说话人识别中的应用   总被引:3,自引:0,他引:3  
杨彦  赵力 《电声技术》2006,(1):40-43
提出了一种将改进的FCM聚类算法与矢量量化相结合的说话人识别的方法。先从语音信号中提取待识别的特征矢量集,再利用矢量量化来设计码本,最后用改进的算法对待识别语音进行辩识。该算法解决了FCM算法对初始值敏感、易陷入局部最优的问题。所使用的特征参数较少,计算比较简单,但识别率较高,且具有较好的鲁棒性。  相似文献   

14.
基于压缩感知的稳健性说话人识别   总被引:1,自引:1,他引:0  
单进  芮贤义 《电声技术》2011,35(2):61-63
阐述了在噪声条件下,将基于压缩感知理论的丢失数据重建技术应用于说话人识别系统的系统前端.首先使用Mel滤波器组将带噪语音信号转换成Mel频谱,然后利用带噪MeI谱中可靠数据重建不可靠数据,最后从重建的Mel频谱中提取Mel倒谱特征参数用于说话人识别.稳健性实验结果表明,该方法能够提高在噪声环境下说话人系统的识别率.  相似文献   

15.
基于鲁棒听觉特征的说话人识别   总被引:3,自引:0,他引:3  
林琳  陈虹  陈建 《电子学报》2013,41(3):619-624
 为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数.  相似文献   

16.
说话人识别综述   总被引:2,自引:0,他引:2  
在分析说话人识别原理和方法的基础上,对近年来说话人识别技术的发展进行了综述。分析了当前说话人识别技术中使用的多种特征和模式识别方法,并对其今后的研究前景和发展方向进行了展望。  相似文献   

17.
介绍了说话人识别技术的基本概念和发展历史,列举并比较了几种常用的特征提取和模式匹配方法,总结了当前存在的问题并对其发展进行了展望.  相似文献   

18.
王书诏  邱天爽 《电声技术》2007,31(1):51-55,65
说话人识别是语音信号处理中的重要组成部分,是当前的研究热点之一。详细介绍了说话人识别的基本原理,从特征提取、模型训练和分类等几个方面就近年的主要研究情况进行综述和评价,并在此基础上探讨了研究难点和发展前景。  相似文献   

19.
赵力  邹采荣  吴镇扬 《电子学报》2002,30(7):967-969
本文提出了一种新的语音识别方法,它综合了VQ、HMM和无教师说话人自适应算法的优点,在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立FVQ/HMM,同时采用基于模糊矢量量化的无教师自适应算法,来改变FVQ/HMM的各状态的码字,从而实现对未知说话人的码本适应.本文通过非特定人汉语数码(孤立和连续数码)语音识别实验,把该新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法的自适应和识别效果优于基于CHMM的方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号