首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 421 毫秒
1.
周宇欢  张雄伟  付强  徐鑫  王金明 《信号处理》2011,27(12):1914-1919
语音是一种复杂的非线性信号,这使得基于线性系统理论发展起来的传统说话人识别技术性能难以进一步提高。本文提出了多分形谱簇分析方法,用于分析语音信号的非线性特征,并应用于短语音(2秒)说话人识别。通过对Cantor集的仿真实验,发现不同标度区能反映出系统不同阶段的生长规律,因此可用一组连续变化的多分形谱分层次地表征系统的分形特性,即多分形谱簇分析方法。然后结合语信号的分形特点,提出一种语音的多分形谱簇特征(Multifractal Spectrum Cluster Feature, MSCF)的提取方法。最后将几种非线性特征与短时谱特征结合用于说话人识别,基于TIMIT数据库50人的实验表明,非线性特征与短时谱特征互补性较强,特别是MSCF与MFCC、LPC特征结合,使得系统的误识率下降到0.8%。   相似文献   

2.
声纹识别是生物特征识别领域的一个重要分支。它采用语言数据自动地鉴定测试者身份。本文研究复杂背景下的声纹识别系统的设计与实现,首先,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;其次,在特征提取阶段,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数(MFCC),将得出的两种参数组成一个特征矢量作为声纹特征;最后声纹识别阶段,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,即判定为说话人。  相似文献   

3.
作为说话人识别特征参量的MFCC的提取过程   总被引:5,自引:0,他引:5  
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。  相似文献   

4.
本文针对语音信号中的声母语音更易受环境噪声污染而导致识别性能下降的情况,根据普通话声母发声位置特点,提出了一种对发声位置状态描述的发声特点参数(Articulatory Feature,简称AF),采用特征空间映射方法,由短时倒谱参数(MFCC)经MLP特征映射网络映射获取,MLP特征映射网络则由语言学先验知识事先训练得到.AF参数具有良好的噪声鲁棒性,并与MFCC参数具有互补性,由MFCC和AF组成的联合特征参数(MFCC-AF)可使系统确认性能的鲁棒性有明显的改善.在微软数据库上的基于GMM-UBM模型的与文本无关的说话人确认实验表明,对于声母语音,采用MFCC-AF参数使系统的鲁棒性有明显的改善:在干净、25dB、20dB条件下,较只采用MFCC参数的系统的EER分别相对降低了5.4%,14.12%,20.27%.  相似文献   

5.
通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差异。实验结果表明,语音信号经过固话信道传输后,不仅造成信号的频率失真,还伴随有宽带噪声和共振型噪声。在MFCC特征参数方面,麦克风和固话信道的第二维MFCC参数差异最明显,低维参数相比高维参数差异较大,男性说话人特征参数相比女性说话人差异较大。  相似文献   

6.
基于伽马通滤波器组的听觉特征提取算法研究   总被引:3,自引:1,他引:2  
王玥  钱志鸿  王雪  程光明 《电子学报》2010,38(3):525-528
本文从模拟人类听觉角度出发,给出了基于人耳耳蜗听觉模型的伽马通滤波器组模型,测试语音通过该滤波器组输出得到了高维听觉特征向量.经过主成分分析和离散余弦变换,分别得到了可用于表征说话人的伽马通系数和伽马通滤波器倒谱系数及其衍生特征.实验证明,与传统梅尔倒谱特征相比,采用本文提出特征的说话人识别系统在识别率及鲁棒性上均有明显提高.  相似文献   

7.
基于压缩感知的稳健性说话人识别   总被引:1,自引:1,他引:0  
单进  芮贤义 《电声技术》2011,35(2):61-63
阐述了在噪声条件下,将基于压缩感知理论的丢失数据重建技术应用于说话人识别系统的系统前端.首先使用Mel滤波器组将带噪语音信号转换成Mel频谱,然后利用带噪MeI谱中可靠数据重建不可靠数据,最后从重建的Mel频谱中提取Mel倒谱特征参数用于说话人识别.稳健性实验结果表明,该方法能够提高在噪声环境下说话人系统的识别率.  相似文献   

8.
本文首次使用了最大熵谱法估计的LPC反射系数矢量的长期平均作为说话人的语音特征矢量,利用所定义的特征矢量的平均自差异函数,平均互差异函数及平均互——自差异比函数分析了特征矢量用于非限定语音的说话人识别的有效性和说话人的可区分性;从模式识别分类的Bayes判决准则出发,导出了便于计算和程序实现的简化判决公式——欧几里德空间的加权和距离公式,并利用平均差异函数选择加权系数;提出了用序贯判别法对集外说话人的拒识方法;研制了相应的以微机为核心的实时响应的实验系统,响应速度为3秒。用此系统对20个说话人进行了非限定语音的说话人识别试验,误音率为10.67%,误拒率为5.67%,正确识别率95.41%。  相似文献   

9.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。  相似文献   

10.
声纹识别技术,形象的说法就是说话人识别技术.它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术.本文所研究的是与文本有关的说话人确认系统.比较了基于声道的线性预测倒谱系数(LP CC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性.并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真.本实验系统的识别率达到了90%,验证了HMM模型识别的准确性.  相似文献   

11.
We propose a novel feature processing technique which can provide a cepstral liftering effect in the log‐spectral domain. Cepstral liftering aims at the equalization of variance of cepstral coefficients for the distance‐based speech recognizer, and as a result, provides the robustness for additive noise and speaker variability. However, in the popular hidden Markov model based framework, cepstral liftering has no effect in recognition performance. We derive a filtering method in log‐spectral domain corresponding to the cepstral liftering. The proposed method performs a high‐pass filtering based on the decorrelation of filter‐bank energies. We show that in noisy speech recognition, the proposed method reduces the error rate by 52.7% to conventional feature.  相似文献   

12.
针对说话人声纹身份认证一体化设计需求,利用曲线拟合方法改进Mel滤波器组,开展声纹特征参数提取的SoC设计研究。首先选取MFCC,IMFCC,MidMFCC的Mel频率刻度上的平均值作为拟合参数,得到拟合函数;然后利用插值方法改进Mel滤波器组中各滤波器的加权中心频率;通过Matlab进行算法设计和仿真分析,采用Quartus II和Modelsim实现代码编写、编译、时序仿真和综合;最后利用SOPC Builder技术将Verilog模块封装为IP核,并下载到DE2开发板中进行验证。研究结果表明,本系统提取出的多维特征参数具有更好的鲁棒性,有利于提高识别率。  相似文献   

13.
基于不变集多小波的语音特征参数提取   总被引:1,自引:0,他引:1  
在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数(MFCC)的提取算法,用多小波交换代替傅里叶变换及Mel滤波.构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。  相似文献   

14.
高阶MFCC的话者识别性能及其噪声鲁棒性   总被引:6,自引:0,他引:6  
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量.本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性.基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量.实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性.  相似文献   

15.
基于小波包分析特征参数的说话人识别系统   总被引:5,自引:0,他引:5  
李战明  王贞 《电声技术》2005,(6):46-49,55
介绍了说话人识别系统,研究MFCC提取原理与小波包分析的基础上,提出了一种基于小波包分析的新型语音特征参数WPDC。在研究了WPDC提取算法的基础上,建立了一个神经网络模型的说话人识别系统,实验比较了MFCC与WPDC的识别性能,验证WPDC了具有很高的识别率,是一种很好的语音特征参数。  相似文献   

16.
基于鲁棒听觉特征的说话人识别   总被引:3,自引:0,他引:3  
林琳  陈虹  陈建 《电子学报》2013,41(3):619-624
 为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数.  相似文献   

17.
为了提高海洋哺乳动物声音识别算法的识别率和鲁棒性,提出了一种将梅尔倒谱系数MFCC、线性倒谱系数LFCC和时域特征融合作为特征参数进行声音识别的方法。该方法通过融合不同倒谱系数以增强对不同频段的表征能力,通过融合时域特征来更全面地描述声音信息。声音样本通过基于海洋环境下的预处理、特征提取与融合后,用支持向量机进行分类识别。相对于传统算法只针对一种或几种哺乳动物进行识别,该方法在包含61种海洋哺乳动物声音的样本库中进行测试。测试结果显示该算法较传统的梅尔倒谱系数在识别率上提升了5.5%,且在海洋低信噪比环境下有更好的识别表现。  相似文献   

18.
在说话人识别系统中,能够反映说话人个性的语音特征参数是系统的关键问题之一。本文提出了一种新的说话人识别方法:在小波变换的基础上,借鉴MFCC特征参数的提取,基于GMM模型,用小波包变换代替傅立叶变换,提取新的特征参数DWPTMFCC,实验结果表明,该方法简单可靠,有效可行,具有较高的识别率,与已有方法相比,具有广泛的实用性。  相似文献   

19.
翟懿奎  陈璐菲 《信号处理》2018,34(4):476-485
针对行人再识别技术易受到光照、姿态和视角等因素影响,同一个人外观特征变化明显,较难提取其不变特征,导致识别率偏低的问题,本文提出面向行人再识别的融合特征与鉴别零空间方法。首先利用HSV、LAB、RGB和YCrCb四种颜色特征和Gabor滤波器提取条纹特征, GOG描述子提取块状特征,并将这两种特征融合成一个特征向量,然后将融合后的的特征投影到鉴别零空间,降低特征维数,最后利用欧氏距离计算距离进行行人再识别。本文所提方法在VIPeR、Prids_450s和CUHK01数据库上的rank1识别率分别是52.7%、72.2%和59.7%,实验结果表明所提方法能充分融合行人图像特征,对环境有较强鲁棒性,可有效提高识别率。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号