共查询到20条相似文献,搜索用时 968 毫秒
1.
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点.语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性.文中则主要在加性白噪声环境下研究Mel倒谱参数、Mel差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进.从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声. 相似文献
2.
针对源说话人与目标说话人之间声学差异过大影响语音转换效果的问题,提出一种基于声道归一化调整的语音转换方法。该方法通过STRAIGHT分析-合成模型提取说话人的个性化特征参数。在频谱训练阶段,对已提取的Mel频率倒谱系数利用声道归一化和高斯混合模型的方法进行训练映射。主观听音测试证明,该方法的转换效果优于传统的不使用声道归一化的高斯混合模型。 相似文献
3.
为了提高说话人识别中语音特征参数的鲁棒性,提取了新的特征参数DWT-MFCC,在提取该参数时利用了新构造的阈值函数,并基于高斯混合模型的说话人识别系统进行实验。实验结果表明,相对于传统的MEL倒谱系数(MFCC)参数,在相同的噪声环境下,DWT-MFCC参数具有更高的说话人识别率。 相似文献
4.
在基于智能卡的说话人确认系统中,实现了一种新的端点检测方法:能频值端点检测方法,其取得了较好的效果;在鲁棒性方面,研究了Mel倒谱系数各分量在说话人识别中的贡献,以及在参数级上Mel倒谱系数的差分系数及倒谱均值相减法对说话人识别的贡献;最后,讨论了基于智能卡的生物特征识别技术的应用途径。 相似文献
5.
基于鲁棒听觉特征的说话人识别 总被引:3,自引:0,他引:3
为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数. 相似文献
6.
7.
基于压缩感知的稳健性说话人识别 总被引:1,自引:1,他引:0
阐述了在噪声条件下,将基于压缩感知理论的丢失数据重建技术应用于说话人识别系统的系统前端.首先使用Mel滤波器组将带噪语音信号转换成Mel频谱,然后利用带噪MeI谱中可靠数据重建不可靠数据,最后从重建的Mel频谱中提取Mel倒谱特征参数用于说话人识别.稳健性实验结果表明,该方法能够提高在噪声环境下说话人系统的识别率. 相似文献
8.
基于MFCC的说话人识别系统 总被引:7,自引:0,他引:7
说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients ,MFCC)作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC. 相似文献
9.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。 相似文献
10.
在语音质量客观评估方法中,通常以Mel倒谱系数作为语音特征参数。但是Mel倒谱阶数的变化对评估效果有着直接的影响,同时Mel倒谱系数中各个分量对语音质量评估的贡献度不同,而以往的研究没有涉及Mel倒谱阶数和分量贡献度对语音质量评估效果的影响。实验确定了最佳阶数后,结合增减分量法对Mel倒谱系数进行贡献度的研究,通过对特征参数的选择重组,得到维数更低的IMFCC(Important Mel Frequency Cepstrum coefficient)。经检验,改进后的方法提高了2%的评估效果,降低了2%的预测误差。 相似文献
11.
DSP嵌入式说话人识别系统的设计与实现 总被引:1,自引:1,他引:0
介绍一种基于浮点型数字信号处理器(TMS320C6713),并通过语音识别说话人身份的实用系统。为构建一个稳定实用的基于DSP说话人识别系统。以Mel倒谱系数作为特征参数,采用高斯混合模型作为识别模型,模型参数采用FLASH ROM存储,并实现自举运行。经过调试,实现了系统的自举运行,自举运行时可选择系统的训练和识别功能,并可方便地选择参加训练和识别的说话人,识别的范围为10人,识别的速度在3 s之内,准确率达98%以上。达到了系统设计的目的要求。与其他系统相比,该系统在实现算法上加以一定的改进,保证了识别率,并实现自举运行同时充分考虑可操作性,具有更大的实用价值。 相似文献
12.
系统通过提取线性预测倒谱系数作为特征参数进行说话人识别研究.在具有VLIW(甚长指令集)体系结构的DSP芯片上,对提取的特征参数在进行并行遗传算法寻优,以获取说话人的最优参数进行说话人识别.实验结果表明,采用硬件并行遗传算法比简单遗传算法对特征参数进行优化识别,识别时间大幅减少,识别率有较大提高,为说话人识别的应用提供较强的参考价值. 相似文献
13.
14.
为了能够更好地识别入侵振动信号,通过研究分布式光纤振动传感器及振动信号的识别技术,根据振动信号的特点,借鉴语音信号的处理方法,对比原有基于快速傅里叶变换频谱分析算法,引入了基于Mel频率倒谱系数的识别算法。新算法从频域的角度对振动信号进行分析,提取不同环境状态下的Mel频率倒谱系数,并将其作为新的特征参量。通过实验对比分析两种算法,两者的误报率分别为27.5%和7.5%。结果表明,基于Mel频率倒谱系数的算法相比基于快速傅里叶变换的频谱分析算法,在误报率上可以降低20%甚至更多,在不漏报的前提下,显然误报率更低的基于Mel频率倒谱系数的算法更加适用于安防体系。 相似文献
15.
16.
基于不变集多小波的语音特征参数提取 总被引:1,自引:0,他引:1
在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数(MFCC)的提取算法,用多小波交换代替傅里叶变换及Mel滤波.构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。 相似文献
17.
基于多特征有效组合的说话人识别 总被引:1,自引:0,他引:1
通过分析当今说话人识别系统中常用的一些特征参数,以提高说话人识别的识别率为目的,在Matlab 6.5软件环境下提出了将Mel频率倒谱(MFCC)、线性预测倒谱(LPCC)及他们的一阶差分和基音周期等多种特征有效结合进行说话人识别的方法。采用短时自相关法提取基音周期,在识别过程中采用改进的动态规整算法,将模板的匹配过程与检验量的计算分离开,每帧给出一个说话人辨认结果,最后综合各帧的辨认结果,得出最佳匹配结果。经过多次实验证明,采用以上方法使用多特征有效结合比单个使用各种特征效果要好,能在一定程度上提高系统区分说话人的能力。 相似文献
18.
19.
20.
作为说话人识别特征参量的MFCC的提取过程 总被引:5,自引:0,他引:5
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。 相似文献