共查询到18条相似文献,搜索用时 78 毫秒
1.
基于动态MFCC的说话人识别算法 总被引:1,自引:0,他引:1
《模式识别与人工智能》2005,18(5)
提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果. 相似文献
2.
说话人识别作为当今的一个研究热点,具有广泛的应用和研究前景。文章针对说话人识别的前端处理进行了相关研究,设计并实现了一个有效的处理算法。提取出Mel频率倒谱系数MFCC,讨论了MFCC各维参数对最终结果的贡献。文章通过研究高斯混合模型GMM的模型训练,使用最大似然估计算法和期望一最大化算法,在研究和改进基础上开发了一个基于高斯混合模型的说话人识别系统。同时完成了多线程并行测试与MFEC各维参数对最终识别结果的增益比较研究。 相似文献
3.
针对云南境内白族、纳西族、傈僳族3个典型的少数民族及汉族普通话语音,采用了高斯混合模型来训练每个民族的口音模型,并用少量的测试语音来获得较为满意的口音分类识别率,目的在于探索降低非母语口音话者语音识别错误率的有效途径.该文通过实验给出,对云南民族口音汉语普通话口音识别,当混合数为16,语音特征采用39维MFCC及其一阶、二阶差分参数时,口音识别正确率可达90.83%. 相似文献
4.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。 相似文献
5.
6.
7.
针对传统高斯混合模型在建模过程中只采用倒谱系数表示的语音谱特征,而忽略说话人基音频率信息的问题,提出了一种基于多空间概率分布的基音融合高斯混合模型。该模型在每个高斯成分空间中对浊音和清音进行选择性区分,并将基音与倒谱特征参数进行融合。实验结果表明,通过对模型参数进行重估计,在TIMIT、NTIMIT两种不同语料库情况下,该模型的识别率较两种不同的基线系统均有提高。 相似文献
8.
说话人识别中MFCC参数提取的改进 总被引:1,自引:0,他引:1
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。 相似文献
9.
针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维。降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练。仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高。 相似文献
10.
针对传统高斯混合模型在噪声环境下识别率明显下降的问题,在借鉴随机概率分布模型间的α因子融合机制基础上,提出基于可变因子α整合的高斯混合模型。该模型通过引入可变因子使得混合模型中不同成分所占的比重又得到一次调整。实验结果表明,通过对该模型参数进行重估计,在TIMIT/NTIMIT两种不同语料库和不同样本集的情况下识别率较传统高斯模型均有提高。尤其在噪声环境和α因子取最优值时,识别率可提高8%,在NIST评测数据集上与GMM-UBM系统对比,识别率也有提高。 相似文献
11.
12.
13.
如何能够快速准确的实现说话人识别是说话人识别研究的一个重要环节。提出双约简GMM的说话人确认方法,对语音参数进行核K-均值聚类,提取聚类中心的语音特征矢量作为训练数据,并对其进行fisher比约简,提取具有区分力强的维数。实验表明该文提取方法可以减少训练时间,并提高系统的鲁棒性。 相似文献
14.
15.
16.
17.
18.
针对自适应混合高斯背景模型执行速度慢、检测前景时容易产生“鬼影”等问题,提出一种改进的混合高斯背景建模方法。该方法通过对高斯分布权值和生存时间的限制,建立高斯分布退出机制,使模型能根据场景自适应选择每个像素的高斯分布个数,从而去除多余高斯分布,加快算法执行速度。在模型更新过程中,通过融入帧间差分,将每帧图像分成运动像素、背景像素及非真实运动像素,并通过对非真实运动像素赋予较大学习率来加速移出背景的恢复,从而避免“鬼影”和拖影现象。实验结果表明,与传统检测方法相比,该方法可以获得更好的目标检测效果。 相似文献