首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
基于动态MFCC的说话人识别算法   总被引:1,自引:0,他引:1  
提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果.  相似文献   

2.
说话人识别作为当今的一个研究热点,具有广泛的应用和研究前景。文章针对说话人识别的前端处理进行了相关研究,设计并实现了一个有效的处理算法。提取出Mel频率倒谱系数MFCC,讨论了MFCC各维参数对最终结果的贡献。文章通过研究高斯混合模型GMM的模型训练,使用最大似然估计算法和期望一最大化算法,在研究和改进基础上开发了一个基于高斯混合模型的说话人识别系统。同时完成了多线程并行测试与MFEC各维参数对最终识别结果的增益比较研究。  相似文献   

3.
赵征鹏  杨鉴 《计算机工程》2005,31(6):148-150
针对云南境内白族、纳西族、傈僳族3个典型的少数民族及汉族普通话语音,采用了高斯混合模型来训练每个民族的口音模型,并用少量的测试语音来获得较为满意的口音分类识别率,目的在于探索降低非母语口音话者语音识别错误率的有效途径.该文通过实验给出,对云南民族口音汉语普通话口音识别,当混合数为16,语音特征采用39维MFCC及其一阶、二阶差分参数时,口音识别正确率可达90.83%.  相似文献   

4.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。  相似文献   

5.
基于高斯语音滤波的稳健文本无关说话人识别   总被引:5,自引:1,他引:4  
基于高斯模型,提出一种去除实际电话录音中噪音、静音等非语音信号的新方法。与传统的语音检测器方法相比,基于高斯语音滤波的方法在不同信道条件下都可以自动进行,更好地保留了与说话人身份有关的信息。实验结果表明,采用该方法的系统的等错误率比传统方法最多下降了21.2%。  相似文献   

6.
针对实时性问题提出了一种以FPGA为硬件平台的说话人识别系统解决方案。该方案以MFCC为语音特征,采用了基于矢量量化的说话人识别算法。系统主要包括语音信号采集、端点检测、特征提取和识别判断4个部分。经测试证明,该系统完成了设计所需的基本功能。在实验室条件下,当系统时钟为50 MHz时,完成一次4码的识别耗时15.932 ms,对12码的识别率为93.3%。  相似文献   

7.
李壮辉 《测控技术》2014,33(6):28-31
针对传统高斯混合模型在建模过程中只采用倒谱系数表示的语音谱特征,而忽略说话人基音频率信息的问题,提出了一种基于多空间概率分布的基音融合高斯混合模型。该模型在每个高斯成分空间中对浊音和清音进行选择性区分,并将基音与倒谱特征参数进行融合。实验结果表明,通过对模型参数进行重估计,在TIMIT、NTIMIT两种不同语料库情况下,该模型的识别率较两种不同的基线系统均有提高。  相似文献   

8.
说话人识别中MFCC参数提取的改进   总被引:1,自引:0,他引:1  
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。  相似文献   

9.
针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维。降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练。仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高。  相似文献   

10.
针对传统高斯混合模型在噪声环境下识别率明显下降的问题,在借鉴随机概率分布模型间的α因子融合机制基础上,提出基于可变因子α整合的高斯混合模型。该模型通过引入可变因子使得混合模型中不同成分所占的比重又得到一次调整。实验结果表明,通过对该模型参数进行重估计,在TIMIT/NTIMIT两种不同语料库和不同样本集的情况下识别率较传统高斯模型均有提高。尤其在噪声环境和α因子取最优值时,识别率可提高8%,在NIST评测数据集上与GMM-UBM系统对比,识别率也有提高。  相似文献   

11.
为提高复杂噪声环境下语音信号端点检测的准确率,提出一种基于梅尔频谱倒谱系数(MFCC)距离的多维特征语音信号端点检测算法。通过计算语音信号的MFCC距离,结合短时能量和短时过零率对特征距离进行修正,并更新其阈值,建立自适应噪声模型,实现复杂噪声中语音信号端点的准确检测。实验结果表明,与基于双门限能量和基于倒谱距离的2种经典检测算法相比,在计算效率相同的条件下,该算法的检测准确率更高。  相似文献   

12.
识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明显。实验表明,在不影响系统识别率的情况下,该方法使系统的运行速度平均提高了1.5倍。  相似文献   

13.
如何能够快速准确的实现说话人识别是说话人识别研究的一个重要环节。提出双约简GMM的说话人确认方法,对语音参数进行核K-均值聚类,提取聚类中心的语音特征矢量作为训练数据,并对其进行fisher比约简,提取具有区分力强的维数。实验表明该文提取方法可以减少训练时间,并提高系统的鲁棒性。  相似文献   

14.
在噪声环境下, 为提高说话人识别系统的鲁棒性, 需要对系统进行各种抗噪声处理. 本文基于说话人特征的统计特性和直方图均衡化在说话人识别中的应用特点, 提出了直方图均衡化的自适应方法. 实验结果表明, 与普通直方图均衡化变换方法相比, 自适应直方图均衡化能进一步提高辨认系统的辨认率; 并且无论在平稳噪声还是非平稳噪声环境下, 该算法都能取得较好辨认率, 进一步增强系统的鲁棒性.  相似文献   

15.
李燕萍  唐振民  丁辉  张燕 《计算机工程》2009,35(14):221-223
针对说话人辨认中训练语音有限时系统泛化能力差的问题,提出一种基于半监督学习的复合高斯混合模型算法。通过复合高斯混合模型对所有说话人的特征分布统一建模,基于半监督学习机制下的EM算法对学习样本进行学习。实验证明,该算法能够充分利用未标记样本对系统进行有效的自适应更新,改善系统的性能,获得比传统高斯混合模型更高的识别率,提高系统的泛化能力。  相似文献   

16.
孙毅刚  李鸿  张红颖 《计算机工程》2012,38(18):166-170
在运动目标停滞的情况下,传统的混合高斯模型会将运动目标误判为背景,导致目标漏检。为此,提出一种基于改进混合高斯模型的目标检测算法。引入背景学习参数,结合前一帧的检测结果自适应地更新背景,从而提取完整的运动目标。利用像素的八连通区域信息抑制噪声,提高算法在复杂环境中的稳定性。实验结果表明,与传统检测方法相比,该算法能够在复杂环境中准确地检测出短暂停滞的运动目标。  相似文献   

17.
针对目前基于传感器技术的火灾探测器存在检测区域小、干扰大、误报率高等不足,提出了一种基于混合高斯模型与机器视觉相结合的火灾检测方法.该方法通过对摄像头获取的图像信息进行处理和分析,利用火灾早期产生的烟雾和火焰的颜色及形体变化特征来探测火灾.通过建立混合高斯模型对火灾进行识别,再对识别结果进行进一步的动态特征识别.试验证明,该方法克服了传感器检测方法的缺点,实时性好、识别率高.  相似文献   

18.
基于改进高斯混合模型的前景检测   总被引:1,自引:0,他引:1       下载免费PDF全文
针对自适应混合高斯背景模型执行速度慢、检测前景时容易产生“鬼影”等问题,提出一种改进的混合高斯背景建模方法。该方法通过对高斯分布权值和生存时间的限制,建立高斯分布退出机制,使模型能根据场景自适应选择每个像素的高斯分布个数,从而去除多余高斯分布,加快算法执行速度。在模型更新过程中,通过融入帧间差分,将每帧图像分成运动像素、背景像素及非真实运动像素,并通过对非真实运动像素赋予较大学习率来加速移出背景的恢复,从而避免“鬼影”和拖影现象。实验结果表明,与传统检测方法相比,该方法可以获得更好的目标检测效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号