共查询到15条相似文献,搜索用时 109 毫秒
1.
本文在基于GMM的与文本无关说话人识别系统中考虑性别差异,提出了把不同性别的说话人特征参数归成不同的两个子集,识别时先判断待识别说话人特征是属于哪个性别子集后,再在相应的子集中进行识别的方法。实验结果表明该方法能够改善基于GMM的与文本无关说话人识别系统的识别率。 相似文献
2.
采用帧概率变换的与文本无关说话人识别系统的实现 总被引:4,自引:0,他引:4
从基于GMM的与文本无关说话人识别系统的帧似然概率的统计特性出发,提出了一种对目标和非目标模型帧似然概率进行补偿变换的方法。理论推导和实验结果表明,与GMM常用的最大似然(ML)变换相比,该变换能使系统降低误识率达8.6%,因此,证明了该变换能够改善基于GMM的与文本无关说话人识别系统的识别率。 相似文献
3.
4.
基于分类特征空间高斯混合模型和神经网络融合的说话人识别 总被引:2,自引:0,他引:2
该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合。在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。 相似文献
5.
6.
说话人识别的关键在于如何为集合中的每一个人建立一个能表征该说话人个性特征的声学模型,建模方法将会严重影响系统的性能。基于当今与文本无关的话者识别的主流模型——高斯混合模型(Gaussian Mixture Model,GMM)的基础上,从声学的角度剖析了男女发音的差别,以增加说话人之间的差异性为出发点,引入竞争性思想和通用背景模型(Universal Background Model,UBM),提出了具有区分性的GMM的建模方法,克服了传统GMM需要大量训练样本的局限性和UBM将说话人强制服从统一分布的弱点。最后实验的对比结果表明,具有区分性的GMM相比传统的高斯混合模型在识别率上有所提高。 相似文献
7.
8.
基于小波神经网络的原理对与文本无关的说话人进行了识别.通过分析网络结构,提出了优化网络初始参数的方法,加快了小波网络的收敛速度;采用分组器与阵列搜索算法相结合,减少了识别时的搜索时间.实验结果表明该识别系统能大大提高识别人数和识别速度,在43人的语音识别中,识别率达到97.67%. 相似文献
9.
介绍说话人识别技术发展情况,阐述包括特征提取、识别算法和区分算法在内的文本无关说话人识别系统的整体技术框架和基本工作原理针对文本无关说话人识别相关技术给出了近几年主要发展的高斯超向量—支持向量机模型(GSV-SVM)、联合因子分析模型(JFA)和鉴别性向量(i-vector)模型,并对3种模型进行了分析比较:指出GSV-SVM模型可以提高识别系统性能;JFA模型能提高系统性能但计算量过大,难以实现应用;i-vector模型降低了计算量,并能提高识别精确度和效率,是目前的研究热点。最后指出当前文本无关说话人识别的研究难点和热点。 相似文献
10.
11.
基于帧变换的与文本无关语种辨识系统的实现 总被引:1,自引:1,他引:0
成新民 《微电子学与计算机》2004,21(12):131-134
从基于GMM的与文本无关语种辨识系统的帧似然概率的统计特性出发,提出了针对语种辨识的GMM模型训练的新方法以及一种对目标和非目标模型帧似然概率进行补偿变换的方法。理论分析和实验结果表明,与GMM常用的最大似然(ME)变换相比,该变换能使系统提高辨识率达2.0%,因此,证明了该变换能够改善基于GMM的语种辨识系统的识别率。 相似文献
12.
13.
14.
基于高斯混合模型(GMM)的说话人识别方法通常采用对数似然得分作为测试时判定目标说话人的依据。文章在分析对数似然得分特点的基础上,提出了一种改进方法,提高了测试语音帧对于目标模型和非目标模型得分的相对差值。基于TIMIT数据库的实验证明了采用变换后似然得分的说话人识别系统比采用对数似然得分的系统具有更好的识别性能和抗噪声性能。 相似文献
15.
受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以Mel倒谱系数为说话人特征,运用主成分分类技术,结合定点数计算技术实现实时说话人自动识别。在19个用户的语音库上进行系统识别实验,此新型分类技术的训练时间缩短为基线系统的1/50,测试时间缩短为1/12,模型规模缩小为1/6,同时识别性能达到94.7%。 相似文献