首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 31 毫秒
1.
针对说话人确认中的复杂信道环境干扰问题,提出一种基于深度神经网络的信道自适应方法。该方法首先在不同信道类型下训练得到音素信息相关的深度神经网络模型(Deep Neural Networks, DNNs),将说话人语音的声学特征参数在这些DNNs上进行自适应,得到各信道类型下的深瓶颈特征(Deep Bottleneck Feature, DBF)。然后将这些参数进行拼接并通过PCA降维,最后采用目前最有效的基于身份认证矢量(identity vector,i-vector)的建模技术对降维后的DBF进行建模,得到目标说话人模型和测试语音段的i-vector矢量用于最终说话人确认打分判决。在NIST SRE2010核心评测数据库上的实验结果表明,利用提出的方法能有效消除信道干扰对说话人确认的影响,在很大程度上提升了基于i-vector的说话人确认基线系统的性能。  相似文献   

2.
梅尔倒谱系数是一种常用于说话人识别的特征参数,韵律特征是一种描述人的声门特性的参数。为融合MFCC与韵律特征,以图优化说话人确认系统性能,该文采用二次判决的方法来处理这两个特征;参与第二次判决的语音则由通过大量实验制定的判决空间来确定。实验结果表明,采用二次判决时,系统等错误率从仅使用MFCC时的5.56%的下降至4.37%。  相似文献   

3.
提出了一种基于改进的语音融合特征和GMM模型相结合的跨语种说话人确认方法.首先,采用Teager能量算子提取语音中的浊音段,消除与说话人声道特征无关的静音段和清音段.其次,提取基音周期参数,并与16维的MFCC参数融合形成本文的语音融合特征.最后,将本文方法与文献[9]的方法分别进行了单语种和跨语种的说话人确认对比实验,实验结果表明本文方法识别准确率和平均判别时间均优于文献[9]的方法,证明本文提出的方法有效,可用于跨语种的说话人确认应用领域.  相似文献   

4.
多编码环境下的说话人确认常常遇到训练和测试语音编码不匹配问题,导致性能显著下降。提出了一种针对语音编码差异的似然比得分补偿方法,不但可以消除编码差异,还便于设计与编码无关的单一阈值。该方法通过采用极大似然语音编码检测器,对输入语音信号经历的编码算法进行标注,并估计相应编码造成的似然比得分分布的畸变,最后在说话人确认时校正这一差异。实验结果表明,这一方法能够显著提高训练和测试编码不匹配时的确认性能,使等错误率平均降低3.11%,逼近了匹配时的结果,从而提高了说话人确认系统的稳健性。  相似文献   

5.
本文提出了一种基于GMM(Gaussian Mixture Model)的说话人分类算法,主要介绍了GMM模型和具体实现以及基于GMM的说话人分类算法在关键词检测系统中的应用。实验结果证明,该算法计算量小、实现速度快,能够提高系统的识别率,扩大应用人群范围,在中小词汇表识别系统中有关非常广阔的前景。  相似文献   

6.
语音在受到加性噪声污染时,不同部分受噪声污染的程度存在差异,保留受污染严重的语音将会对说话人确认系统产生负面影响,笔者提出了一种基于归一化自相关的鲁棒性语音筛选方法.通过归一化自相关舍弃受污染严重的语音.实验表明,通过归一化自相关舍掉受污染严重的语音,能提高噪声环境下的说话人确认性能.  相似文献   

7.
基于传统的LPC倒谱特征和KC复杂性特征建立了一个说话人确认系统,采用了YOHO speaker verification数据库训练模板和测试该说话人确认系统,取得了较好的说话人确认效果。实验证明:传统的基于线性理论基础上的说话人识别特征提取方法,与基于非线性理论的KC复杂性特征基本无相关性,因此这两类特征如能相互结合,有着良好的互补特性,能够大幅度的提高系统性能。这说明新提出的说话人的KC复杂性特征是一个非常有用的传统线性特征的有效辅助特征。  相似文献   

8.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

9.
提出一种基于稀疏神经网络的说话人分割方法,利用稀疏的单隐层神经网络提取语音的超矢量特征中说话人因子特征,然后通过K均值聚类得到每帧语音的标号来分割不同说话人,在稀疏网络的训练过程中引入了dropout技术以克服过拟合问题.在TIMIT语音数据库构成的多说话人语音数据上的实验结果表明:通过增加稀疏网络中隐层节点的个数可以提高说话人分割的效果,与贝叶斯信息准则(Bayesian information criterion,BIC)方法和稀疏自编码网络方法相比,所提基于稀疏神经网络的说话人分割方法的性能有明显提高.  相似文献   

10.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型.通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

11.
12.
介绍了一个将参考模板存放在智能卡上的与相关的话者确认系统及其工作原理、相关算法和参数设置。  相似文献   

13.
无监督深度学习网络的训练目标从信息论的角度可解释为最大化训练样本及其表示之间的互信息.对抗自编码器(AAE)通过生成对抗的方式学习训练样本集的分布,据此可以由AAE建立基于正常样本集的半监督异常检测模型,但是AAE无法显式最大化正常样本及其表示间的互信息.为此,提出了一种互信息估计网络和AAE相融合(IAAE)的异常检测方法,该方法首先以重构误差最小化为目标,训练编码器和解码器;其次,在对抗正则化阶段将正常样本低维表示的聚集后验分布约束为先验分布,并最大化正常样本与其表示之间的互信息;最后由全连接神经网络估计正常样本与其表示之间的互信息.由待测样本的重构误差及其表示在隐空间中的众数散度计算其异常得分值.公开数据集上的实验结果表明,与已有典型相关的深度异常检测模型相比,IAAE模型在F1取值上具有更好的表现.  相似文献   

14.
针对混合语音信号的盲分离问题,基于自适应的互信息极小化算法是一个非常良好的解决办法,本文深入研究了该算法,并且为了加快算法的收敛速度,对该算法进行了改进,文章最后给出的实验结果表明,改进后的算法在分离语音信号和收敛速度上,都是非常有效的.  相似文献   

15.
针对在超宽带信道估计中应用压缩感知理论需要预知信道稀疏度的问题,利用超宽带信道在时域上的稀疏性,将信道估计问题转化为压缩感知理论中的稀疏向量重构问题,提出了稀疏度自适应正则化压缩采样匹配追踪(SARCoSaMP)算法。该算法在压缩采样匹配追踪(CoSaMP)算法的基础上,引入自适应和正则化方法,自动调整所选原子数目,逐步逼近信道稀疏度K,在稀疏度未知的情况下精确地实现信道估计。仿真结果表明,该算法可有效应用于超宽带系统的信道估计,并且其性能明显优于CoSaMP算法和稀疏自适应匹配追踪(SAMP)算法。  相似文献   

16.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号