首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需要不断调节惩罚因子的问题;其次在说话人改变检测的基础上,采用性别模型判断每个说话人的性别;最后把男性和女性说话人分别对待,使用说话人模型自举法对说话人进行辨认。实验结果表明:在说话人改变检测中,采用惩罚距离公式,和BIC相比不需要调整参数,和DISTBIC相比,在F1方面提高了2%;在说话人辨认方面,利用性别信息,说话人索引准确率(SIA)提高了20.93%,说话人数量准确率(SNA)方面提高了3%。  相似文献   

2.
基于序贯判决法的自动说话人识别   总被引:2,自引:0,他引:2  
潘洁 《微机发展》2000,10(1):46-48
本文介绍了一种在微型计算机上实现的与文本无关的自动说话人识别系统。系统采用了一种经距离加权的矢量量化方法,提出了用于识别过程的序贯判决法,从而提高了系统识别率,并大大减少了识别系统的计算量。  相似文献   

3.
一种新的说话人确认方法   总被引:3,自引:0,他引:3  
张怡颖  朱小燕  张钹 《软件学报》1999,10(4):372-376
文章在对说话人确认和说话人辨认进行比较研究的基础上,提出一种新的说话人确认方法.同传统方法相比,该方法通过建立非特定说话人模型综合多个说话人的语音特性,使其能够对于不同的待确认语音给出不同的判决阈值,从而解决了说话人确认在判决阈值设置上存在的困难.实验结果表明,该方法能够显著降低说话人确认系统的错误接受率和错误拒绝率,为说话人确认应用于保密性要求较高的环境提供了一条有效的途径.  相似文献   

4.
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法.对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能。通过实验印证了将传统的说话人检索中的模型训练过程转变为计算语音相对于anchor说话人模型距离的映射过程.所带来的计算量和存储量的优势.为说话人检索在大型语音库和嵌入式系统的应用提出了新的思路:  相似文献   

5.
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法,对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能.通过实验印证了将传统的说话人检索中的模型训练过程转变为计算语音相对于anchor说话人模型距离的映射过程,所带来的计算量和存储量的优势,为说话人检索在大型语音库和嵌入式系统的应用提出了新的思路.  相似文献   

6.
该文研究了在基于矢量量化的说话人识别方法中采用加权的失真测度对识别率的影响。在采用加权欧氏距离失真测度时,利用特征参数的离散程度来确定权值,提出了基于标准差的加权失真测度和基于方差的加权失真测度。实验结果表明,在以MFCC为特征参数的说话人识别系统中,使用这两种算法均可以提高识别率。  相似文献   

7.
以线性预测系数为特征通过高斯混合模型的迭代算法对训练样本的初始k均值聚类结果进行优化,得到语音组成单位的表示.以语音组成单位的模式匹配为基础,提出一种文本无关说话人确认的方法——均值法,以及一种文本无关说话人辨认方法.实验结果表明,即使在短时语音下本文方法都能取得较好效果.  相似文献   

8.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

9.
针对同类语音数据的相似性和不同类数据具有不同几何距离的特点,提出了一种基于GMMSVM的说话人识别系统。该系统结合了GMM和SVM的优点,解决了GMM在语音数据较小时不能区分数据间的差异性及SVM在处理大量数据时识别率下降的问题;采用改进的K-Means算法实现模型参数初始化,提高了参数精度。试验结果表明,基于GMM-SVM的说话人识别系统较单独采用GMM或SVM的系统具有更好的识别率和鲁棒性。  相似文献   

10.
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。  相似文献   

11.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。  相似文献   

12.
余巍  李辉 《计算机工程》2011,37(23):162-164
基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库的实验结果表明,该方法能在基本保持系统识别性能的前提下,降低UBM的训练运算量。  相似文献   

13.
话者转换就是将A的语音转换为具有B发音特征的语音而保持内容不变。发音时基音周期是变化的,在语音转换的两话者特征参数匹配阶段,由于窗内语音信号周期不同,采用固定窗进行语音参数提取会造成了一定程度的匹配误差。提出的变滑动窗是按语音信号的基音周期变化来选择不同长度的滑动窗进行语音分割,这使得每个窗内的包含相同周期的语音信号,从而消除了由语音信号不同产生的参数差异。实验证明该方法提高了话者转换的效果。  相似文献   

14.
陈黎  徐东平 《计算机工程》2011,37(14):172-174
建立一种支持向量机-高斯混合模型(SVM-GMM),用以提高开集说话人识别的识别率。该模型的基本思想是将SVM的分类结果用GMM模型进行确认。由于SVM模型具有较好的分类性能,而GMM模型能够较好地描述类别内部的相似性,因此这2个模型的组合能够优势互补,从而获得较好的识别效果。实验结果表明,使用SVM-GMM模型能有效地提高开集说话人识别的识别率。  相似文献   

15.
研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。  相似文献   

16.
武宁  肖星星  冯瑞 《计算机工程》2012,38(2):207-209
现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差。为此,在改进和优化高斯混合-通用背景模型的基础上,根据家庭环境中的典型特征,设计并实现一种用于家用机器人的说话人识别系统。应用结果表明,该系统具有较好的识别性能和较高的鲁棒性,适用于声控门禁和语音签到等领域。  相似文献   

17.
对文本无关的说话人验证中模型距离归一化问题的研究   总被引:2,自引:0,他引:2  
董远  陆亮  赵贤宇  赵建 《自动化学报》2009,35(5):556-560
在自动说话人验证中, 模型距离归一化是非常有用的得分归一化技术之一. 相比于其他的主流得分归一化技术, 模型距离归一化的主要优点在于它不需要额外的语音数据和说话人集合. 但是, 它也仍然有自身的缺点. 比如, 在传统的模型距离归一化中, 模型之间的KL距离用Monte-Carlo方法求得, 而此方法的时间复杂度很高. 本文从一个新的角度探讨了模型距离归一化的原理, 并且提出了简化的模型距离归一化方法, 即使用KL距离的上限来衡量两个说话人模型的距离. 在2006年的NIST说话人评测数据集上, 本文提出的简化的模型距离归一化方法取得了与传统方式相近的结果, 而时间复杂度却大大降低了.  相似文献   

18.
说话人识别是根据检测到的语音进行说话人身份的认证.是将待识别语音与数据库中的说话人语音进行匹配的过程。设计基于高斯混合模型(GMM)说话人识别系统,提取输入语音的Mel倒谱系数作为观察向量,用GMM算法进行说话人语音模型训练和识别。同时设计基于TMS320DM3730DSP的嵌入式硬件平台,并在该平台上实现所设计的说话人识别系统。为进行性能测试,自行录制相应的语音材料库,录音的人数为38人,其中男19人,女19人。经测试表明,在正常环境下.该设计的说话人系统识别率可达到95%以上。  相似文献   

19.
提出在与文本无关说话人确认中采用模型间马氏(Mahalanobis)距离的夹角作为测试算法,在混合高斯模型(Gaussian ixture Model)的情况下,采用这种算法在保持识别率与传统的对数似然度算法相近的前提下,可以大大降低运算量,对于说话人确认或识别的实时实现有很大的帮助.另外,推荐的算法与传统的对数似然度算法的结果可以融合,可以将说话人确认的等错误率降低12~15%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号