首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 687 毫秒
1.
为了提高噪声环境下说话人识别系统的识别性能,将基于听觉掩蔽效应的语音增强技术作为预处理器,对语音信号首先进行降噪处理,提高输入信号的信噪比。实验证明,经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。  相似文献   

2.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。  相似文献   

3.
计算机语音信号处理与语音识别系统   总被引:5,自引:0,他引:5  
对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达98.6%,说话人识别率  相似文献   

4.
大多数实际应用环境中总是存在各种各样的噪声,由于训练环境与识别环境不匹配,现有的绝大多数说话人识别系统在噪声环境中的性能都不可避免的急剧下降。为了让说话人识别系统在强噪声环境中,有较好的识别效果.研究一个将语音增强器和说话人识别系统级连起来的系统,该系统中将语音增强作为前端处理来提高输入的信噪比。实验证明,该系统具有很好的抗噪声性能。  相似文献   

5.
随着人工智能时代的到来,语音信号处理已经成为热门的研究方向之一。基于并行化的说话人识别方法,利用拾音器阵列采集多路语音信号,传输到嵌入式GPU系统,在嵌入式GPU系统内依次进行预处理、并行化特征提取和特征匹配并把输出结果进行显示。针对现在大数据量的语音信号进行处理,对说话人识别算法进行了并行化改进,优化了语音信号处理等过程,提高说话人识别系统的效率和准确率,增强了说话人识别系统的鲁棒性。  相似文献   

6.
基于小波变换的鲁棒型特征提取及说话人识别   总被引:4,自引:0,他引:4  
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。  相似文献   

7.
基于多频带谱减法的抗噪声语音识别研究   总被引:1,自引:0,他引:1  
为了减少在噪声环境下测试条件与训练条件不匹配导致的语音识别性能下降,提出了一种结合多频带谱减法的抗噪声语音识别系统。首先提取带噪语音的前几帧作为估计的噪声信号,将带噪语音、估计的噪声信号按频率划分M个互不相交的频带,然后根据每个频带内带噪语音与估计的噪声信号的性噪比,来确定该频带噪声的谱减参数。语音增强作为前端处理,与语音识别器级连构成抗噪声语音识别系统。通过实验仿真表明,基于多频带谱减法的抗噪声语音识别系统在不同信噪比不同类型的噪声下,识别性能明显优于基本谱减法。  相似文献   

8.
为了提高说话人识别系统的性能,提出基于改进语谱图的深度学习说话人识别算法。语谱图当中包含了语音的内容、情绪、语种以及说话人身份等多种信息,在以往的说话人识别算法中,往往没有考虑到说话人身份特性,采用直接提取语音中的语谱图作为网络输入,而说话人识别系统中需要提取语谱图中表征身份的信息,因此需要在原始语谱图的基础上进行改进。在语谱图中,基音频率以及共振峰等信息最能表现说话人的身份特征,从而提出根据语音信号中每一帧的基音频率进行自适应梳状滤波,得到改进后的语谱图,再通过卷积神经网络提取说话人特征,从而达到提升识别准确率的效果。网络模型采用MobileNetv2神经网络,该网络模型具有模型参数少、收敛速度快、识别速度快等优点,有利于实际应用。在对照实验结果中,该方法相对于原始语谱图的准确率分别提高了2.3%、5.2%、3%。  相似文献   

9.
檀蕊莲 《信息技术》2010,34(8):103-104
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

10.
噪声环境下说话人识别的组合特征提取方法   总被引:1,自引:0,他引:1  
芮贤义  俞一彪 《信号处理》2006,22(5):673-677
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。  相似文献   

11.
根据人耳的听觉感知特性,提出了一种基于子带滤波的优化语音增强方法。基于临界频带设计滤波器将输入信号分成若干子带,依据估计出的每个子带的短时信噪比来对相应子带的时域信号逐帧进行独立的自适应处理后再合成。语音增强性能评估结果表明,有效地去除背景噪声的同时还抑制了音乐噪声,减少了语音的听觉失真,提高了增强语音的可懂度。  相似文献   

12.
全刚  肖熙 《电声技术》2010,34(6):45-47
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。  相似文献   

13.
基于EMD和改进双门限法的语音端点检测   总被引:3,自引:0,他引:3  
语音端点检测的准确与否直接影响到语音识别系统的计算复杂度和识别能力,在基于短时能量和过零率的端点检测算法中,能量计算方法不尽合理而且在低信噪比下检测效果大大降低。对此提出了一种基于经验模式分解和改进双门限法的语音端点检测算法,仿真结果表明在低信噪比情况下本文算法有更好的端点检测能力,显示了算法的优越性。  相似文献   

14.
一种新的自适应语音增强系统   总被引:4,自引:0,他引:4  
针对自适应噪声对消(ANC)语音增强系统的性能高度依赖于参考信号的质量,任何原始语音信号泄漏到参考信号中,都会导致原始语音信号失真和噪声抵消性能恶化这一问题,本文提出一种对泄漏不敏感的附加随机噪声(ARN)自适应噪声对消语音增强系统。它通过在参考信号中加入一个低功率的宽带随机训练信号,然后用该训练信号作参考信号对噪声传输函数(NTF)进行自适应建模,并在使用自适应预测滤波器(APF)消除NTF自适应建模的语音信号干扰的同时,用补偿滤波器(CPF)来修正由APF引起的参考信号失真。计算机仿真表明,这种ARNANC语音增强系统在泄漏情况下能将原始语音信号从带噪语音信号中有效分离出来。  相似文献   

15.
张佩  夏秀渝  胡连锋  李志昌 《通信技术》2009,42(11):160-162
基于麦克风阵列的声源定位技术可以广泛应用于音视频会议、说话人跟踪与识别以及助听器等众多场合中。根据语音信号的短时平稳特性,文中提出了一种改进的基于MUSIC算法进行声源二维定位的方法。该方法按帧交叉进行声源数估计和声源方位估计,最后对多帧信号的估计值进行统计、平均得到最终的方位估计和较准确的声源数估计。仿真结果表明,这种方法能有效解决由于声源数估计不准确导致的峰值搜索时偏差较大的问题,并且具有良好的抗噪性能。  相似文献   

16.
基于加权特征值补偿的说话人识别   总被引:3,自引:0,他引:3  
于鹏  徐义芳  曹志刚 《信号处理》2002,18(6):513-517
背景噪声的存在,使得说话人识别系统的训练环境和测试环境发生失配,导致系统性能发生急剧下降。本论文提出一种加权特征值补偿算法,把由噪声引起的使带噪语音信号特征值与纯净语音特征值发生偏差的部分去除,从而使进入识别器的特征值接近纯净语音的特征值。在特征值补偿过程中引入了信噪比加权的方法。实验表明,这种方法能够有效的提高说话人识别系统的性能。  相似文献   

17.
We consider the feature recombination technique in a multiband approach to speaker identification and verification. To overcome the ineffectiveness of conventional feature recombination in broadband noisy environments, we propose a new subband feature recombination which uses subband likelihoods and a subband reliable‐feature selection technique with an adaptive noise model. In the decision step of speaker recognition, a few very low unreliable feature likelihood scores can cause a speaker recognition system to make an incorrect decision. To overcome this problem, reliable‐feature selection adjusts the likelihood scores of an unreliable feature by comparison with those of an adaptive noise model, which is estimated by the maximum a posteriori adaptation technique using noise features directly obtained from noisy test speech. To evaluate the effectiveness of the proposed methods in noisy environments, we use the TIMIT database and the NTIMIT database, which is the corresponding telephone version of TIMIT database. The proposed subband feature recombination with subband reliable‐feature selection achieves better performance than the conventional feature recombination system with reliable‐feature selection.  相似文献   

18.
噪声背景下基于多模板矢量量化的与文本无关的话者辩识   总被引:1,自引:0,他引:1  
沈春华  徐柏龄 《信号处理》2001,17(2):185-188
在话者辨识系统的实际应用中,导致系统识别率下降的根本原因是噪声的影响,它使得测试与训练条件不一致.本文针对实际环境中常见的加性背景噪声,提出了利用加入不同类型、不同信噪比噪声的含噪语音进行训练说话人的模型,每个说话人具有多个模板.实验结果表明,这种方法能够有效的提高系统的鲁棒性.文中还讨论了距离加权方法在话者辨识中的应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号