期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机应用与软件》2016,(5)

语音信号是一种典型的非平稳信号。为了分析语音的非平稳特性,提出一种基于经验模态分解(EMD)与递推最小二乘算法(RLS)自适应滤波器相结合的语音信号去噪预处理器,进一步提高语音信号的信噪比和可懂度。再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。相似文献

2.

一种低信噪比下的说话人识别算法研究

茅正冲王正创龚熙《计算机应用与软件》2014,(12)

为了提高低信噪比下说话人识别系统的性能,提出一种Gammatone滤波器组与改进谱减法的语音增强相结合的说话人识别算法。将改进的谱减法作为预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对增强后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别算法中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种算法应用于说话人识别系统,系统的识别率及鲁棒性都有明显的提高。相似文献

3.

基于改进压缩感知的说话人识别抗噪算法

《计算机应用与软件》2016,(6)

压缩感知CS(compressive sensing)是一种基于信号稀疏性,有效提取信号中有用信息的方法。根据语音信号和干扰噪声在离散余弦变换域DCT(discrete cosine transform)稀疏性的不同,提出一种基于改进压缩感知的说话人识别抗噪算法。在用正交匹配追踪OMP(orthogonal matching pursuit)算法重构语音信号时设定相关度阈值和语音恢复阈值,不仅有效恢复了语音信号,而且实现了语音增强。然后通过Gammatone滤波器组,对恢复语音信号进行处理,提取特征参数GFCC。仿真实验在高斯混合模型识别系统中进行,实验结果表明,将这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。相似文献

4.

语音信号特征参数的分析和选取

《信息与电脑》2018,(5)

在与文本有关的说话人识别系统中,既需要识别说话人的身份,又需要识别语音文本的内容。语音信号特征参数的选取对系统来说至关重要。目前,在传统语音识别系统的研究中,主要采用MFCC参数作为特征参数进行识别。笔者对语音信号特征参数进行分析,对不同的语音特征参数组合进行实验。实验结果证明,在该系统中,MFCC参数与基音参数的组合提高了系统的识别率。相似文献

5.

基于CFCC和相位信息的鲁棒性说话人辨识

下载免费PDF全文

李作强高勇《计算机工程与应用》2015,51(17):228-232

传统的说话人识别中,人们往往认为人耳对相位信息不敏感而忽略了相位信息对语音识别的影响。为了验证相位信息对说话人识别的影响,提出了一种提取相位特征参数的方法。分别在纯净语音和带噪语音条件下,基于高斯混合模型,通过将相位特征参数与耳蜗倒谱系数（CFCC）相结合,研究了相位信息对说话人辨识性能的影响。实验结果标明：相位信息在说话人识别中也有着重要的作用,将其应用于说话人辨识系统,可明显提高系统的识别率和鲁棒性。相似文献

6.

文本无关的说话人识别系统抗噪方法研究

叶蕾方鹏《计算机与现代化》2010,(10):16-19

研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。相似文献

7.

一种多适应性的压缩感知声纹识别系统

茅正冲龚熙《计算机应用研究》2016,33(2)

针对传统压缩感知(compressive sensing,CS)语音增强方法抗噪类型单一的问题,本文提出了一种多适应性的压缩感知声纹识别系统。在用正交匹配追踪(orthogonal matching pursuit,OMP)算法重构语音信号时设定相关度阈值和语音恢复阈值,并对迭代算法进行改进,不仅有效恢复了纯净语音信号,实现了语音增强,并且减少了重构的计算量。将重构恢复的信号通过Gammatone滤波器组,提取特征参数GFCC,然后在高斯混合模型中识别。实验结果表明,将这种方法应用于声纹识别系统,系统的识别率及鲁棒性都有明显提高。相似文献

8.

语音识别系统的抗噪前端处理及性能分析

王文为蒋保臣《计算机应用》2007,27(B06):138-139

对语音识别系统中信号的抗噪前端处理方法进行了研究。将线性预测（LP）分析与形态滤波结合作为语音识别的前端处理方法，并选用具有抗噪性的MFCC特征参数。将上述方法应用于基于隐马尔可夫模型（HMM）的孤立词识别系统中，结合使用NOISEX-92提供的四种噪声进行测试，结果证明系统的抗噪性得到了提高。相似文献

9.

压缩感知的改进小波抗噪识别系统设计

茅正冲邵朱宇《传感器与微系统》2016,(8):94-97

根据小波树稀疏性的好坏自适应分配观测数目,然后由观测数目调整小波树的节点个数,使小波树中节点数目与观测数目不匹配的问题得以解决.将预处理后的语音信号经改进小波去噪,进而通过Gammatone滤波器组,提取特征参数GFCC.在高斯混合模型下仿真实验进行.结果表明:该方法与传统非稀疏性适应观测的小波去噪方法相比信噪比提高了14％,有效削弱了语音信号中噪声的影响,且系统的识别率与鲁棒性都有明显提高. 相似文献

10.

基于支持向量机的说话人识别研究

张振领徐东平贾仰理《数字社区&智能家居》2007,2(7):255

解决说话人识别问题具有重要的理论价值和深远的实用意义,本文在研究支持向量机理论的基础上,采用支持向量机的分类算法实现说话人识别系统的训练和测试,并将小波去噪技术应用于说话人识别的预处理过程中,改善进入说话人识别系统的语音质量。实验表明,在说话人识别系统中,支持向量机结合小波去噪可以获得较好的识别率。相似文献

11.

一种基于子带处理的PAC说话人识别方法研究 总被引：1，自引：1，他引：0

陈迪何静媛李战明《计算机仿真》2008,25(3):306-309

目前,说话人识别系统对于干净语音已经达到较高的性能,但在噪声环境中,系统的性能急剧下降.一种基于子带处理的以相位自相关(PAC)系数及其能量作为特征的说话人识别方法,即宽带语音信号经Mel滤波器组后变为多个子带信号,对各个子带数据经DCT变换后提取PAC系数作为特征参数,然后对每个子带分别建立HMM模型进行识别,最后在识别概率层中将HMM得出的结果相结合之后得到最终的识别结果.实验表明,该方法在不同信噪比噪声和无噪声情况下的识别性能都有很大提高. 相似文献

12.

小波语音增强算法在说话人识别中的应用

王娜郑德忠刘海龙《控制工程》2007,14(5):495-498

干净语音环境下识别率很高的说话人识别系统，在有噪声语音环境下识别性能显著降低。针对这一问题，将小波语音增强算法应用于说话人识别系统，提出一种结点阈值去噪新方法。语音增强主要目的是从带噪语音中尽可能地提取纯净的原始语音。在不同信噪比条件下进行实验，结果表明，提出的方法比传统的阈值法能更好地提高语音质量。相似文献

13.

说话人识别中测试时长与识别率关系研究

孙林慧叶蕾杨震《计算机仿真》2005,22(5):231-234

测试时长是影响说话人识别问题的主要因素之一。该文主要对分布式语音识别中测试时长与说话人识别率的关系进行了研究。文中采用文本无关的训练模板,首先对基本的说话人辨认系统用干净语音和带噪语音进行了测试,结果表明系统识别率随测试时长的增加而提高,并在实验室条件下获得加噪语音最佳测试时长。其次为了减小最佳测试时长采用改进的说话人辨认系统,先对说话人的性别进行分类然后再对其身份进行识别,不仅减少了测试所需的最佳时长,而且提高了系统的抗噪性能。最后对仿真结果进行了分析。相似文献

14.

混合语音识别模型的设计与仿真研究

宋志章马丽刘省非李奇楠《计算机仿真》2012,29(5):152-155

研究语音识别率问题,语音信号是一种非平稳信号,含有大量噪声信息,目前大多数识别算法线性理论,难以正确识别语音信号非线性变化过程,识别正确率低。通过将隐马尔可夫模型(HMM)和SVM相结合组成一个混合抗噪语音识别模型(HMM-SVM)。同时用HMM模型对语音信号时序进行建模,并得到待识别语音信号的输出概率,然后将输出概率作为SVM的输入进行学习,得到语音分类信息,最后通过利用HMM-SVM识别结果做出正确识别决策。仿真结果表明,HMM-SVM提高语音识别正确率,尤其在低信噪比环境下,明显改善了语音识别系统的性能。相似文献

15.

基于GMM的说话人识别技术研究

下载免费PDF全文

曹洁潘鹏《计算机工程与应用》2011,47(11):114-117

为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。相似文献

16.

基于MAP+CMLLR的说话人识别中发声力度问题

黄文娜彭亚雄贺松《计算机应用》2017,37(3):906-910

为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率（MAP）和约束最大似然线性回归（CMLLR）相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率（EER）明显降低,与基线系统、最大后验概率（MAP）自适应方法、最大似然线性回归（MLLR）模型投影方法和约束最大似然线性回归（CMLLR）特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。相似文献

17.

Using geometric spectral subtraction approach for feature extraction for DSR front-end Arabic system

Zied Sakka Elhem Techini MedSalim Bouhlel 《International Journal of Speech Technology》2017,20(3):645-650

Noise robustness and Arabic language are still considered as the main challenges for speech recognition over mobile environments. This paper contributed to these trends by proposing a new robust Distributed Speech Recognition (DSR) system for Arabic language. A speech enhancement algorithm was applied to the noisy speech as a robust front-end pre-processing stage to improve the recognition performance. While an isolated Arabic word engine was designed, and developed using HMM Model to perform the recognition process at the back-end. To test the engine, several conditions including clean, noisy and enhanced noisy speech were investigated together with speaker dependent and speaker independent tasks. With the experiments carried out on noisy database, multi-condition training outperforms the clean training mode in all noise types in terms of recognition rate. The results also indicate that using the enhancement method increases the DSR accuracy of our system under severe noisy conditions especially at low SNR down to 10 dB. 相似文献

18.

基于DWT-TEO的说话人识别 总被引：4，自引：0，他引：4

邱政权尹俊勋薛丽萍《自动化学报》2006,32(5):753-759

针对在噪声环境下的说话人识别系统,做了两点改进．第一,为了提高系统的鲁棒性,通过不同尺度的小波基,把含有噪声的信号分解于不同频段中,然后在各个频段分别通过TEO(Teager能量算子)去噪．针对说话人识别的特点,在小波重构时对各小波系数进行了加权处理．再把各个频段的输出通过小波重构恢复信号．最后通过Mel滤波器组把小波系数转换成MFCC．第二,为了进一步提高识别性能和训练速度,在识别阶段采用了改进的OGMM(正交高斯混合模型),即把正交变换改到EM算法之前进行,这样就不必要在EM迭代过程中每次都进行正交运算了．从实验得出,采用本文提出的DWT-TEO参数对于说话人识别的效果较好．采用改进的OGMM进一步提高了识别性能和训练速度．相似文献