首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 8 毫秒
1.
张毅  汪培培  罗元 《信息与控制》2016,45(3):355-360
针对语音识别系统受噪声干扰识别率急剧下降的问题,通过分析传统的鲁棒语音特征提取方法在语音信号谱估计方面的不足,提出一种在不同信噪比下都具有较好鲁棒性和识别性能的语音特征提取算法.该算法结合多信号分类法(MUSIC)和最小模法(minimum-norm method,MNM)来进行谱估计.接着在移动机器人平台上进行验证实验,结果表明:该算法能有效的提高语音识别率,增强语音识别鲁棒性能.  相似文献   

2.
提出一种用于语音识别的鲁棒特征提取算法。该算法基于子带主频率信息,实现子带主频率信息与子带能量信息相结合,在特征参数中保留语谱中子带峰值位置信息。使用该算法设计抗噪孤立词语音识别系统,分别在白高斯噪声和背景语音噪声环境下,与传统特征算法做多种信噪比对比实验。试验结果表明该特征算法在2种噪声环境下的识别率有不同程度提高,具有良好的噪声鲁棒性。  相似文献   

3.
稳健语音识别技术研究   总被引:4,自引:0,他引:4  
文章在简单叙述稳健语音识别技术产生的背景后,着重介绍了现阶段国内外有关稳健语音识别的主要技术、研究现状及未来发展方向。首先简述了引起语音质量恶化、影响语音识别系统稳健性的干扰源。然后介绍了抗噪语音特征的提取、声学预处理、麦克风阵列及基于人耳的听觉处理等技术路线及发展现状。最后讨论了稳健语音识别技术未来的发展方向。  相似文献   

4.
一种基于MVDR和CCBC的抗噪语音识别方法   总被引:1,自引:0,他引:1  
提出了一种适用于抗噪声语音识别的方法,其特征提取过程基于最小方差无失真响应(Minimum variance distortionles sresponse,MVDR)谱估计方法,并对该特征进行频率弯折以提高其知觉分辨率,最后使用基于正则相关分析的谱变换补偿(Canonical correlation based on compensation,CCBC)法对该特征进行自适应处理,从而提高了系统的鲁棒性。在展览馆噪声、人群噪声和汽车噪声下,与基于传统Mel倒谱系数(MFCC)特征的系统进行了对比实验,结果表明使用本文方法的语音识别系统的识别率得到了显著的提高。  相似文献   

5.
针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。  相似文献   

6.
语音识别特征参数选择方法研究   总被引:11,自引:0,他引:11  
语音识别系统的性能与识别器所用的特征参数密切相关,用正交实验设计进行特征参数选择,提出一种系统性的实用的特征参数选择方法.研究了特征参数排列顺序对识别系统最终识别率的影响,讨论了这种特征参数选择方法的可扩展性.与目前常用识别器相比,新方法的词错误率下降了37%.实验结果表明,正交实验设计用于特征参数选择是有效的,特征参数排列顺序对识别率的影响可以忽略.  相似文献   

7.
特征提取是说话人识别系统中最关键的一个步骤.特征提取通俗的来说是提取代表说话人个性的语音特征.直接关乎识别系统的准确率.通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点.文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近入耳的听觉特性.Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强.文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布.得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响.其参数性能优于LPC参数.  相似文献   

8.
一种基于调制谱特征的带噪语音识别方法   总被引:1,自引:0,他引:1  
在语音识别过程中,提取语音特征参数是重要的步骤之一。为了提高整个识别系统的性能,要求所选语音参数应具有较好的鲁棒性。文章在时频分析理论基础上,设计了一种基于语音调制谱的特征参数。这种参数利用了语音调制谱的时频集聚性并通过对语音调制谱作适当的滤波及归一化处理以削弱其对加性噪声和通道失真等干扰的敏感性。实验结果表明,该参数在提高语音识别系统的的抗噪性方面有明显的贡献。  相似文献   

9.
基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现.针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法.该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变.这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法.  相似文献   

10.
语音识别领域的发展日新月异.同时,现有的研究结果表明声学特性集中存在较多的互补信息.本文提出了一种基于轨迹的空间-时间谱特语音情感识别方法.其核心思想是从语音频谱图中获得空间和时间上的描述符,进行分类和维度情感识别.本方法采用了穷举特征提取的实验表明:与MFCCs和基频等特征提取方法相比,提出的方法在噪声条件下,更具鲁棒性.通过在4类情感识别实验中获得了可比较的非加权平均回馈,得到了较为准确的结果,语音激活检测方面也具有显著的改进.  相似文献   

11.
研究了情绪的维度空间模型与语音声学特征之间的关系以及语音情感的自动识别方法。介绍了基本情绪的维度空间模型,提取了唤醒度和效价度对应的情感特征,采用全局统计特征减小文本差异对情感特征的影响。研究了生气、高兴、悲伤和平静等情感状态的识别,使用高斯混合模型进行4种基本情感的建模,通过实验设定了高斯混合模型的最佳混合度,从而较好地拟合了4种情感在特征空间中的概率分布。实验结果显示,选取的语音特征适合于基本情感类别的识别,高斯混合模型对情感的建模起到了较好的效果,并且验证了二维情绪空间中,效价维度上的情感特征对语音情感识别的重要作用。  相似文献   

12.
用于图象识别的图象代数特征抽取   总被引:33,自引:0,他引:33  
本文证明了图象的奇异值特征具有一系列代数和几何上的不变性以及对噪音的不敏感性,它是识别图象的有效特征.本文将奇异值特征用于人象识别问题.根据图象奇异值特征向量样本建立了Sammon最佳鉴别平面上的正态模式Bayes分类模型.实验结果表明,奇异值特征向量具有良好的鉴别分离能力.  相似文献   

13.
基于子带信息的鲁棒语音特征提取框架   总被引:2,自引:1,他引:2  
本文提出一种鲁棒语音特征提取框架。通过使用一种基于子带能量分布的噪声估计方法,无需静音段,就可以估计出带噪语音的子带噪声,同时提出结合谱减和谱加权方法对特征进行处理,最终生成具有较高鲁棒性的特征。 实验证明,在语音识别系统中,这种特征可以有效提高语音识别的鲁棒性,在噪声较强(信噪比0dB到15dB)的情况下,识别率可以提高20%以上;并且,在干净语音的情况下又能保证识别率没有大的下降;同时,这种特征上的处理方法对各种噪声的适应能力都很强,无需对噪声进行预先分类即可得到很好的抗噪效果。  相似文献   

14.
目前,自动语音识别系统往往会因为环境中复杂因素的影响,造成训练环境和测试环境存在不匹配现象,使得识别系统性能大幅度下降,极大地限制了语音识别技术的应用范围。近年来,很多鲁棒语音识别技术成功地被提出,这些技术的目标都是相同的,主要是提高系统的鲁棒性,进而提高识别率。其中,基于特征的归一化技术简单而有效,常常被作为鲁棒语音识别的首选方法,它主要是通过对特征向量的统计属性、累积密度函数或功率谱的归一化来补偿环境不匹配产生的影响。该文主要对目前主流的归一化方法进行介绍,其中包括倒谱矩归一化方法、直方图均衡化方法以及调频谱归一化方法等。  相似文献   

15.
本文设计了一个基于VC的语音识别软件,其主要功能有语音信号的录制、预处理及识别语音。通过实验表明,系统能够达到简单识别语音的要求。  相似文献   

16.
为获得高品质的虹膜纹理特征,针对小波变换方向选择性差的局限和虹膜图像纹理丰富的特点,本文提出了一种基于轮廓波(Contourlet)变换的虹膜特征提取方法.首先对预处理后的虹膜图像进行Contourlet分解,然后根据高低频子带所表征的信息,采用不同特征提取策略,提取其低频分量的均值及标准差和不同尺度、不同方向上高频子...  相似文献   

17.
王东  朱小燕  刘盈 《软件学报》2003,14(9):1523-1529
语音识别领域已经取得了稳步发展并出现了众多实用系统,但众所周知,今天的识别技术还远没有达到要求,而"鲁棒性"问题是系统性能提高的一个主要障碍.集中讨论了一种对抗语音识别系统脆弱性的通行方法--信道正规化技术,提出了一种新的正规化策略--多层信道正规化MLCN(multi-layer channel normalization)新的算法应用递归补偿算法,在频谱域和倒谱域两层上进行正规化,降低噪音和去除信道畸变,从而为后续识别过程提供更鲁棒的特征参数.在此基础上,探讨了一种新的语音识别特征参数的提取-频域动态倒谱系数,由于MLCN的引入,频域的动态信息被恰当地集成到最终的特征向量中.在gallina系统中的实验证明了这种新方法的有效性.  相似文献   

18.
该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在aurora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。  相似文献   

19.
针对抗噪声语音特征技术和基于MFCC特征的模型补偿技术在低信噪比时识别率不高的缺点,将抗噪声语音特征和模型补偿结合起来,提出了一种基于单边自相关序列(One—sided autocorrelation,OSA)MFCC特征的模型补偿噪声语音识别方法,以提高语音识别系统在低信噪比时的性能。对0~9十个英文数字和NOISEX92中的白噪声、F16噪声和FACTORY噪声的识别实验结果表明.本文提出的识别方法可以有效地提高OSA—MFCC识别器在噪声环境中的识别率,并且在低信噪比时其性能明显优于经过相同补偿处理的MFCC识别器。  相似文献   

20.
A new efficient code for speech signals is proposed. To represent speech signals with minimum redundancy we use independent component analysis to adapt features (basis vectors) that efficiently encode the speech signals. The learned basis vectors are sparsely distributed and localized in both time and frequency. Time-frequency analysis of basis vectors shows the property similar with the critical bandwidth of human auditory system. Our results suggest that the obtained codes of speech signals are sparse and biologically plausible.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号