共查询到17条相似文献,搜索用时 78 毫秒
1.
基于相对自相关序列MFCC特征的丢失数据带噪语音识别方法 总被引:1,自引:0,他引:1
提出了一种基于相对自相关序列(Relative Autocorrelation Sequences,RAS)MFCC(Mel-Frequency Cepstral Coefficient)特征的丢失数据带噪语音识别新方法.首先分析了环境噪声对RAS-MFCC的影响,提出了一种基于掩盖原理的不可靠分量检测方法;然后采用丢失数据(Missing data,MD)技术来消除畸变分量对识别过程的影响.实验结果表明,本文所提的识别方法可以在不同类型和信噪比的噪声环境中有效提高RAS-MFCC的识别率,并且其性能优于典型的基于滤波器组(Filter bank)语音特征的丢失数据语音识别方法. 相似文献
2.
文章提出了一种抗噪声的语音特征。首先让语音信号的功率谱通过一组带通滤波器,再计算各滤波器输出的差分值。理论分析和实验一致证明,以此作为语音信号的特征,可以大幅度提高语音识别系统在噪声环境中的性能。 相似文献
3.
4.
杜利民 《中国自动识别技术》2007,(3):59-63
语音识别技术的基本任务是将人说话发出的声波信号转换成为一种能够表达口语消息的符号序列。关于语音识别的研究从二十世纪50年代开始到现在的半个多世纪里一直非常活跃。本文将从语音识别的方法、技术原理和发展趋势等多方面进行阐述,便于读者全面了解语音识别现阶段的技术成果和未来走势。 相似文献
5.
6.
7.
语音端点检测是语音识别系统的一个重要组成部分,特别是在噪声环境下,其准确性直接影响到语音识别系统的计算复杂度和识别性能。提出了一种在噪声环境下基于短时TEO能量的语音信号端点检测方法,采用了双门限-三态转换判决机制以保证算法在噪声环境下的端点检测准确性和对信号绝对幅度变化的稳健性。实验结果表明,与传统的短时能量法和谱熵法相比,该算法在低信噪比情况下具有更好的端点检测能力,显示了算法的优越性。 相似文献
8.
针对语音识别系统对抗环境噪声的实际需求,提出一种二次组合抗噪技术,研究并设计了一种以数字信号处理器(DSP)为硬件平台,以隐马尔可夫模型(HMM)为算法的抗噪声嵌入式语音识别系统.DSP采用型号为TMS320VC5509A的芯片,配以外围硬件电路构成语音识别系统的硬件平台.软件设计以离散隐马尔可夫模型(DHMM)为识别算法进行编程,系统软件主要有识别、训练、学习和USB四个主要模块.实验结果表明:基于二次组合去噪技术的语音识别系统有更好的抗噪声效果. 相似文献
9.
对特征参数概率分布的实验分析表明,在有噪声影响的情况下,特征参数通常呈现双峰分布.据此,本文提出了一种新的,基于双高斯的高斯混合模型(Gaussian mixture model,GMM)的特征参数归一化方法,以提高语音识别系统的鲁棒性.该方法采用更为细致的双高斯模型来表达特征参数的累积分布函数(CDF),并依据估计得到的CDF进行参数变换将训练和识别时的特征参数的分布都规整为标准高斯分布,从而提高识别正确率.在Aurora 2和Aurora 3数据库上的实验结果表明,本文提出的方法的性能明显好于传统的倒谱均值规整(Cepstral mean normalization,CMN)和倒谱均值方差规整(Cepstral mean and variance normalization,CMVN)方法,而与非参数化方法-直方图均衡特征规整方法的性能基本相当. 相似文献
10.
11.
抗噪声语音识别及语音增强算法的应用 总被引:1,自引:0,他引:1
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理,同时结合语音增强方法对特征进行处理,最后得到鲁棒语音特征。通过4种不同试验结果分析表明,将这种方法用于抗噪声分析可以提高系统的抗噪声能力;同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。 相似文献
12.
全局和时序结构特征并用的语音信号情感特征识别方法 总被引:7,自引:1,他引:6
在利用全局特征进行语音情感特征分析的基础上,提出了采用情感语句中各元音时序结构作为新的特征,并针对不同语句中包含不同元音个数的情况,提出了零补齐、分局均值补齐、前均值补齐三种不同的规整方法.以从10名话者中搜集的带有欢快、愤怒、惊奇、悲伤4种情感的1000句语句作为样本,本文对语音情感特征进行了分析.实验结果表明利用全局特征和时序特征相结合,对时序特征采用前均值补齐,同时使用修正二次判别函数(MQDF)进行情感识别能够获得94%的平均情感识别率. 相似文献
13.
基于动静态组合特征参数的语音识别 总被引:1,自引:0,他引:1
基于语音信号的时变特性,本文提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC(Mel-Frequency Cepstrum Coefficient)参数的提取方法,用小波包变换代替傅立叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC(Discrete Wavelet Packet Transform Mel-Frequency Coefficient),然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数,通过试验和仿真,此参数具有很高的识别率,是一种很好的语音特征参数.并且把混沌特性引入到神经元,构成混沌神经网络,把这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较.试验结果表明,混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率. 相似文献
14.
基于特征加权的应力影响下顽健语音识别方法 总被引:1,自引:0,他引:1
通过对应力影响下语音数据的分析,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感,相应的高维特征敏感程度差些。在此基础上,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验,最大相对熵估计方法的识别率可达到89.9% ,与多重风格训练方法相比,识别率提高了13.1%。 相似文献
15.
16.
17.