共查询到18条相似文献,搜索用时 140 毫秒
1.
将语音识别技术应用于拨号系统,在嵌入式平台上实现了一款针对非特定人的数字语音拨号系统。语音识别算法中选择梅尔频率倒谱系数为特征参数,连续隐马尔科夫模型。为训练和识别过程模型,利用Qt界面对识别过程进行控制,系统针对非特定人数字语音识别进行实验。结果表明,系统针对非特定人识别率达到了98%,识别时间为3.55S。识别率和实时性都满足语音拨号的需求。 相似文献
2.
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型,证明了这种模型的状态转移概率表示与状态段长表示的等效性,并在此基础上提出了基于段长分布的HMM模型(DDBHMM).非特定人连续语音实验结果表明,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高(误识率降低了17.8%),展示了DDBHMM的良好的性能,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间. 相似文献
3.
4.
5.
6.
本文对神经网络法语音识别中的网络结构、特征提取以及学习算法进行了初步的研究.文中提出了一种带非均匀窗形式的金字塔状多层神经网络模型I研究了两种特征提取方法的向量规整问题,改进了Polak—Rjbiere学习算法并证明它能够保证连结权向量不收敛到非稳定局部极小点.特定人方式的试验表明,用神经网络方法识别五个元音和十个数字时,识别率都高于99.0%.用遍布25个省市的90个说话者的数字话音所进行的非特定人方式试验表明;加窗后识别率可以提高1.0%,达到90.3%,说明带预处理窗的模型更加适合于语音识别. 相似文献
7.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。 相似文献
8.
9.
10.
语音识别是人机交互的一种重要技术手段。根据实际需要和应用场合的不同,语音识别可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别。语音识别追求的主要指标为高识别率、实时性和大词汇量. 相似文献
11.
噪声环境下说话人识别的组合特征提取方法 总被引:1,自引:0,他引:1
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。 相似文献
12.
基于小波变换的鲁棒型特征提取及说话人识别 总被引:4,自引:0,他引:4
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。 相似文献
13.
Speaker adaptation techniques are generally used to reduce speaker differences in speech recognition. In this work, we focus on the features fitted to a linear regression‐based speaker adaptation. These are obtained by feature transformation based on independent component analysis (ICA), and the feature transformation matrices are estimated from the training data and adaptation data. Since the adaptation data is not sufficient to reliably estimate the ICA‐based feature transformation matrix, it is necessary to adjust the ICA‐based feature transformation matrix estimated from a new speaker utterance. To cope with this problem, we propose a smoothing method through a linear interpolation between the speaker‐independent (SI) feature transformation matrix and the speaker‐dependent (SD) feature transformation matrix. From our experiments, we observed that the proposed method is more effective in the mismatched case. In the mismatched case, the adaptation performance is improved because the smoothed feature transformation matrix makes speaker adaptation using noisy speech more robust. 相似文献
14.
本文给出了一个高性能汉语数码串非特定人连续语音识别系统,其声学模型基于Mel倒谱系数和连续HMM,识别时采用多候选帧同步搜索算法,并采用了MCE算法进行训练以提高系统的区分能力,实验证明该系统的识别率为94.8%(不定长数字串)和96.8%(定长数字串).为增强系统的实用性,本文还研究了基于MAP算法的说话人自适应算法和基于置信度的拒识算法.在进行自适应后,误识率可相对下降40%以上,在拒绝掉5%的正确语音时,系统识别率可以上升到96.9%(不定长数字串)和98.7%(定长数字串). 相似文献
15.
16.
An automatic speaker verification system is investigated as a means of reinforcing speech recognition security. The system's implementation is independent of speaker population size. Given clean speech and a five digit code, 91.3% of impostor attempts at breaching security are thwarted. The corresponding figure for coded speech is 88.2% 相似文献
17.
介绍一个抗噪声,脱离计算机的实时话音识别系统,由于该系统具有使用者自行训练功能,因此能够在不认人的情况下达到很高的识别率,该系统采用了先进的智能算法,并以高速数字信号处理器(DSP)为核心部件研制而成,不但可以用于电话机进行话音拨号,还可用于其它设备作为声控装置投入实际应用。 相似文献
18.
针对说话人识别进行的加权小波去噪方法 总被引:1,自引:1,他引:0
采用改进的小波去噪方法对含噪语音进行了前端处理,并针对说话人识别的特点,在小波重构之前对各小波系数进行加权处理;识别过程采用GMM识别算法。实验结果显示,相比纯粹使用MFCC作为识别特征的说话人识别提出的方法对于含噪说话人识别有明显的优越性。该方法对实时说话人识别有很好的指导作用。 相似文献