首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
将语音识别技术应用于拨号系统,在嵌入式平台上实现了一款针对非特定人的数字语音拨号系统。语音识别算法中选择梅尔频率倒谱系数为特征参数,连续隐马尔科夫模型。为训练和识别过程模型,利用Qt界面对识别过程进行控制,系统针对非特定人数字语音识别进行实验。结果表明,系统针对非特定人识别率达到了98%,识别时间为3.55S。识别率和实时性都满足语音拨号的需求。  相似文献   

2.
基于段长分布的HMM语音识别模型   总被引:23,自引:0,他引:23       下载免费PDF全文
王作英  肖熙 《电子学报》2004,32(1):46-49
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型,证明了这种模型的状态转移概率表示与状态段长表示的等效性,并在此基础上提出了基于段长分布的HMM模型(DDBHMM).非特定人连续语音实验结果表明,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高(误识率降低了17.8%),展示了DDBHMM的良好的性能,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间.  相似文献   

3.
语音控制是智能化设备的重要控制手段,而语音识别是实现语音控制的关键技术。为了设计一种可靠的、抗干扰性强的产品,提出了一种基于双麦克风降噪技术的语音识别系统。该设计运用ROHM公司的BU8332KV芯片作为语音识别前端处理的核心,利用其双麦克风降噪技术来解决语音识别中的噪声问题,结合单片机和语音识别芯片,应用于按摩椅的语音控制系统中。经过非特定人的语音识别系统的静态和噪声环境下测试,结果表明在噪声环境下,该系统有较高的识别率,适用于按摩椅的应用环境,也适合在其他有环境噪声干扰的语音识别系统中推广应用。  相似文献   

4.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

5.
基于飞行器语音指令控制的应用环境,提出了一种高抗噪性的非特定人连接词语音识别方案。针对机舱噪声的频谱特性,采用了谱减法、倒谱均值归一化以及噪声模型适应技术。仿真测试表明,该方案的平均识别率在信噪比为0 dB的条件下达到92%以上。  相似文献   

6.
本文对神经网络法语音识别中的网络结构、特征提取以及学习算法进行了初步的研究.文中提出了一种带非均匀窗形式的金字塔状多层神经网络模型I研究了两种特征提取方法的向量规整问题,改进了Polak—Rjbiere学习算法并证明它能够保证连结权向量不收敛到非稳定局部极小点.特定人方式的试验表明,用神经网络方法识别五个元音和十个数字时,识别率都高于99.0%.用遍布25个省市的90个说话者的数字话音所进行的非特定人方式试验表明;加窗后识别率可以提高1.0%,达到90.3%,说明带预处理窗的模型更加适合于语音识别.  相似文献   

7.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。  相似文献   

8.
基于小词汇表语音识别技术的运动控制系统   总被引:1,自引:1,他引:0  
简要介绍语音识别的原理,基于TMS320LF2407系列16位DSP,设计语音端点检测算法,采用人工耳蜗模型提取语音特征参数,采用改进型动态时间弯折(DTW)算法实现语音参数模板匹配,设计能够实现小词汇表、非特定人、孤立词识别的语音识别系统。并将该语音识别系统应用到运动控制中,试验结果表明,系统正确识别率在93%,具有一定的实用价值。  相似文献   

9.
王磊  郝润科  赵龙  邱银  刘源 《信息技术》2013,(6):33-35,40
为了提高在汽车噪声环境中语音识别系统的识别率,并达到降低系统成本的目的,在低成本定点DSP(TMS320VC5509A)芯片工业标准的基础上,使用两路无差输入信号进行噪声抵消,建立了一种基于孤立词,小词汇量,特定人识别的语音识别系统,实验表明,在类似汽车噪声环境中,该系统的识别率可满足实用要求,且成本较低。  相似文献   

10.
语音识别是人机交互的一种重要技术手段。根据实际需要和应用场合的不同,语音识别可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别。语音识别追求的主要指标为高识别率、实时性和大词汇量.  相似文献   

11.
噪声环境下说话人识别的组合特征提取方法   总被引:1,自引:0,他引:1  
芮贤义  俞一彪 《信号处理》2006,22(5):673-677
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。  相似文献   

12.
基于小波变换的鲁棒型特征提取及说话人识别   总被引:4,自引:0,他引:4  
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。  相似文献   

13.
Speaker adaptation techniques are generally used to reduce speaker differences in speech recognition. In this work, we focus on the features fitted to a linear regression‐based speaker adaptation. These are obtained by feature transformation based on independent component analysis (ICA), and the feature transformation matrices are estimated from the training data and adaptation data. Since the adaptation data is not sufficient to reliably estimate the ICA‐based feature transformation matrix, it is necessary to adjust the ICA‐based feature transformation matrix estimated from a new speaker utterance. To cope with this problem, we propose a smoothing method through a linear interpolation between the speaker‐independent (SI) feature transformation matrix and the speaker‐dependent (SD) feature transformation matrix. From our experiments, we observed that the proposed method is more effective in the mismatched case. In the mismatched case, the adaptation performance is improved because the smoothed feature transformation matrix makes speaker adaptation using noisy speech more robust.  相似文献   

14.
高性能汉语数码串语音识别   总被引:9,自引:0,他引:9       下载免费PDF全文
李虎生  刘加  刘润生 《电子学报》2001,29(5):595-599
本文给出了一个高性能汉语数码串非特定人连续语音识别系统,其声学模型基于Mel倒谱系数和连续HMM,识别时采用多候选帧同步搜索算法,并采用了MCE算法进行训练以提高系统的区分能力,实验证明该系统的识别率为94.8%(不定长数字串)和96.8%(定长数字串).为增强系统的实用性,本文还研究了基于MAP算法的说话人自适应算法和基于置信度的拒识算法.在进行自适应后,误识率可相对下降40%以上,在拒绝掉5%的正确语音时,系统识别率可以上升到96.9%(不定长数字串)和98.7%(定长数字串).  相似文献   

15.
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

16.
Chatelain  P. 《Electronics letters》1998,34(15):1472-1473
An automatic speaker verification system is investigated as a means of reinforcing speech recognition security. The system's implementation is independent of speaker population size. Given clean speech and a five digit code, 91.3% of impostor attempts at breaching security are thwarted. The corresponding figure for coded speech is 88.2%  相似文献   

17.
周利清 《数字通信》1999,26(3):6-7,10
介绍一个抗噪声,脱离计算机的实时话音识别系统,由于该系统具有使用者自行训练功能,因此能够在不认人的情况下达到很高的识别率,该系统采用了先进的智能算法,并以高速数字信号处理器(DSP)为核心部件研制而成,不但可以用于电话机进行话音拨号,还可用于其它设备作为声控装置投入实际应用。  相似文献   

18.
针对说话人识别进行的加权小波去噪方法   总被引:1,自引:1,他引:0  
采用改进的小波去噪方法对含噪语音进行了前端处理,并针对说话人识别的特点,在小波重构之前对各小波系数进行加权处理;识别过程采用GMM识别算法。实验结果显示,相比纯粹使用MFCC作为识别特征的说话人识别提出的方法对于含噪说话人识别有明显的优越性。该方法对实时说话人识别有很好的指导作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号