首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 561 毫秒
1.
基于电话用户交换机的语音识别系统研究   总被引:3,自引:0,他引:3  
本论文对电话用户交换机研制了一个声控语音命令交换系统,该系统能够实现与特定人无关中小词汇量连续命令语音自动识别,研究中统计了用和命令语句,生成相应识别文法网络,识别系统的训练采用由子词模型构成的复合模型进行强化训练,识别采用令牌传递式改进Viterbi算法,提高系统的识别性能,论文比较了不同语音特征参数以及隐含马尔可夫模型状态数对电话语音识别精度的影响,研究中还开发识别系统拒识系统,在无拒识情况下  相似文献   

2.
在非特定人孤立词语音识别系统中,模板库的容量成为限制识别范围和性能的重要原因,过大的模板库在成本和实时性方面都不利于语音识别系统的大规模使用。提出了一种用于大幅压缩语音识别模板库容量的方法,适用于非特定人孤立词识别系统。该算法借鉴生态学上各物种对专一环境和普通环境的适应程度上的折衷,通过类似不同生物间争夺食物的演化过程选出最具代表性的模板组成模板库。模拟结果表明,该算法通过去除近似雷同的模板以及在某些情况下用一个大模板取代数个模板,能在不显著影响识别率的前提下,明显减少所需模板库的容量。  相似文献   

3.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法.  相似文献   

4.
王维强 《电子设计工程》2012,20(12):186-189
设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。  相似文献   

5.
针对语音识别这种典型的多类分类问题,提取MFCC参数作为语音特征,采用支持向量机(SVM)作为识别算法,进行非特定人孤立词识别.在给出一种多类分类方法并分析该算法优缺点的基础上,对算法中的所有参数进行测试,选取最佳参数进行实验,识别率达到95%以上.为了满足语音识别系统对实时性和便携性的要衷,将该算法在0MAP5912嵌入式系统开发平台上进行实现,与传统的语音识别系统相比,该系统易于使用,语音识别更为快速便捷.并且具有一定的通用性.  相似文献   

6.
基于小词汇表语音识别技术的运动控制系统   总被引:1,自引:1,他引:0  
简要介绍语音识别的原理,基于TMS320LF2407系列16位DSP,设计语音端点检测算法,采用人工耳蜗模型提取语音特征参数,采用改进型动态时间弯折(DTW)算法实现语音参数模板匹配,设计能够实现小词汇表、非特定人、孤立词识别的语音识别系统。并将该语音识别系统应用到运动控制中,试验结果表明,系统正确识别率在93%,具有一定的实用价值。  相似文献   

7.
张晨燕  孙成立 《电信科学》2006,22(10):60-63
在SEED-DEC5502 DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,与传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数;对状态输出概率计算进行了分析和优化,进一步降低了计算负担.实验表明系统在100词条的情况下识别率达到98%,识别时间为1.03倍实时.  相似文献   

8.
语音识别可实现人机交互和语音控制,在工业控制、消费电子等领域都有广泛应用。结合人发音的生理结构的特点,使用LPMCC(LPC倒谱美尔变换)作为特征向量,采用动态规划算法作为核心识别算法,在TMS320VC5402芯片上实现了特定人、孤立词的高性能实时识别系统。  相似文献   

9.
李彬  贺前华  齐凡 《电子工程师》2006,32(11):44-47
介绍了一个基于32位OpenRISC1200开放源码微处理器内核的小词汇量孤立词语音识别系统结构。根据软硬件协同设计方法,研究和比较了孤立词语音识别各个环节的计算量,合理分配软硬件资源,并提出一种适合FPGA(现场可编程门阵列)实现的动态时间规正硬件实现思路,大大缩短识别响应时间。该系统在成本和知识产权方面都较市场上流行的ARM、8051等内核有优势。实验结果表明,在特定场合下,该系统对于100个词组的平均识别响应时间少于2s,特定人识别率95%以上,非特定人识别率87%以上。  相似文献   

10.
当今语音识别技术的一个重要应用就是嵌入式平台上的命令词识别系统,本文提出了一种新的组合解码和置信度的一遍解码方法,同时在算法高精度、运算低复杂度两方面做出了很大的努力,最终在PDA(Compaq iPAQ 3630)平台上实现了一个基于HMM的定点命令词语音识别系统。系统具有较强的鲁棒性和集外词拒识能力,而且系统也具有完整性、高精度、低运算复杂度,整体设计框架灵活,可以非常容易的移植到各种嵌入式平台。  相似文献   

11.
The Oregon Graduate Institute Multi-language Telephone Speech Corpus (OGI-TS) was designed specifically for language identification research. It currently consists of spontaneous and fixed-vocabulary utterances in 11 languages: English, Farsi, French, German, Hindi, Japanese, Korean, Mandarin, Spanish, Tamil, and Vietnamese. These utterances were produced by 90 native speakers in each language over real telephone lines. Language identification is related to speaker-independent speech recognition and speaker identification in several interesting ways. It is therefore not surprising that many of the recent developments in language identification can be related to developments in those two fields. We review some of the more important recent approaches to language identification against the background of successes in speaker and speech recognition. In particular, we demonstrate how approaches to language identification based on acoustic modeling and language modeling, respectively, are similar to algorithms used in speaker-independent continuous speech recognition. Thereafter, prosodic and duration-based information sources are studied. We then review an approach to language identification that draws heavily on speaker identification. Finally, the performance of some representative algorithms is reported  相似文献   

12.
Emotion recognition is one of the latest challenges in human-robot interaction. This paper describes the realization of emotional interaction for a Thinking Robot, focusing on speech emotion recognition. In general, speaker-independent systems show a lower accuracy rate compared with speaker-dependent systems, as emotional feature values depend on the speaker and their gender. However, speaker-independent systems are required for commercial applications. In this paper, a novel speaker-independent feature, the ratio of a spectral flatness measure to a spectral center (RSS), with a small variation in speakers when constructing a speaker-independent system is proposed. Gender and emotion are hierarchically classified by using the proposed feature (RSS), pitch, energy, and the mel frequency cepstral coefficients. An average recognition rate of 57.2% (plusmn 5.7%) at a 90% confidence interval is achieved with the proposed system in the speaker-independent mode.  相似文献   

13.
本文给出了一种语言辨识的新方法。通常来讲,语言辨识系统是说话人无关的,但说话人的个体特征对语言辨识系统有很大的影响,文本采用了一种粗分类精识别的思想,利用说话人聚类技术有效解决了粗分类的问题,对每类相近说话人集合建立模型,然后进行识别。实验表明,该方法对于说话人无关的语言辨识问题是有效的。  相似文献   

14.
文章提出了一种基于神经网络的二级语音音调识别方法,采用常用的多层感知器结构BP反向传播算法.对非特定人的音调进行建模及识别。通过对网络输入矢量进行均值差处理,改善了非特定识别的效率,并且加速了网络训练的进程。根据BP网络得出的一级识别结果,再以音长超音段信息作为辅助条件进行二级识别,加速了网络学习进程.提高了识别率。  相似文献   

15.
为了减少激光致声对水下目标遥感的实时性和有效性的影响,分析了激光超声诱导与光声效应原理,采用语音识别技术实现字符化编码,探讨语音信息的基频编码和控制激光发射的码型结构。搭建了实验测试系统,利用波长为1.06μm的脉冲激光进行水下超声激励,通过对水下激光声信号采集处理,完成了实验室空中平台到水下目标的实时语音控制。结果表明,非特定人的语音指令识别与编码方法有效实现了可变基频的激光超声水下目标控制。该研究为激光声水下目标遥感应用提供了一种新的技术途径。  相似文献   

16.
以使用嵌入武操作系统PocketPC的个人数字助理(PDA)为实验平台研究了基于非特定人语音命令识别的可定制声控拨号器。针对PDA存绪空问和运算能力的限制,在保证性能的前提下从严格控制搜索空间和提高解码速度出发,提出了结合搜索路径分数差值实时调整剪枝宽度的动态调整直方图剪技策略,提出了利用速查表加速似然计算的方法,并在通过实验验证舌采用较少维数的特征、结合扩展声韵母进行声学建模等措施,有效地解决了上述问题.在实际PDA设备上实验表明,在词表大小为200个人名时,识别正确率达98.70%,而识别速度比采用标准算法的参考系统提高了约80倍,同时节省了约30%搜索存储空间。  相似文献   

17.
一种适于非特定人语音识别的并行隐马尔可夫模型   总被引:2,自引:0,他引:2  
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。  相似文献   

18.
We have developed a real-time system to transform anaudio signal into several specialized representations of sound.The system uses analog circuit models of biological auditionto compute these representations. We report on a speech recognizerthat uses this system for feature extraction, and we evaluatethe performance of this speech recognition system on a speaker-independent13-word recognition task.  相似文献   

19.
The paper presents a hybrid of a hidden Markov model and a Markov chain model for speech recognition. In this hybrid, the hidden Markov model is concerned with the time-varying property of spectral features, while the Markov chain accounts for the interdependence of spectral features. The log-likelihood scores of the two models, with respect to a given utterance, are combined by a postprocessor to yield a combined log-likelihood score for word classification. Experiments on speaker-independent and multispeaker isolated English alphabet recognition show that the hybrid outperformed both the hidden Markov model and the Markov chain model in terms of recognition  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号