共查询到19条相似文献,搜索用时 561 毫秒
1.
基于电话用户交换机的语音识别系统研究 总被引:3,自引:0,他引:3
本论文对电话用户交换机研制了一个声控语音命令交换系统,该系统能够实现与特定人无关中小词汇量连续命令语音自动识别,研究中统计了用和命令语句,生成相应识别文法网络,识别系统的训练采用由子词模型构成的复合模型进行强化训练,识别采用令牌传递式改进Viterbi算法,提高系统的识别性能,论文比较了不同语音特征参数以及隐含马尔可夫模型状态数对电话语音识别精度的影响,研究中还开发识别系统拒识系统,在无拒识情况下 相似文献
2.
在非特定人孤立词语音识别系统中,模板库的容量成为限制识别范围和性能的重要原因,过大的模板库在成本和实时性方面都不利于语音识别系统的大规模使用。提出了一种用于大幅压缩语音识别模板库容量的方法,适用于非特定人孤立词识别系统。该算法借鉴生态学上各物种对专一环境和普通环境的适应程度上的折衷,通过类似不同生物间争夺食物的演化过程选出最具代表性的模板组成模板库。模拟结果表明,该算法通过去除近似雷同的模板以及在某些情况下用一个大模板取代数个模板,能在不显著影响识别率的前提下,明显减少所需模板库的容量。 相似文献
3.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法. 相似文献
4.
设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。 相似文献
5.
6.
7.
在SEED-DEC5502 DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,与传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数;对状态输出概率计算进行了分析和优化,进一步降低了计算负担.实验表明系统在100词条的情况下识别率达到98%,识别时间为1.03倍实时. 相似文献
8.
语音识别可实现人机交互和语音控制,在工业控制、消费电子等领域都有广泛应用。结合人发音的生理结构的特点,使用LPMCC(LPC倒谱美尔变换)作为特征向量,采用动态规划算法作为核心识别算法,在TMS320VC5402芯片上实现了特定人、孤立词的高性能实时识别系统。 相似文献
9.
介绍了一个基于32位OpenRISC1200开放源码微处理器内核的小词汇量孤立词语音识别系统结构。根据软硬件协同设计方法,研究和比较了孤立词语音识别各个环节的计算量,合理分配软硬件资源,并提出一种适合FPGA(现场可编程门阵列)实现的动态时间规正硬件实现思路,大大缩短识别响应时间。该系统在成本和知识产权方面都较市场上流行的ARM、8051等内核有优势。实验结果表明,在特定场合下,该系统对于100个词组的平均识别响应时间少于2s,特定人识别率95%以上,非特定人识别率87%以上。 相似文献
10.
11.
The Oregon Graduate Institute Multi-language Telephone Speech Corpus (OGI-TS) was designed specifically for language identification research. It currently consists of spontaneous and fixed-vocabulary utterances in 11 languages: English, Farsi, French, German, Hindi, Japanese, Korean, Mandarin, Spanish, Tamil, and Vietnamese. These utterances were produced by 90 native speakers in each language over real telephone lines. Language identification is related to speaker-independent speech recognition and speaker identification in several interesting ways. It is therefore not surprising that many of the recent developments in language identification can be related to developments in those two fields. We review some of the more important recent approaches to language identification against the background of successes in speaker and speech recognition. In particular, we demonstrate how approaches to language identification based on acoustic modeling and language modeling, respectively, are similar to algorithms used in speaker-independent continuous speech recognition. Thereafter, prosodic and duration-based information sources are studied. We then review an approach to language identification that draws heavily on speaker identification. Finally, the performance of some representative algorithms is reported 相似文献
12.
Eun Ho Kim Kyung Hak Hyun Soo Hyun Kim Yoon Keun Kwak 《Mechatronics, IEEE/ASME Transactions on》2009,14(3):317-325
Emotion recognition is one of the latest challenges in human-robot interaction. This paper describes the realization of emotional interaction for a Thinking Robot, focusing on speech emotion recognition. In general, speaker-independent systems show a lower accuracy rate compared with speaker-dependent systems, as emotional feature values depend on the speaker and their gender. However, speaker-independent systems are required for commercial applications. In this paper, a novel speaker-independent feature, the ratio of a spectral flatness measure to a spectral center (RSS), with a small variation in speakers when constructing a speaker-independent system is proposed. Gender and emotion are hierarchically classified by using the proposed feature (RSS), pitch, energy, and the mel frequency cepstral coefficients. An average recognition rate of 57.2% (plusmn 5.7%) at a 90% confidence interval is achieved with the proposed system in the speaker-independent mode. 相似文献
13.
14.
文章提出了一种基于神经网络的二级语音音调识别方法,采用常用的多层感知器结构BP反向传播算法.对非特定人的音调进行建模及识别。通过对网络输入矢量进行均值差处理,改善了非特定识别的效率,并且加速了网络训练的进程。根据BP网络得出的一级识别结果,再以音长超音段信息作为辅助条件进行二级识别,加速了网络学习进程.提高了识别率。 相似文献
15.
为了减少激光致声对水下目标遥感的实时性和有效性的影响,分析了激光超声诱导与光声效应原理,采用语音识别技术实现字符化编码,探讨语音信息的基频编码和控制激光发射的码型结构。搭建了实验测试系统,利用波长为1.06μm的脉冲激光进行水下超声激励,通过对水下激光声信号采集处理,完成了实验室空中平台到水下目标的实时语音控制。结果表明,非特定人的语音指令识别与编码方法有效实现了可变基频的激光超声水下目标控制。该研究为激光声水下目标遥感应用提供了一种新的技术途径。 相似文献
16.
以使用嵌入武操作系统PocketPC的个人数字助理(PDA)为实验平台研究了基于非特定人语音命令识别的可定制声控拨号器。针对PDA存绪空问和运算能力的限制,在保证性能的前提下从严格控制搜索空间和提高解码速度出发,提出了结合搜索路径分数差值实时调整剪枝宽度的动态调整直方图剪技策略,提出了利用速查表加速似然计算的方法,并在通过实验验证舌采用较少维数的特征、结合扩展声韵母进行声学建模等措施,有效地解决了上述问题.在实际PDA设备上实验表明,在词表大小为200个人名时,识别正确率达98.70%,而识别速度比采用标准算法的参考系统提高了约80倍,同时节省了约30%搜索存储空间。 相似文献
17.
一种适于非特定人语音识别的并行隐马尔可夫模型 总被引:2,自引:0,他引:2
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。 相似文献
18.
We have developed a real-time system to transform anaudio signal into several specialized representations of sound.The system uses analog circuit models of biological auditionto compute these representations. We report on a speech recognizerthat uses this system for feature extraction, and we evaluatethe performance of this speech recognition system on a speaker-independent13-word recognition task. 相似文献
19.
The paper presents a hybrid of a hidden Markov model and a Markov chain model for speech recognition. In this hybrid, the hidden Markov model is concerned with the time-varying property of spectral features, while the Markov chain accounts for the interdependence of spectral features. The log-likelihood scores of the two models, with respect to a given utterance, are combined by a postprocessor to yield a combined log-likelihood score for word classification. Experiments on speaker-independent and multispeaker isolated English alphabet recognition show that the hybrid outperformed both the hidden Markov model and the Markov chain model in terms of recognition 相似文献