首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 92 毫秒
1.
基于语音识别置信度的英语语言学习算法研究   总被引:2,自引:0,他引:2  
语音识别技术是实现一个语音学习系统的关键。由于目前的英语学习软件并不能完全满足用户的要求,因此该文提出了将语音识别置信度引入语言学习的方法。在讨论了置信度的基本原理和在语言学习中的作用之后,提出了一种新的算法并在此算法基础上最终建立了一个基于置信度技术的英语语言学习系统。在TIMIT语音库中的实验结果表明,语音识别置信度可以有效地提高语言学习系统的性能;当门限值设置于-0.7和-1.0之间,虚警率(false alarm)在1.1%左右,漏报率(false rejection)在0.65%左右,并且在一定条件下可以有效地反映学习者发音的质量,基本上可以达到实用的要求。  相似文献   

2.
基于环境特征的语音识别置信度研究   总被引:2,自引:0,他引:2  
传统的语音识别置信度方法基于各种静态特征进行分类判决,而忽略了词与周围环境之间的关系所携带的信息。为了进一步提高置信度特征的分类性能,该文提出了上下文环境、动态环境、句全局环境共3类5种环境特征,从空间与时间角度较全面地描述了词与环境之间的关系。实验结果表明:静态特征与环境特征联合分类的性能与只用静态特征相比有不同程度的提高,其中,静态环境与环境特征的二元联合最高有5.02%的相对改进,三元联合最高有6.11%的相对改进,说明环境特征确实是一种有价值的置信度特征,并且这几类环境特征之间存在一定的独立性。  相似文献   

3.
通过对汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立HMM模型,实现对非特定人命令词的识别.该方法在识别阶段将置信度评估和不完全匹配的方法结合起来,在一定程度上提高了识别的质量.经实验证明了该算法的有效性.  相似文献   

4.
讨论了语音识别中使用支持向量机(support vector machines,SVM)对音子级置信度进行综合的方法. 音子级置信度得分采用传统的方法计算而得,并使用SVM对音子级置信度进行综合得到词级的置信度得分. 在说话人无关的汉语孤立词识别实验中,使用作者方法比使用传统方法获得的系统等错误率rEER(equal error rates,EER)有明显降低,可以从基线系统的28.14%降低到23.71%,而系统的复杂度仅有小幅度的上升.  相似文献   

5.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

6.
通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围.  相似文献   

7.
提出了一种基于双权值神经网络的非特定人连续语音识别的新算法.这种算法可以不经过端点检测和分割,构建连续语音中各不同音节的特征空间覆盖区,可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果.  相似文献   

8.
语音识别技术研究进展   总被引:2,自引:0,他引:2  
柳春 《甘肃科技》2008,24(9):41-43
文章回顾了语音识别技术的发展历史,综述了语音识别系统的分类、结构及研究的基本方法,并探讨了今后语音识别面临的问题及发展方向。  相似文献   

9.
针对当前汉语病理语音评估工具匮乏的局面,本文开发了一套基于非专家评测者主观评测的病理语音规模主观评测系统(speech subjective evaluation system training model,SSEST),利用该系统对语前聋儿、健听儿童的语音数据开展评测并提取了主观评测参数各发音人全部元音发音数据评分均...  相似文献   

10.
基于非特定发音人拉祜语孤立词语音识别研究   总被引:1,自引:2,他引:1  
选用200个拉祜语常用词,以词为识别单元,利用语音识别工具箱HTK开展非特定人拉祜语孤立词的语音识别研究.研究发现:特定发音人的识别率比较稳定,针对非特定发音孤立词,通过增加模型的混合高斯数目,其识别率得到显著提高,使得识别正确率保持在99%以内,为拉祜语孤立词识别提供了有效方法.  相似文献   

11.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

12.
本文简要地分析了当前呼叫中心中传统IVR系统存在的问题,介绍了语音识别技术在呼叫中心的作用,阐述了利用Asterisk的拨号方案和AGI接口开发语音识别功能的原理,最后给出了在AGI程序中调用语音识别引擎实现呼入用户语音信息识别的过程.  相似文献   

13.
一种改进的混合型语音识别方法   总被引:1,自引:1,他引:1  
提出了一种改进的HMM语音识别方法,其主要特点是引入了加权函数算法,以减少系统的误识率,实验结果表明,这种识别方法不仅能提高系统的识别率,而且所需训练样本少。  相似文献   

14.
介绍了一个实时语音识别系统的设计与实现。该系统硬件以TI生产的TMS320C5409 DSP为核心,配置编解码器、外部存储器和逻辑控制电路等。软件算法采用了由能量和过零率相结合的端点检测、Mel频率倒谱系数特征提取和径向基函数神经网络构成的语音识别算法。对汉语数字孤立词进行了实时识别实验,识别结果通过异步通信串口送到PC上实时显示。实验结果证明了系统的有效性。  相似文献   

15.
基于语音识别的说话人身份辨识系统   总被引:2,自引:0,他引:2  
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间.  相似文献   

16.
针对传统视频监控系统中存在的不足,提出了一种将语音识别技术作为辅助的监控手段,构建具有主动预警、监控画面智能切换等功能的视频监控系统的设计方法;使用倒谱平均减(CMS)的方法抑制了传输设备不同带来的信道畸变对语音识别的影响;使用模型合并重估的方法解决了训练样本数据更新导致的所有数据重新训练的问题。仿真测试表明该系统预警准确、切换智能,对市场上传统视频监控系统的改进具有一定的指导作用。  相似文献   

17.
在实际应用中,噪声干扰导致语音识别性能急剧下降。针对该问题,本文分析传统方法并提出相应的系统解决方案:采用小波变换对语音信号进行前端处理,以MFCC声道特征结合基频(F0)韵律特征来提高识别系统的鲁棒性。实验结果表明:小波变换能有效地消除噪声影响,经小波降噪处理后,使得F0-MFCC联合模型能更好的识别语音。可以看出在噪声环境下系统的综合性能得到很大改善。  相似文献   

18.
为了克服传统核判别方法将样本唯一归属于某一类的不足,基于模糊集理论对传统的核判别分析方法进行改进,引入了模糊类别隶属度并详细分析了基于模糊核判别分析的语音情感识别。识别实验中采用VQ方法进行了特征参数的融合,根据实验结果对模糊核判别分析和核判别分析的性能进行了比较和分析。  相似文献   

19.
基于Speech SDK的语音应用程序实现   总被引:6,自引:0,他引:6  
利用Microsoft Speech SDK的API for Text-to-Speech和API for Speech Recognition,采用Visual Basic 6.0语言,建立文本语音转换应用程序和实现语音识别程序,简单地实现了语音识别的功能,识别出来的内容即可保存为文件,也可作为命令使用,让计算机执行某项操作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号