首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 281 毫秒
1.
隐马尔科夫模型的对数后验概率算法是计算机辅助语言学习系统中用来衡量考生发音质量的重要指标。但在普通话智能测试系统中,传统的后验概率算法与专家评分之间存在比较明显的差距。文章从普通话语音评价的主观标准出发,将普通话发音的语言学知识引入后验概率算法,重构算法的语音识别网络,同时从音素评分模型角度对现有的发音质量评价算法进行改进。  相似文献   

2.
结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。  相似文献   

3.
将语音合成领域中研究的可视语音技术应用于康复工程之中,设计了一个基于三维视觉的语音库系统。提出了基于三维语音库的语音辅助系统应用于聋儿语言发音训练的新方法,通过直观的视觉反馈对聋而不哑的听障儿童进行发音训练,从而改善他们的发音质量。提出该方法的框架结构,系统能够培养聋儿语感及自主学习语言的意识,使其具有一定的说话能力,为其今后的知识学习和参与社会活动奠定基础。  相似文献   

4.
流利度评分是目前计算机辅助自动发音评分系统中一个重要组成部分。为了解决流利度特征表述中和内容、韵律等高级表述技巧相关的广义流利问题,该文提出了一种能够全面客观地评价口语流利度通顺性和韵律性的评分方法。该方法除了通顺性之外,可以提取停顿、韵律、连读和失去爆破等特征;评分过程中,系统采用多层次融合方法,分别从句子级和篇章级提取流利度特征,其中篇章级得分由句子级加权得分和篇章级特征进行融合得到。在实验中,分别以机器得分和人工平均分的相关度、均方差等指标比较了多元线性回归(LR)、BP神经网络、支持向量回归机(SVR)3种算法的性能。结果表明:基于非线性建模的BP神经网络和支持向量回归机拟合的得分模型要好于多元线性回归;该方法可以作为一个重要指标,应用在计算机辅助语音评分系统中。  相似文献   

5.
基于小波分析的梅尔频率倒谱参数?   总被引:1,自引:0,他引:1  
采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC.  相似文献   

6.
针对已有的发音字典扩展方法只能从文本数据中学习新词而无法学习到音频数据中新词的问题,提出了一种基于混合语音识别系统的发音字典新词学习方法。该方法首先分别采用音节和字母音素对混合识别系统对音频数据进行集外词识别,利用系统间的互补性得到尽可能多的新词及其发音候选,然后借助感知器与最大熵模型对得到的新词及发音进行优化,降低错误率,最后实现发音字典的扩展,并利用语法语义信息完成对语言模型参数更新。基于华尔街日报(WSJ)语料库的连续语音识别实验表明:该方法可以有效学习到音频数据中的未知新词,采取的数据优化策略极大地提高了所得新词及发音的精度;在词错误率指标下,字典扩展后系统的识别性能相对基线系统提高约13.4%。  相似文献   

7.
为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。  相似文献   

8.
英语语音学习困难分析与教学实践   总被引:6,自引:0,他引:6  
在英语语音学习中,学生往往会受母语及方言的影响,倾向于将汉语中音素、重音、节奏模式、语言的过渡形式、语调模式及与其他音素的相互作用方式一同迁移到英语之中,难以习得规范的英语语音语调。我们应在系统讲解、个别指导下,运用相应的教学方法,从语音、语调与节奏三个方面实施课堂教学。  相似文献   

9.
同普通话相比,包头方言所固有的发音特点,在英语发音中,受某些音素的影响,即没有舌尖韵尾音“n”、“zh、ch、sh”与“z、c、s”混用,词尾音多、多一个声母。其改进措施为:通过学习普通话,提高语言能力,从而指导学生学习英语语音体系。  相似文献   

10.
基于语音识别置信度的英语语言学习算法研究   总被引:2,自引:0,他引:2  
语音识别技术是实现一个语音学习系统的关键。由于目前的英语学习软件并不能完全满足用户的要求,因此该文提出了将语音识别置信度引入语言学习的方法。在讨论了置信度的基本原理和在语言学习中的作用之后,提出了一种新的算法并在此算法基础上最终建立了一个基于置信度技术的英语语言学习系统。在TIMIT语音库中的实验结果表明,语音识别置信度可以有效地提高语言学习系统的性能;当门限值设置于-0.7和-1.0之间,虚警率(false alarm)在1.1%左右,漏报率(false rejection)在0.65%左右,并且在一定条件下可以有效地反映学习者发音的质量,基本上可以达到实用的要求。  相似文献   

11.
本文简要介绍了语音识别电话的识别算法CDD—SPM及其硬件结构,并详细介绍了CDD-SPM在语音识别电话上用ALEP2186的汇编语言实现的过程。  相似文献   

12.
利用语音识别技术,依英语发音的特有性,搭建完整合理的计算机辅助英语发音评测系统。整个系统包括3个部分:语音段验证、语音信号切割和发音评测。其中语音段验证利用置信度评估的技术,并依据置信度阀值对评测语音内容是否需要评测做出判断;语音信号切割是以预先训练好的英语发音声学模型为切割依据,通过强制对位的方式切割出正确的发音区段;英语发音评测是系统的核心,使用的评测方式是比较评测语音和标准语音的相似度,采用4个评测特征:发音完整度、韵律性、语速和准确度进行发音相似度评测。针对不同的特征参数设计合理的评测机制,并对4个特征参数进行加权运算,以建立一个完整合理的英语发音评测系统。实验证明,系统能够给出比较客观的评分,达到预期设计目标。  相似文献   

13.
为了在大词汇量连续语音识别(LVCSR)系统中能够利用段长信息,该文按树状组织发音词典,利用语言模型预测技术,基于最大似然状态序列(M LSS)算法,给出了采用基于段长分布的隐含M arkov模型(DDBHMM)的LVCSR系统的二元文法语言模型的单步搜索算法。实验结果表明,尽管单步搜索的替代错误率高于双步搜索,但单步搜索的插入和删除错误率都比双步搜索要低,总体性能上单步搜索要好于双步搜索。同时,DDBHMM能较准确地利用了语音信号中的状态段长信息,采用DDBHMM的LVCSR系统比采用经典的齐次HMM的系统有更好的识别性能。  相似文献   

14.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

15.
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。  相似文献   

16.
一种基于ACELP的4.8kb/s高质量语音编码算法   总被引:1,自引:1,他引:0       下载免费PDF全文
介绍了一种基于代数码激励线性预测(ACELP)的4.8kb/s语音编码算法。首先对算法进行了概述,然后分别对算法所采用的基音周期估计,基音预测,代数码本结构以及代数码本搜索方式进行了介绍。重点对算法所采用的代数码本搜索技术进行了详细分析。定点C语言模拟结果表明,该算法在4.8kb/s速率上可以合成很高音质的话音。  相似文献   

17.
语音语料库的设计研究   总被引:3,自引:0,他引:3  
本文结合一般语料库的建设方法和实地的语言调查,总结出了语音语料库建立的一般步骤,主要包括以下四个主要过程:发音文本的设计;录音及整理过程;语音标注过程;数据库系统和数据库管理系统的建立。  相似文献   

18.
提出一种语种辨识的新方法.采用一种无需对语音文件进行标注的方法,提出基于倒谱距离窗移最小失真分割子词,在语种辨识前端用子词的自动分割方法把语音信号分割成许多子词.对得到的所有子词进行聚类并对每一类建立一个隐马尔可夫模型(HMM),最后利用得到的所有的子词模型对输入语音进行语种辨识.实验表明,该方法是一种简洁而且有效的语种辨识方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号