首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
汉语是一种有调语言,因此在汉语语音识别中,调型信息起着非常关键的作用。在现有的隐马尔可夫模型(Hidden Markov Model)框架下,如何有效地利用调型信息是有待研究的问题。现有的汉语语音识别系统中主要采用两种方式来使用调型信息 一种是基于Embedded Tone Model,即将调型特征向量与声学特征向量组成一个流去训练模型;一种是Explicit Tone Model,即将调型信息单独建模,再利用此模型优化原有的解码网络。该文将两种方法统一起来,首先利用Embedded Tone Model采用双流而非单流建模得到Nbest备选,再利用Explicit Tone Model对调进行左相关建模并对Nbest得分重新修正以得到识别结果,从而获得性能提升。与传统的无调模型相比,该文方法的识别率的平均绝对提升超过了3.0%,在第三测试集上的绝对提升达到了5.36%。  相似文献   

2.
在发音质量自动评测任务中,韵律发音质量评测是非常重要的高级环节,对语音的自然度和可理解程度方面有着直接和重要的影响。本文在韵律相关的多种声学特征的基础上,进一步融合了韵律相关的多种语言学统计特征,并使用支持向量机为分类模型,实现对韵律发音质量的有效评测,人机相关性达到0.779,相对提升了3.45%。同时,采用基于浮动思想的SFFS算法进行特征筛选,去除了目标无关的特征,提高了支持向量机模型的精度和泛化能力,进一步提升了评测性能。  相似文献   

3.
一种基于Straight的语音焦点合成方法   总被引:1,自引:0,他引:1  
杨金辉  易中华  王煦法 《计算机工程》2005,31(13):46-47,128
针对汉语焦点的特性,设计了接近自然语流风格的实验语料。通过对语料的分析,运用CART技术,建立了焦点的韵律模型。在语音合成阶段,使用韵律模型生成语音的韵律参数,结合Straight算法,实现了语音焦点的合成。对合成效果的评测表明,该方法能够合成自然度很高的语音焦点。  相似文献   

4.
语音合成中的韵律关联模型   总被引:4,自引:2,他引:4  
基于大规模语音数据库的文语转换系统(Text-to-Speech , TTS)中,如何选取合适的语音基元是提高合成语音自然度的重要因素。本文研究了连续语流中的韵律关联现象,提出了包含韵律关联参数的汉语韵律特征参数集,基于数据挖掘中的关联规则模型(Association Rules Model)建立韵律关联模型,并将该模型应用于基元选取。实验表明,该方法有效地利用了语音基元的韵律及关联信息,符合人耳的知觉感受,使得合成语音自然度的主观评测MOS(Mean Opinion Score)得分与不考虑韵律关联时的结果相比提高了12.22%(3.49/3.11)。  相似文献   

5.
基于指控仿真环境导调评测系统的实现   总被引:1,自引:0,他引:1       下载免费PDF全文
导调评测系统是战场环境仿真和作战系统效能评估的有效工具。该文根据指控仿真环境下的应用需求提出一种导调评测系统的合理架构,介绍该导调评测系统的设计思路和实现技术。该系统的代理接收导调控制程序的脚本指令,并通过邮槽实现与该终端内各指控系统软件的进程间通信。  相似文献   

6.
现代越南语是一种拼音化文字,采用“声、韵、调”标记其音节。采用基于HMM的可训练语音合成方法实现越南语语音合成。针对越南语的特点收集语料、录音、标注、确定音素列表、设计上下文属性集和问题集。在HTS平台下构建越南语的STRAIGHT语音合成器。对合成语音进行主观评测。初步评测结果表明,可懂度基本接近100%,自然度还处在“可以接受”和“比较自然”之间。  相似文献   

7.
该文介绍了第七届全国机器翻译研讨会(CWMT2011)机器翻译评测的具体情况。本次评测重点关注各种语言到汉语的翻译,除了汉英、英汉、日汉三个语言对以外,评测还新增了五种民族语言(藏语、蒙古语、维吾尔语、哈萨克语、柯尔克孜语)到汉语的翻译评测。共有19家国内外单位的165个系统参加此次评测。除了介绍评测项目的设置、评测数据的准备、评测流程、参评单位等,本文还重点介绍了CWMT2011的评测结果,并对评测结果进行了分析,用实例说明了与评测结果相关的几个因素 源语言与目标语言是否相似、评测领域是否集中、测试集与训练及开发集语料是否相似、训练语料的规模、参评系统的技术和成熟度等。  相似文献   

8.
普通话水平测试电子化系统   总被引:2,自引:7,他引:2  
普通话水平测试电子化系统有助于高效地进行普通话水平测试。本文在100小时标准发音人数据库的基础上,针对汉语发音特点,利用语言学专家知识,引入语料选择的自适应算法改进了传统的语音评测算法。在500人普通话水平测试数据库上的测试结果表明,新评测算法能有效提升评测性能。经过分段线性映射,机器评分和人工评分的误差(2.44)和人工与人工评分之间的误差(2.30)相当。这表明可以使用机器代替人工进行普通话水平测试的前三项评分工作。  相似文献   

9.
基于结构助词驱动的韵律短语界定的研究   总被引:10,自引:5,他引:5  
应宏  蔡莲红 《中文信息学报》1999,13(6):42-46,64
提高合成语音的自然度是汉语文语转换系统(CTTS)的核心任务,而韵律短语的界定扮演着重要的角色。本文通过分析虚词的特征,研究了结构助词在连续语流中的特点、地位,以及在韵律短语界定中的作用,得到了一组相应的规则和结论。  相似文献   

10.
基于统计韵律模型的汉语语音合成系统的研究   总被引:2,自引:4,他引:2  
本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路,在此基础上建立了汉语语音合成系统。其中,本文还仔细阐述了韵律代价函数的构造,及其参数的自动训练算法。同时,论文还分析了韵律特征间相互作用对音节基元选取的影响,并最终实现了一个连续语流中用于汉语语音合成的音节基元选取模型。测试表明了本文提出的基于统计模型的韵律层级分析和韵律建模思路,能够较好应用于汉语语音合成系统的构造,并使之具有良好的合成语音的自然度。  相似文献   

11.
汉语是一种带声调的语言,声调信息在汉语语音识别中具有非常重要的意义。提出了emt}eaaea声调模型与explicit声调模型相结合的方法用以识别汉语连续语音的声调。该方法能够将逐帧的基频信息和较强时长的基频信息相结合来识别声调。在“863-Test”和“TestCorpus98"测试集上的实验表明,该方法分别能够达到96. 12%和93.78 %的声调识别正确率。  相似文献   

12.
为减少噪声环境对评估性能的影响,该文将PNCC参数引入普通话发音评估。结果表明,其评分相关性在普通话测试实录音数据库上较传统MFCC参数提高了6.6%。在此基础上,对汉语声学模型拆分方法进行了研究,提出将声母介音+韵母模型拆分方法应用到发音评估中。使用这种拆分方式的评估系统总错误率降低5.6%,专家打分相关性则提高了0.056。该文还对模型最佳状态数的选取进行讨论,并提出模型状态数混合和不同配置综合评分两种混合评分方案,在相关性上较同等条件下3状态模型分别提高了0.021和0.017。  相似文献   

13.
电影对白语言中的语音历时对比分析   总被引:1,自引:1,他引:0       下载免费PDF全文
普通话已经走过了近百年的历程,目前还很少有人对普通话的历时语音变化及其韵律特征进行系统的实验研究。以2005年颇具代表性的广播电视谈话体语料为基准数据,选取《现代汉语普通话数字化样本库》中20世纪50年代和70年代拍摄的同名电影语料,对其中主要人物对白的音高、时长等语音特征进行历时的对比研究。经过分析发现:在广播电视及影视等有声媒体中,70年代语音的音节时长均值要长于50年代,其中阴平调表现尤为明显;在音高方面,高音点和低音点也都高于50年代,音域也较宽。这说明70年代的语音在发音上显得较夸张、不自然,这与六七十年代那段特殊的历史时期有关。  相似文献   

14.
声调在普通话中起着构词辨义的作用,声调的准确程度是决定普通话水平的重要因素。声调的客观评测是普通话水平客观评测系统的重要子系统之一。在分析普通话声调特点的基础上,提出了能消除语速影响和音节间相互影响的建模方法。选择了能反映声调特点的5个基频比值与归一化的基频共同作为声调评测参数,利用高斯混合模型对60人的实测语音数据进行了测试,结果表明:客观测试同主观测试的符合率达到88.24%。  相似文献   

15.
提出基于发音特征的声调建模改进方法,并将其用于随机段模型的一遍解码中。根据普通话的发音特点,确定了用于区别汉语元音、辅音信息的7种发音特征,并以此为目标值利用阶层式多层感知器计算语音信号属于发音特征的35个类别后验概率,将该概率作为发音特征与传统的韵律特征一起用于声调建模。根据随机段模型的解码特点,在两层剪枝后对保留下来的路径计算其声调模型概率得分,加权后加入路径总的概率得分中。在“863-test”测试集上进行的实验结果显示,使用了新的发音特征集合中声调模型的识别精度提高了3.11%;融入声调信息后随机段模型的字错误率从13.67%下降到12.74%。表明了将声调信息应用到随机段模型的可行性。  相似文献   

16.
利用语音信号与噪声信号具有不同相关特性的特点,提出了一种新的加权自相关基频检测算法,该方法可以提高噪声环境下基音检测的准确性。在分类器设计方面,通过引入支持矢量机,进一步提高低信噪比下的汉语声调识别率。实验结果表明,新方法对提高噪声环境下的声调识别效果是十分有效的。  相似文献   

17.
利用语音信号与噪声信号具有不同相关特性的特点,提出了一种新的加权自相关基频检测算法,该方法可以提高噪声环境下基音检测的准确性。在分类器设计方面,通过引入支持矢量机,进一步提高低信噪比下的汉语声调识别率。实验结果表明,新方法对提高噪声环境下的声调识别效果是十分有效的。  相似文献   

18.
提出了一种适用于母语非汉语学习者(Learner with Mandarin as a second language,ML2)学习汉语的自动发音评分(Automatic Pronunciation Evaluation,APE)方法。引入双语料语音库,将发音评分分为发音方式和发音效果两部分评分,提取各部分相应的特征参数,提出一种 双语音动态时间规整(Bilingual Dynamic Time Warping,BDTW)的方法来匹配比较得到语音相似度,通过评分机制得到最后的评分结果。通过实验验证了该方法的有效性。  相似文献   

19.
基于统计方法的汉语连续语音中声调模式的研究   总被引:4,自引:0,他引:4  
曹阳  黄泰翼  徐波 《自动化学报》2004,30(2):191-198
提出采用决策树的数据驱动方法,结合专家知识.从大规模语料中统计学习出连续语 音中声调模式的分布.在建立决策树的过程中,除了相邻音节的声调外.还考虑了多种可能影响 声调模式的因素,如音节声韵母发音特点的分类、音节在词中的位置等.决策树建立后,共得到 28种声调模式.通过对结果的分析发现,除了上下文的声调外,其它因素对连续语音中声调模 式的变化也有一定的影响.声调识别实验的结果证明了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号