首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 65 毫秒
1.
设想一套汉语方言语音识别系统。该系统将具有声、韵、调自动识别,中古声母、韵母、声调以及声母开齐合撮检索,同音和有音无字词检索,轻声、连读变调识别和文白异读识别等5个功能,汉语方言识别系统的构建将提高汉语方言研究的工作效率。  相似文献   

2.
包头方言和普通话相比,语音方面的差异比较突出。在声母、韵母、声调三个方面,包头方言与普通话既存在对应关系,亦有不同。通过比较,不仅为汉语语音史的研究提供资料,也为包头地区的人们学习普通话提供方便。  相似文献   

3.
文章基于田野调查的录音语料,用实验语音学的方法提取时长和基频两项参数,分析中阳方言单字调的基频模式.结果表明,该方言有六个单字调:阴平13,阳平33,上声413,去声51,阴入3,阳入312.研究还发现在该方言中,平声和入声分阴阳,上声和去声不分阴阳,且浊入声有舒化的趋势.  相似文献   

4.
基于小数据量的方言普通话语音识别声学建模   总被引:1,自引:0,他引:1  
为在少量数据情况下显著提高方言普通话的识别率,针对标准普通话和方言普通话之间发音差异是连续变化的特点,在少量方言普通话的基础上,提出了基于距离度量的识别基元扩展方法,并将扩展基元与状态相关的基于基元的模型归并方法相结合.采用1 h的上海普通话数据作为开发集,用本方法,使音节错误率降低了17.3%. 另外与自适应方法的结合使用,还可以将音节错误率再降低6.6%, 这比单纯应用自适应方法错误率多降低了5.4%.  相似文献   

5.
提出并实现了一种基于广义人工神经网络和STRAIGHT模型的高效基频轨迹跟踪算法.一方面,STRAIGHT模型可以对语音信号的基频进行较大幅度的修改而不至于引起合成语音质量的下降.另一方面,利用人工神经网络优良的预测能力,学习源说话人和目标说话人的基频轨迹之间的内在联系,实现基音频率的转换.语谱图分析、主观意见分评价结果表明:提出的基频轨迹跟踪算法在合成语音质量及目标特征映射上都远远好于传统的基频转换算法.  相似文献   

6.
将深层神经网络(Deep Neural Network)应用于汉语方言种属语音识别.基于优化的QuickNet软件,为方言识别实现了一种有监督的DNN逐层预训练方法.在训练时,从3层开始逐层做有监督的神经网络训练,每增长一层的初始权值包含前一层训练好的部分权值和输出端的随机权值.在得到最大层的初始权值后,再进行传统的BP网络训练.该方法和普通神经网络相比识别率有较大提升,可用于移动互联网标准语音识别人口、方言口音鉴识等领域.  相似文献   

7.
潮州方言属闽南区方言.本实验采用现代计算机声谱分析软件Praat对潮州方言单字调进行声学研究,并与其他方言相比较,得出男女声调域.用T值法进行标准化分析,得出潮州方言单字调的空间五度值,并与传统实验结果相比较.  相似文献   

8.
同普通话相比,包头方言所固有的发音特点,在英语发音中,受某些音素的影响,即没有舌尖韵尾音“n”、“zh、ch、sh”与“z、c、s”混用,词尾音多、多一个声母。其改进措施为:通过学习普通话,提高语言能力,从而指导学生学习英语语音体系。  相似文献   

9.
建立一种好的声学模型对汉语方言识别系统的识别率有着重要的影响.为了改善汉语方言辨识效果,提出了一种新的高斯混合模型初始化方法.该方法将谱聚类算法运用到高斯混合模型参数的初始化之中,并与传统的K-Means初始化方法进行了比较.实验结果表明,谱聚类算法能够更好地优化高斯混合模型参数,并且系统辨识率也有了相对提高.  相似文献   

10.
汉语南方言方言中有一些与普通话相异的语法形式。文章以客家话、上海话为汉语南方方言的代表;以傣语为百越语代表,揭示三者共同与普通话相异的语法形式。试图通过比较探讨一些语法问题:某些语法现象的产生、发展和某些语法形式所表达的准确的语法意义以及受到百越语言的影响。  相似文献   

11.
汉语语篇修辞结构边界韵律表现   总被引:2,自引:0,他引:2  
本文考察了语篇修辞层级结构边界的韵律表现。对由20个语篇构成的语料库进行了修辞结构的层级标注和声学分析。声学参数主要采用小句边界处无声段,音高重置和边界前音节延长。研究得到以下主要结论:(1)小句边界处无声段和高音点重置是语篇修辞层级结构的主要声学线索。小句边界在语篇层级结构中的位置越高,边界处无声段越长,边界处高音点重置的值越大。但是语篇结构中小句边界处的无声段延长和高音点重置增大也是有限度的。(2)小句边界处低音点重置和边界前音节延长都不是区分语篇修辞层级结构的有效线索。  相似文献   

12.
文章从实验语音学的角度 ,通过语音的声学实验 ,从音长、音色、音高等方面对益阳话轻重音的物理声学特征进行了分析。研究表明 ,轻读音节能量较弱 ,是音长、音色、音高等因素综合变化的结果  相似文献   

13.
汉语耳语音库的建立与听觉实验研究   总被引:6,自引:1,他引:6  
耳语音的识别和转换是个全新的课题,可应用于公共场合下的通讯和公安司法工作的某些特殊需要等方面.首先建立了一个包含1172个字和98个近音词的单人女声的汉语耳语音库.通过对两个听觉测试实验数据的统计分析,研究了人耳对汉语耳语音字和近音词声调的辨认率特征,得出人耳对孤立字四个声调的辨认率由高到低的排序为三声>四声>二声>一声.同时也得出人耳对词声调的辨认能力比字要强得多.幅值包络和音长这两个特征参量能够反映出汉语耳语音声调的特性,基于此参数对汉语耳语音字进行声调识别实验,其声调识别率已达到了人耳的平均辨认率,为连续耳语音声调识别研究打下了基础.  相似文献   

14.
针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。  相似文献   

15.
介绍了一种以规范抽象语法树为中间语言且基于转换规则制导的FORTRAN 到C的源级转换系统,简称FTOC.  相似文献   

16.
IntroductionIn recentyears,speech recognition has made greatprogress.Commercial systems such as Via Voice( IBM Company) and Naturally Speaking 1 .0( Dragon System Company ) lead the field.Although the recognition ratio has greatlyimproved,many issues still need further research,such as,real- time in processing,systemcomplexity[4 6] ,very large scale integrated circuit( VLSI) implementation,etc.Among these issues,the implementation in VLSI is the most criticalchallenge for wide use of s…  相似文献   

17.
超音段信息主要由声调、语调和轻重缓急等信息组成,反映到特征参数就是基频及其时序信息、能量时序信息和音节长度等,这些信息是话者识别系统中的重要特征参数.在分析已有的提取这些特征参数的方法的基础上,提出了先进行语音切分,再提取声调、能量和音节长度等特征,并生成基于Bigram模型的超音段信息参数模型的方法.将此特征参数形成的模型作为使用MFCC为参数的话者识别主系统的辅助决策模型,实验结果表明:融合超音段信息模型的文本无关话者识别系统的EER相对下降10.5%.  相似文献   

18.
基于状态驻留时间的汉语语音分段概率模型   总被引:1,自引:0,他引:1  
为了解决分段概率模型 (SPM)因缺少对时间信息描述而带来的建模精度低的问题 ,提出了状态驻留分段概率模型 (SDSPM)。SDSPM中包含了用伽玛分布表示的状态驻留概率 ,以刻划语音的时间特征。此驻留概率相当于隐马尔可夫模型 (HMM)中的状态转移概率 ,但使 SDSPM描述语音时间特征的能力强于 HMM。SDSPM既改善了 SPM的模型性能 ,同时又避免了 HMM的计算复杂度问题。测试实验证明了 SDSPM模型在汉语语音识别中的有效性。  相似文献   

19.
研究了不确定的有限自动机转换为与之等价的确定的有限自动机的算法机制和复杂性,以及传统的子集算法在转换过程中存在的大量重复遍历和无效遍历现象,并针对上述现象提出了一种改进的子集法算法MF-SUBSET.结果表明,MF-SUBSET算法通过增加状态标志和遍历路径标志来决定当前的搜索策略,能够有效地避免转换过程中的重复遍历和无效遍历操作,极大地提高了转换效率.  相似文献   

20.
面向情感变化检测的汉语情感语音数据库   总被引:3,自引:0,他引:3  
该文介绍了面向普通话情感变化检测的情感语音数据库CESD。该数据库的语音以对话形式录制,包括男女声情感对话语音1 200段。以生气、着急、中性、愉悦、高兴为基本情感,共包含20种情感变化模式。除语音文件外,还包含带有静音段/有效语音段、情感类别、情感变化段、情感质量等内容的标注文件。为了使更多的研究人员可以使用该数据库,利用P raat工具提取出67维常用声学特征,作为特征文件一同存储在该数据库中。对该数据库进行主观评价和情感变化检测的结果表明:语音情感状态自然、情感变化真实,能够满足语音情感识别和语音情感变化检测研究的双重需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号