首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
藏语语音合成中语料数据标注规则的设计   总被引:1,自引:0,他引:1  
基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。  相似文献   

2.
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。  相似文献   

3.
藏语数字语音识别是藏语语音识别中的基础环节。文章以藏语数字语音信号产生的数学模型为研究对象,从频域、时域、倒谱域出发,对藏语数字语音识别进行了分析,重点论述了藏语数字语音识别的原理、仿真实验及测试方法。以藏语数字语音库为数据资源,对藏语数字语音建立了训练模型并从中提取语音特征,通过模板匹配算法,获取录音数据中待识别语音的模板。实验证明已建立语音库的识别率达100%,随机录音的识别率则达90%。  相似文献   

4.
藏语语音合成语料数据库的优劣对合成语音质量有很大的影响,语料的设计考虑了音段和韵律,语料库中包含藏语的音节、词语、独白语句和情景对话语等.  相似文献   

5.
藏语语音合成语料库的好坏对合成语音质量有很大的影响。本文介绍了藏语拉萨话语音合成语料库的设计过程,语料的设计考虑了内容上和语义上的完整性,利用Greed算法实现对语料的选取,同时严格按照标准的录音过程对语料进行录制,最后设计了一套韵律标注规则对语料库中的语音数据进行了音段特征和超音段特征的标注,基本完成了藏语拉萨话语音合成语料库的建立。  相似文献   

6.
基于语料库的藏语TTS技术研究   总被引:1,自引:0,他引:1  
文章通过比较分析国内外TTS技术的发展,提出基于语料库的藏语TTS技术的可行性.研究了藏语TTS的文本分析模块、语音合成模块及语音数据库的关键技术,并设计了一个完整的基于语料库的藏语TTS系统.  相似文献   

7.
语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用.韵律的研究是语音合成技术中的重要研究课题.藏语语音韵律控制技术及其在藏语TTS中的应用,内容包括藏语语音韵律研究的基本情况及今后的工作重点,藏语语音合成技术中韵律调整的方法以及藏语TTS 中的韵律生成模型和声学模块.  相似文献   

8.
文章采用基于Windows系统下的语音软件,采集了藏语语音声学数据参数和语音数据,建立了藏语语音数据库,并对录音数据进行了语音标注、统计和分析,最终描绘了现代藏语语音的声学实验特征。本语音软件可广泛应用于语音教学、语音分析、其他语言发音方式的研究以及法医声纹鉴定等工作。  相似文献   

9.
随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特征参数,建立了以音素为建模单元的藏语语音声学模型.在不同建模单元下LSTM-CTC模型和BLSTM-CTC模型的对比实验表明,该方法能够充分利用上下文信息,具有较强的建模能力和语音识别效果.  相似文献   

10.
藏语语者英语语音学习的现状和需求迫使研究者尽快开发出适合其语音学习的有效工具。该文利用"藏族人说汉语普通话、英语、藏语"声学特征语料库(CETTS)中的相关声学参数,建立直观易懂的舌位图模型辅助藏语语者了解其英语单元音的产出特点。在此舌位模型基础上设计舌位自我纠正软件,并通过为学习者提供实时的语音反馈,辅助其有针对性地改善自身的英语发音现状,从而提高交流时的可理解性。该舌位模型和舌位自我纠正软件可以应用于日常教学之中,来提高英语语音教学的效率。  相似文献   

11.
藏语孤立词语音识别系统研究   总被引:3,自引:0,他引:3  
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率.  相似文献   

12.
双门限算法是语音端点检测的一种重要方法,对藏语语音识别和处理具有重要意义。提出了用双门限端点检测技术对藏语语音进行音节分割的方法,首先根据双门限语音端点检测原理进行Matlab编程和仿真,然后结合藏语语音的音节特点和双门限算法分别在正常语速和慢语速环境下对藏语的30个辅音语音、随机抽取的双音节、三音节及句子语音进行双门限算法的音节分割和分析,实验表明双门限算法对没有太多连读音节的藏语语音和慢语速下长句的音节分割准确率较高。  相似文献   

13.
文本分析是文语转换系统的前端,是制约语音合成自然度的一个重要因素,文章在考察汉语文本分析方案的基础上,分析了藏语的特点,提出了一套适合于藏语语音合成的文本分析模块的实现方案.文中采用最大匹配法和分词词库相结合的方法实现文本的自动分词,建立一套层次化的规则体系对文本进行规范化的处理,字音转换则通过SAMPA-ST的藏语机读音标系统来实现,本研究的完成为藏语的语音合成打下了良好的基础.  相似文献   

14.
韵律标注是藏语语音合成语料库建设的重要环节.文章参考汉语韵律标注的研究成果,结合藏语自身的语音特点以及韵律特征,进行了面向藏语语音合成语料库的韵律标注研究,并设计一套包含拉丁转写、声调类型、音节结构、重音类型以及停顿指数的标注规则,为藏语语音韵律特征的研究提供了直观的、科学的方法.  相似文献   

15.
文章介绍了语音识别的技术、应用领域和藏语语音识别技术的现状,以及语音识别的基本原理及识别的过程分析,探讨了藏语语音识别技术中的难点问题,并展望藏文语音识别技术的发展方向和前景。  相似文献   

16.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

17.
采用语料库方法,构建了一个具有4500余条词的白马藏语语音库,并做了规范的音标标注。该库涵盖了《藏语方言调查表》91%的词汇,包含了白马藏语固有的语音和词汇特征,完全能够代表白马藏语普遍的语言现象。依据语音库标注信息,从发音部位和发音方法两方面对白马藏语声母和韵母的音位系统进行了统计分析,获得了详细的白马藏语音系数据。同时,按发音方法归纳了声母与韵母的组合规律及其分布特征,总结了白马藏语语音与藏语书面语的对应关系,为今后的白马藏语研究提供了详实的数据和新的研究思路。  相似文献   

18.
藏语文-音自动规则转换及其实现   总被引:2,自引:0,他引:2  
为满足语言学、音韵学和工程语音学的需要,该文根据现代藏文与3大方言语音之间的对应规律和藏文正字法,提出了从文字上对藏文声母和韵母拆分的"字丁分解法",实现了藏文到各方言国际音标的自动转换.并对算法和实现过程进行了详细的阐述,建立了藏语13个方言点的方音数据库.方音数据库的建立为藏语方言研究和语言教学提供了科学、方便的工具,为藏语标准音的制定、推广及应用提供原始的语音材料,也能作为藏语语音识别和语音合成的标音基础.  相似文献   

19.
清浊音识别在语音处理技术中具有非常重要的意义,其准确度对后续的语音处理有很大的影响.文章根据藏语言文字的特征提取了藏语有声段语音的短时能量、短时过零率以及短时自相关等参数,并通过对语音进行短时时域分析,研究了藏语的清浊音识别方法.实验证明,此方法在藏语辅音字母的清浊音识别中获得良好的效果,该方法为进一步深入研究藏语语音技术提供了一定的参考依据.  相似文献   

20.
通过对语音和唇形的信号采集,设计了12个外唇线关键点和9个内唇线关键点的提取方案,同时建立起语音、唇形数据库,并对其进行参数提取和统计分析,从而建立了汉语普通话语音、唇型之间的关联模型,在此基础上实现了语音驱动的唇形合成系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号