首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
根据前人对于句重音的研究成果,句重音可以分为语法重音和逻辑重音,逻辑重音又可以进一步分为对比重音和强调重音。对比重音成对出现,是说话人刻意要区分的一组重点信息。强调重音一般单独出现,是一句话当中的焦点信息。强调重音主要出现在两类不同的语境中,一是对话的应对语,一是对话的始发语,或者非对话语篇。  相似文献   

2.
韵律标注是藏语语音合成语料库建设的重要环节.文章参考汉语韵律标注的研究成果,结合藏语自身的语音特点以及韵律特征,进行了面向藏语语音合成语料库的韵律标注研究,并设计一套包含拉丁转写、声调类型、音节结构、重音类型以及停顿指数的标注规则,为藏语语音韵律特征的研究提供了直观的、科学的方法.  相似文献   

3.
传统的基频和时长等声学参数凸显阳平音节的重音的作用有限,因此该文具体考察了双音节阳平词的词重音的声学关联物。通过对6 000句语料中的1 282个双音节阳平词进行重音标注和声学分析,发现双音节阳平词的词重音表现出特殊的声学关联物:两音节的音高升幅差、音高上升部分时长差和斜率差这3个斜率相关参数。主要体现在:3个斜率相关参数与双音节阳平词的重音类别有较高的相关性,它们均能够为区分前重词和后重词提供线索;在不同的韵律边界下,斜率相关参数对词重音的影响不同;3个参数与重音类别存在一定的对应关系。  相似文献   

4.
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。  相似文献   

5.
在蒙古语语音合成系统中,语料库的好坏会直接影响语音合成的效果.因此,语料库标注规则的设计对语音合成工作具有重要意义.提出了一种新的蒙古语语音合成语料库的标注规则,并用按此规则标注的蒙古语语料库进行了基于隐马尔科夫模型的蒙古语语音合成实验,合成效果达到了预期目标,说明我们提出的标注规则是合理可靠的.  相似文献   

6.
重音是主要的韵律特征之一,不同的重音落点会传递不同信息。可根据Halliday的语音及信息理论,以实验语音学为手段,研究中国英语学习者命题对话中的重音分布特征。研究语料取自中国英语学习者口语语料库—SECCL。研究揭示了学习者对话中重音分布的总体特征,并且发现重音落点和信息中心常发生错位,在无对比和强调的情况下,语法词如人称代词和介词被重读,携带旧信息的有标记调核比例较大等等,从而导致信息误传。  相似文献   

7.
建立了一个兰州方言语料库.利用<方言调查字表>设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;对于语句,根据词法信息和语法信息,利用TBL算法标注了韵律边界.语料库可用于兰州方言的实验语音学研究以及兰州方言的韵律建模、语音合成、语音转换的研究.  相似文献   

8.
基于隐Markov模型的汉语词类自动标注的实验研究   总被引:3,自引:0,他引:3  
汉语词类自动标注技术在中文信息处理现实应用中占据着十分重要的位置。论文在经过人工分词和词类标注的大规模汉语语料库的支持下 ,通过一系列对比实验 ,对基于隐 Markov模型的汉语词类自动标注算法进行了系统的考察 ,并得出结论 :1Bigram模型的“性能价格比”较 Tri-gram模型更令人满意 ;2以 7万词次左右的标注语料库训练 Bigram模型即已基本够用 (此时 ,兼类词词类标注正确率及文本词类标注正确率分别可达 93%和 97%以上 ) ;3Bi-gram模型对不同领域具有一定的适应性。这些结论对设计实用型汉语词类自动标注系统具有指导意义。  相似文献   

9.
目前多媒体技术要求机器对英语语音的合成接近人的自然声音.提出了用神经网络技术来标注英语单词内重音的新方法,讨论了输入-输出样本的编码转换问题,利用MATLAB仿真平台设计了神经网络结构和训练方法.实验证明,该方法是正确和有效的,并且具有更高的精度.  相似文献   

10.
汉语的语句重音作为一种韵律变化,是一种语音现象,同时也是一种语法现象。依据语句的焦点,我们把汉语语句重音分为语义重音和对比重音两大类,分别叙述了两种重音的定义,理清了不同重音类别与汉语句法、语义以及语用之间的逻辑关系,并论证了新分类的正确性。文中对汉语语句重音的重新定位及其分类能够加深我们对相关领域的认识,并对现代汉语教材的编写提供有益的参考。  相似文献   

11.
藏语语音合成中语料数据标注规则的设计   总被引:1,自引:0,他引:1  
基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。  相似文献   

12.
CUCBNC:一个引入播音学知识的广播新闻语音库   总被引:1,自引:0,他引:1  
该文描述了广播新闻语音库CUCBNC的构建过程。建设该语音库的目的是为了能将播音学相关知识应用到言语工程中。为此,通过解读播音学相关论述,提出了新的韵律特征,包括声音表达特征、语篇重音、意合群和复合韵律短语,并融入到CUCBNC语音库的韵律和文本标注规范中,目前已标注了约14h的语音数据。最后,通过观察相关韵律特征在标注数据中的统计分布,来检验融入了新特征的韵律标注规范是否合适。实验结果表明所提出的韵律特征是科学合理的。  相似文献   

13.
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。  相似文献   

14.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

15.
提出一种基于规则的无监督词性标注方法, 利用200多条英语语法规则, 创建26个规则函数, 先将输入的待标注英语句子进行预处理后得到初始标记, 再对每个单词调用规则函数, 最终得到标注后的英语句子. 通过对Brown语料库的实验, 词性标注的正确率达到9395%. 实验结果表明, 本文方法可行、 有效, 能很好地提高英语词性标注的准确率.  相似文献   

16.
以中文分词为应用目标, 将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息, 分别考察了它们的分布和对大数据集上语言计算的影响。结果表明, 两者都直接或间接地表达了作者对语言的分割意志, 因而对分词具有积极的影响。通过词语抽取测试, 发现在缺乏丰富显性标注信息的文本中, 来自语言固有规律的自然标注信息对字符串有着强大的分割性能。  相似文献   

17.
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.  相似文献   

18.
文章提出了一种基于规则的汉语句法分析方法 ,通过对已进行分词与词性标注的句子进行短语的人工标注形成精确度较高的语料 ,然后提取一些规则分析出短语的结构和功能类型 ,为自然语言的计算机处理提供基础研究服务。  相似文献   

19.
为能在搜索引擎返回的结果集上构建贴近用户意图的主题层,并在文档词与主题间建立映射,将社会化标注引入经典的LDA模型,构建一种基于主题-标签-文档词之间关系的三层主题模型,并将其用于伪相关反馈查询扩展词的选取.实验结果表明,该模型提取的查询扩展词能描述标签的语义,模型用于伪相关反馈后,提取的扩展词能覆盖查询条件,在多数情况下结果列表的NDCG值高于基本伪相关反馈和结果集聚类方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号