期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《清华大学学报(自然科学版)》2017,(12)

对维吾尔语的韵律结构进行了全面的研究,从维吾尔语语音合成(text to speech,TTS)语音库中提取了音节的时长、能量、基频均值、最大值、最小值和基频范围等韵律特征参数,分析了其在音节处于不同韵律层次时的变化规律。提取了语音数据中韵律边界前后的音节延长量、音高重置和无声段等声学特征参数,并对它们的分布规律进行了统计分析。实验结果表明:不同韵律层级之间时长延长量和音高差值随着边界层级的提高而增加;韵律词边界之间没有显著地停顿,韵律短语和语调短语层级边界之间的平均停顿时长分别是154.2和212.8ms。相似文献

2.

斜率相关参数对双音节阳平词的重音感知的影响

刘敏张劲松李雅陶建华段日成《清华大学学报(自然科学版)》2013,(6):843-847

传统的基频和时长等声学参数凸显阳平音节的重音的作用有限,因此该文具体考察了双音节阳平词的词重音的声学关联物。通过对6 000句语料中的1 282个双音节阳平词进行重音标注和声学分析,发现双音节阳平词的词重音表现出特殊的声学关联物:两音节的音高升幅差、音高上升部分时长差和斜率差这3个斜率相关参数。主要体现在:3个斜率相关参数与双音节阳平词的重音类别有较高的相关性,它们均能够为区分前重词和后重词提供线索;在不同的韵律边界下,斜率相关参数对词重音的影响不同;3个参数与重音类别存在一定的对应关系。相似文献

3.

普通话同音异构两音组重音类型辨析 总被引：1，自引：0，他引：1

贾媛《清华大学学报(自然科学版)》2011,(9):1307-1312

通过感知实验和声学分析,系统地考察了普通话中具有相同发音和不同结构的两音组的重音类型问题,研究结果表明:普通话双音组中具有区别意义的重音类型为"左重",即"重-轻"组合;单念情况下的非轻声的两字组,不存在具有辨意作用的"词重音";由于受末音节时长延长的影响,多数两字组倾向于"右重",且重音分布与句法结构无关。相似文献

4.

重读对降阶作用的影响研究 总被引：1，自引：0，他引：1

黄贤军吕士楠《清华大学学报(自然科学版)》2009,(Z1)

通过设计特定声调组合的实验室语句,考察了重读和降阶作用对陈述句语调下降趋势的影响规律。结果发现,重读对其后语调下降趋势的影响是刚性的;而降阶的作用则是有条件的,会受语句中重音位置的影响。当重读处于诱发降阶的低音之前时,两种因素对语调下降的作用是累加的,导致低音后的基频曲线明显低于只存在重读或降阶时的基频曲线。当重读与低音成分位置重合或重读处于低音成分之后时,虽然重音本身的音高表现在一定程度上会受到低音的影响,但低音成分不影响重音位置之后的基频曲线,并且此时重读会导致降阶现象消失。相似文献

5.

汉语韵律边界定位与选音算法研究

程勇吴玺宏迟惠生《北京大学学报(自然科学版)》2004,40(3):451-457

论述了采用统计模型进行汉语韵律层次结构分析和韵律建模的思路,将韵律结构划分为3个基本层级：韵律词,韵律短语和韵律短语群,提出了一种新的基于统计的韵律结构模型。实验表明该模型对韵律词边界的预测准确率和召回率分别达90.37%和92.48%：对韵律短语边界的预测准确率和召回率分别达82.43%和85.59%。同时,描述了一个汉语连续语流语音合成的选音算法,它适用于基于大语料库的语音合成系统。由于同时考虑单音节、二字韵律词、三字韵律词和四字韵律词,从而降低了因拼接点不连续而造成的音质损失,提高了合成语音的自然度。相似文献

6.

连续语流中重音标注和大规模重音语料库建设

卢颖超李雅陶建华许小颖《清华大学学报(自然科学版)》2011,(9):1271-1275

规范的重音标注将对重音研究和语音合成技术产生积极影响。该文通过对大规模语料进行语流中词重音和句重音标注,总结出了重音标注的规则。重音标注包括标注训练、正式标注、语料库建立3个步骤。通过标注训练明确重音概念和标注方法,词重音采取词内对比法,所谓"重"主要指突显度和饱满度;句重音采取呼吸句群单位标注法,注重标注的层级性,不跨句群进行重音知觉对比。重音标注完成后,重音语料库也随之建立起来。这个大规模的重音语料库具备词重音和句重音信息,适用于语音合成领域,能较好地提高合成语音的自然度。相似文献

7.

略论普通话的语调美 总被引：1，自引：1，他引：0

方友根《皖西学院学报》2003,19(6):102-102,154

作为现代汉语标准化的言语典范，普通话语调具有无与伦比的美感，是普通话审美价值的重要体现。普通话语调美是在汉语一般形式美基础上的特殊表现，其建筑基础是四声调型鲜明而优美的韵律节奏和非音质因素在语流中所显现的重音、语速、停顿和升降等整体性语音特征。在朗读(诵)和说话交流场合，普通话语调美更能显示出优势效应。相似文献

8.

基于时域模型分析谐波复合音的音高感知机制

王健关添叶大田《北京大学学报(自然科学版)》2012,48(4):559-564

为了探讨中等次数的谐波复合音是否依赖于时间精细结构信息进行音高感知, 测量了谐波复合音的基频辨别阈。目标复合音可以单独存在, 或者和掩蔽复合音同时存在。二者经过相同的带通滤波区域, 具有不同的相位组合和基频差异。结果表明: 相位组合对音高感知没有显著影响; 滤波区域和基频差异对音高感知具有显著影响。采用时域模型分析发现, 中等次数的谐波复合音可能依赖于时间精细结构信息获得较好的音高感知结果。研究结果能帮助建立复杂声音场景下的音高感知机制。相似文献

9.

基于基音同步叠加技术的韵律修正的实现

孔敏《安庆师范学院学报(自然科学版)》1999,5(1):41-44

将小波变换用于声门闭合时刻（ＧＣＩ）检测，获得ＧＣＩ的位置，在此基础上，按每个基音起始的精确位置进行基音同步叠加在一定范围内，改变单音节的基频和时长去拟合连续语流中音节的超音段变化相似文献

10.

中国学习者英语口语中重音落点特征研究

申勇吴光庭《镇江高专学报》2010,23(2):32-36

重音是主要的韵律特征之一,不同的重音落点会传递不同信息。可根据Halliday的语音及信息理论,以实验语音学为手段,研究中国英语学习者命题对话中的重音分布特征。研究语料取自中国英语学习者口语语料库—SECCL。研究揭示了学习者对话中重音分布的总体特征,并且发现重音落点和信息中心常发生错位,在无对比和强调的情况下,语法词如人称代词和介词被重读,携带旧信息的有标记调核比例较大等等,从而导致信息误传。相似文献

11.

Modeling Pitch Contour of Chinese Mandarin Sentences with the PENTA Model

《清华大学学报》2012,(2):218-224

In continuous speech,the pitch contour of the same syllable may vary much due to its contextual information.The Parallel Encoding and Target Approximation (PENTA) model is applied here to Mandarin speech synthesis with a method to predict pitch contours for Chinese syllables with different contexts by combining the Classification And Regression Tree (CART) with the PENTA model to improve its prediction accuracy.CART was first used to cluster the syllables’ normalized pitch contours according to the syllables contextual information and the distances between pitch contours.The average pitch contour was used to train the PENTA model with the average contour for each cluster.The initial pitch is required with the PENTA model to predict a continuous pitch contour.A Pitch Discontinuity Model (PDM) was used to predict the initial pitches at positions with voiceless consonants and prosodic boundaries.Initial tests on a Chinese four-syllable word corpus containing 2048 words were extended to tests with a continuous speech corpus containing 5445 sentences.The results are satisfactory in terms of the Root Mean Square Error (RMSE) comparing the predicted pitch contour with the original contour.This method can model pitch contours for Mandarin sentences with any text for speech synthesis. 相似文献

12.

汉语普通话与沈阳方言转换的研究

贾珈蔡莲红李明张帅《清华大学学报(自然科学版)》2009,(Z1)

中国地域辽阔,汉语包括多种方言。方言转换技术可实现方言间语音的转换,丰富语音交流的方式,增强语音交流的可懂性、友好性和趣味性。该文分析了普通话与沈阳方言在声调调类与调值、时长和特殊词等方面的差异;探讨了普通话与沈阳方言转换的可行性;提出了基于混合聚类算法的方言基频转换模型、基于统计的方言时长转换模型和基于加权有限状态机的特殊词识别算法;通过基本转换和说话人音色还原构建了方言转换系统,实现了实时普通话语音输入、沈阳方言语音输出。评测结果显示通过方言转换系统得到的方言语音与目标方言语音具有较高相似度。相似文献

13.

基于小波变换的汉语三字词语音基音频率提取 总被引：2，自引：0，他引：2

王义元赵黎明《吉林大学学报(信息科学版)》2005,23(1):22-26

声调是基音频率的轮廓,为准确提取基音频率,进行具有汉语特色的连续语音识别,提出了具有汉语特色的清浊音切分方法.与常用的阈值法相比,该方法能更好地找到清浊音的切分点,尤其是在字与字连接紧密时更有效(在这种情况下阈值法往往失效).在此基础上,利用小波变换的多分辨分析特性进行了汉语三字词语音基音频率的提取.实验结果显示,该算法能有效地将三字词语音分开,且得到的基音频率曲线符合汉语三字词语音的声调模式. 相似文献

14.

采用重音调整模型的HMM语音合成系统

李雅潘诗锋陶建华《清华大学学报(自然科学版)》2011,(9):1171-1175

韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。相似文献

15.

TD-PSOLA技术在汉语语音波形编码合成中的应用 总被引：1，自引：0，他引：1

吴耀中《福建师范大学学报(自然科学版)》1999,15(1):40-43

以时域基音同步叠加（ＰＳＯＬＡ）技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。相似文献

16.

句末“阳平＋去声”词语重读时的音高变化

陈艺彤《韶关学院学报》2014,(5):120-123

韵律处理是语言合成技术的重要部分，了解韵律特征及建立韵律模型是提高合成语言自然度的前提。实验利用Praat软件，在分析了32组语音实验材料，建立音高数据库的基础上，研究句末“阳平＋去声”词语重读时的音高变化，初步得出重读时高音点的音高会有明显提高，且变化幅度大于低音点，阳平声调低音点的音高会有所下降的结论。相似文献

17.

利用声调提高中文连续数字串语音识别系统性能 总被引：2，自引：0，他引：2

章文义朱杰徐向华《上海交通大学学报》2004,38(2):185-188

采用平均幅度差法、自相关函数法和简单逆滤波器跟踪法相结合的方法计算语音信号的基音频率。根据声调模式的不同，采用基于规则的方法对声调进行识别，对连续数字串识别中一些易混淆的数字对进行区分，从而达到提高数字串识别系统性能的目的。相似文献

18.

基于小波变换的语音基频检测

吴谨刘振兴《武汉科技大学学报(自然科学版)》2000,23(2):190-192

用小波变换法对语音基频进行检测。结果表明 ,小波变换法比传统方法更准确地提取基频 ,并具有相当的稳健性和适应性。对汉语而言 ,有利于语音四声的识别相似文献

19.

Electric-stimulus rate encoding algorithm of Mandarin tonal information in cochlear implant

GUAN Tian GONG Qin YE Datian 《自然科学进展(英文版)》2006,16(12):1315-1321

The modern multi-channel cochlear implants usually extract and encode the temporal envelope cues. This kind of algorithms can hardly satisfy the users who speak tonal languages, such as Mandarin. Many studies have tried to enhance the recognition ability of Mandarin through encoding tonal information and made suggestions to frequency-modulate the fixed pulse-rate carrier with the extracted tonal information based on the rate-pitch theory in electric hearing. However, how to encode and deliver the tonal information such as F0 by changing electric-stimulus rate has not got further study in clinical electric-stimulus mode. The present paper focuses on this matter by piecewise calculating the appreciable electric-stimulus rates. Then an electric-stimulus encoding algorithm of Mandarin tone is brought forward and testified through acoustic simulations. Such conclusion can be drawn that this algorithm of electric-stimulus rate could convey tonal information well and help to enhance the Mandarin speech recognition ability. 相似文献

20.

汉语连续语音三字词声调提取方法研究 总被引：1，自引：1，他引：0

钟金宏杨善林张学应《合肥工业大学学报(自然科学版)》2000,23(5):710-714

连续的汉语三字词声调,由于受声道响应、音联、协同发音和变调规律等的影响,情况很复杂,故其基音提取远远较孤立字困难.文章简述了简化的自相关算法,分析了削波电平值对三字词基频检测的影响,得出了削波电平的取值范围,提出了对三字词基频检测应采取改变削波电平的观点,进而给出了三字词的基音提取方法.实验表明该方法简便、有效,提取成功率高.文章最后根据实验简述了三字词的变调规律和声调模式. 相似文献