首页 | 官方网站   微博 | 高级检索  
     

语音库裁剪的一种不定长递阶聚类方法
引用本文:张巍,吴晓如,刘江,王仁华. 语音库裁剪的一种不定长递阶聚类方法[J]. 计算机学报, 2007, 30(11): 2017-2024
作者姓名:张巍  吴晓如  刘江  王仁华
作者单位:中国海洋大学计算机科学系,山东,青岛,266100;中国科学技术大学电子工程与信息科学系,合肥,230027;安徽中科大讯飞信息科技有限公司,合肥,230088;中国科学技术大学电子工程与信息科学系,合肥,230027
基金项目:国家自然科学基金 , 国家高技术研究发展计划(863计划)
摘    要:大量使用不定长是大语料库语音合成质量的一个重要保证,而语音库裁剪方法通常会导致不定长的损失.针对这一关键性问题,该文构建了NuClustering-VPA算法:对不同粒度的不定长变体进行聚类,根据高阶聚类结果调整低阶变体的聚类,使得低阶聚类中心有所偏向.NuClustering-VPA算法保留了最重要的不定长,从而有效减小了裁剪对不定长的破坏.测听实验表明,利用NuClustering-VPA算法,即使在语音库裁减率为39.63%时,合成自然度下降较小,仍然保持在较高的水平.这一技术已被应用在科大讯飞公司的实际语音产品中.

关 键 词:基于语料库的语音合成  语音库裁剪  语音库去冗余  可伸缩语音合成系统
修稿时间:2005-05-30

A Non-Uniform Clustering Synthesis Instances Pruning Approach for Corpus-Based TTS
ZHANG Wei,WU Xiao-Ru,LIU Jiang,WANG Ren-Hua. A Non-Uniform Clustering Synthesis Instances Pruning Approach for Corpus-Based TTS[J]. Chinese Journal of Computers, 2007, 30(11): 2017-2024
Authors:ZHANG Wei  WU Xiao-Ru  LIU Jiang  WANG Ren-Hua
Abstract:The employment of non-uniform does great help for Corpus-based TTS to synthesize high natural speech. But Tailoring TTS voice font, or pruning redundant synthesis instances, usually results in loss of non-uniform. In order to solve this problem, this paper proposes the algorithm named NuClustering-VPA. According to this algorithm, the high level non-uniforms containing same syllables are clustered to several centers, then the centers are projected to low level non-uniforms. Therefore, the centerrs projections can guide the clustering of low level nonuniforms. These series of processes avoid erasing or destroying those key non-uniforms for synthesis. In experiments, the naturalness scored by MOS does not severely degrade when reduction rate is above 39.63%. And this approach has been applied in software products of Ifytek Co. Ltd.
Keywords:Corpus-based TTS  Tailoring TTS voice font  pruning redundant synthesis instances  scalable TTS
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号