首页 | 官方网站   微博 | 高级检索  
     

基于基频的情感语音聚类的说话人识别方法
引用本文:李冬冬,吴朝晖,杨莹春. 基于基频的情感语音聚类的说话人识别方法[J]. 模式识别与人工智能, 2009, 22(1)
作者姓名:李冬冬  吴朝晖  杨莹春
作者单位:浙江大学,计算机科学与技术学院,杭州,310027
基金项目:国家杰出青年科学基金,国家自然科学基金,教育部新世纪优秀人才支持计划,国家高技术研究发展计划(863计划),教育部长江学者和创新团队发展计划,浙江省自然科学基金
摘    要:针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率.

关 键 词:情感语音  基频  情感聚类  说话人识别

Speaker Recognition Based 0n Pitch-Dependent Affective Speech Clustering
LI Dong-Dong,WU Zhao-Hui,YANG Ying-Chun. Speaker Recognition Based 0n Pitch-Dependent Affective Speech Clustering[J]. Pattern Recognition and Artificial Intelligence, 2009, 22(1)
Authors:LI Dong-Dong  WU Zhao-Hui  YANG Ying-Chun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号