基于基频的情感语音聚类的说话人识别方法 Speaker Recognition Based 0n Pitch-Dependent Affective Speech Clustering期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于基频的情感语音聚类的说话人识别方法

引用本文：	李冬冬,吴朝晖,杨莹春. 基于基频的情感语音聚类的说话人识别方法[J]. 模式识别与人工智能, 2009, 22(1)

作者姓名：	李冬冬吴朝晖杨莹春

作者单位：	浙江大学,计算机科学与技术学院,杭州,310027

基金项目：	国家杰出青年科学基金，国家自然科学基金，教育部新世纪优秀人才支持计划，国家高技术研究发展计划(863计划)，教育部长江学者和创新团队发展计划，浙江省自然科学基金

摘要：	针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率.
关键词：	情感语音基频情感聚类说话人识别
Speaker Recognition Based 0n Pitch-Dependent Affective Speech Clustering

LI Dong-Dong,WU Zhao-Hui,YANG Ying-Chun. Speaker Recognition Based 0n Pitch-Dependent Affective Speech Clustering[J]. Pattern Recognition and Artificial Intelligence, 2009, 22(1)

Authors:	LI Dong-Dong WU Zhao-Hui YANG Ying-Chun

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏