说话人分割聚类研究进展 |
| |
引用本文: | 马勇,鲍长春.说话人分割聚类研究进展[J].信号处理,2013,29(9):1190-1199. |
| |
作者姓名: | 马勇 鲍长春 |
| |
作者单位: | 北京工业大学 电子信息与控制工程学院 语音与音频信号处理研究室 |
| |
基金项目: | 北京市教育委员会科技发展计划重点项目(KZ201110005005);国家自然科学基金资助项目(61072089) |
| |
摘 要: | 说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望。
|
关 键 词: | 说话人分割聚类 异步策略 同步策略 贝叶斯信息判决 |
收稿时间: | 2013-07-01 |
Advances in speaker segmentation and clustering |
| |
Affiliation: | Speech and Audio Signal Processing Lab, School of Electronic Information and Control Engineering, Beijing University of TechnologySchool of Physics and Electronic Engineering, Jiang Su Normal University |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《信号处理》浏览原始摘要信息 |
|
点击此处可从《信号处理》下载全文 |