首页 | 官方网站   微博 | 高级检索  
     

基于长时平均频谱的"文本无关"话者识别
引用本文:王宏,向大威.基于长时平均频谱的"文本无关"话者识别[J].声学技术,2002,21(1):59-62.
作者姓名:王宏  向大威
作者单位:1. 南京航空航天大学电子系,南京,210016
2. 中国科学院东海研究站,上海,200032
摘    要:文章在动窗离散傅立叶变换为基础获取说话人的长时平均频谱(即短时频谱的长时平均),然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关”话者识别的语音特征。分析之前,语音样本经过频域预知权和时域汉明窗加权处理,并利用帧能量门限自动去除了样本中的寂静段。通过在小人群范围内对该方法的大量实验,得到很好的话者识别效果。另外,作为“文本无关”话者识别的一个重要辅助手段,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图,它们能清晰地给出话者语音的时变频率特征。

关 键 词:说话人识别  文本无关  长时平均频谱  三维语图  时变频率特征  语音识别  信号处理
文章编号:1000-3630(2002)0102-0059-04
修稿时间:2000年8月16日

Text-independent speaker identification based on long-term average spectrums
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号