排序方式: 共有12条查询结果,搜索用时 15 毫秒
1.
2.
为了发现新闻故事中的关键说话人,用以提高多媒体检索效率,在说话人索引的基础上,提出了关键人发现方法:根据新闻故事中说话人的特点,基于说话人频率、说话人持续时间、平均每次说话人时长和说话人位置因子4个因素,综合定义了说话人关键度,用以判断说话人的重要性,把每个新闻故事中说话人关键度最大的人作为关键说话人.实验结果表明,该种算法可以找到故事中绝大部分的关键说话人,验证了该算法的有效性和可行性. 相似文献
3.
4.
本文提出了一种录音设备的建模和识别算法。在特征选择方面,考虑到音频段中的静音包含了与正常语音一样的设备信息,并且不受说话人、文本、情感等因素的影响,因此从静音段中提取出表征录音设备“机器指纹”的特征,并用谱减法去除其中的背景噪声。在识别模型方面,利用设备通用背景模型构建反对设备模型;在设备通用背景模型的基础上,利用少量的特定设备数据,通过MAP自适应算法获得相应录音设备的模型。最后通过归一化似然度得分对输入的特定录音设备的语音样本进行分类判决。实验结果表明,对于9种不同录音设备的平均正确识别率为87.42%,并考察了不同因素对本文算法的影响,验证了本文算法的有效性和可靠性。 相似文献
5.
目前说话人聚类时将说话人分割后的语音段作为初始类,直接对这些数量庞大语音段进行聚类的计算量非常大。为了降低说话人聚类时的计算量,提出一种面向说话人聚类的初始类生成方法。提取说话人分割后语音段的特征参数及特征参数的质心,结合层次聚类法和贝叶斯信息准则,对语音段进行具有宽松停止准则的“预聚类”,生成初始类。与直接对说话人分割后的语音段进行聚类的方法相比,该方法能在保持原有聚类性能的情况下,减少40.04%的计算时间;在允许聚类性能略有下降的情形下,减少60.03%以上的计算时间。 相似文献
6.
在C语言的学习中,算法的设计的实质就是建立问题求解的模型。要想让学生学好C语言,算法的教学就显得尤为重要。本文主要讲述如何进行算法的教学,使学生更好的掌握算法。 相似文献
7.
8.
基于谱稳定性特征的语音与笑声区分新方法 总被引:1,自引:0,他引:1
该文提出一种采用谱稳定性作为特征参数的区分语音与笑声的新方法.通过分析语音与笑声的谱稳定性参数的特性,发现前者明显小于后者,这表明谱稳定性可以作为区分语音与笑声的特征参数.比较了采用谱稳定性参数、Mel频率倒谱系数、感知线性预测和基音频率等特征参数在相同实验条件下区分语音与笑声的性能.实验结果表明:在特定人和非特定人情况下,采用谱稳定性作为特征参数区分语音与笑声的正确率分别为90.74%和73.63%,其区分能力优于其它特征参数. 相似文献
9.
10.
基于线性预测的数字语音参数估计 总被引:2,自引:0,他引:2
介绍了数字语音信号分析中的线性预测的基本原理。讨论了用线性预测估计基本语音参数的方法、并对实验仿真结果进行了分析,从实验分析结果可知:线性预测分析是一种估计精度较高、运算速度较快的语音参数估计方法。 相似文献