排序方式: 共有117条查询结果,搜索用时 15 毫秒
1.
声学事件是指一段单一完整并能够引起人们感知注意的短时连续声音信号,而声学事件检测是指对这些声学事件进行识别。随着便携式摄像机与视频网站的迅猛发展,基于内容的声学事件检测在各领域的应用日趋广泛,例如个性化多媒体搜索、数字图书馆、网络管理与信息安全等。近年来,尽管研究者们提出了很多声学事件检测方法,但是由于采集设备、采集环境与传输条件等的千差万别,新环境下的音频数据日趋繁杂,使得类内数据差异较大且类间数据易混,从而导致传统识别方法的性能急剧下降,因此迫切需要研究当前环境下的鲁棒声学事件检测方法。 相似文献
2.
本文提出了一种基于加权Mel滤波器组的声学特征提取方法。该方法通过提取音频信号中的共振峰信息,使用动态自适应方法对中高频部分的Mel滤波器组进行加权,从而模仿人耳覆膜的频率选择映射。相比较于传统的MFCC特征,更适用于行车噪声环境下的快速声学事件检测任务;弥补了传统的Mel滤波器组高频部分分辨率低,从而导致对噪声鲁棒性较差的问题。实验结果表明:在信噪比较低的行车环境中,该特征有助于提高声学事件的检出率。 相似文献
3.
在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求。文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提高辨识效率。研究利用类辨识信息估计置信度的方法,可尽早有效排除集外说话人。实验结果显示,文中方法可使辨识速度平均提高3。2倍,而闭集辨识错误率平均只有0。9%的增加。采用类辨识置信度进一步提高开集辨识速度,并且在保持集内错误率不变的情况下,使集外错误率相对下降5。1%。 相似文献
4.
5.
基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出了一种基于后验概率的索引方法,对向量空间模型进行改进,以音节和K步邻接音节对作为索引项,以它们在语音文档中的后验概率值作为索引项权重.检索实验表明,文中的方法更适用于基于音节Lattice的语音文档检索任务,各项改进都达到了预期效果. 相似文献
6.
一种PC机与TMS320C25信息交换的方法 总被引:1,自引:0,他引:1
TMS 320系列是超大规模数字信号处理器,中国科学院声学所为开发其应用曾分别制成了与PC机兼容的各种开发系统。这些产品都是由PC机与TMS 320数字信号处理板(DSPB)构成的主从式系统。PC机作为主系统,负责对DSPB进行数据加载,控制启停,监视执行,以及进行数据通讯等。DSPB作为从系统,具有自己的处理器(320)和存储器等资源。我们在工作中采用的是TMS 320 C 25 A型开发板(以下简称为320板),它有16 K字的程序存储器和32K字的数据存储器。这些存储器又分别分为片内、片外存储器。 相似文献
7.
TMS320C50是美国TI公司生产的第五代定点数字信号处理器,由于其特殊的结构设计,非常适合于实时高速运算。本文介绍分析TMS320C50的结构特点,并对其性能做出评价。 相似文献
8.
传统的语音端点检测方法在低信噪比或不稳定噪声环境下可靠性会急剧下降。提出了一种具有在线自学习能力的语音端点检测方法。采用聚类和散度(divergence)结合的无监督学习方法来获得初始模型。此方法的最大优点是初始模型的获取不需要任何先验知识,并且模型可在线自动更新以适应环境的变化。在Auraro2数据库上的检测实验显示,与基于能量门限判决的检测方法相比,提出的方法使噪声下的检测性能有了明显提高。 相似文献
9.
10.
音频场景分析技术对机器自动感知环境特征具有重要的意义。考虑到Mel频率倒谱系数MFCC(Melfrequen-cycepstralcoefficient)在一定程度上可以模拟人耳的听觉感知特性,因此,提出用MFCC作为音频识别特征,通过隐马尔可夫模型进行音频场景分析的方法,该方法对7种典型场景的识别率在90%以上。 相似文献