排序方式: 共有112条查询结果,搜索用时 31 毫秒
1.
本文提出了一种基于加权Mel滤波器组的声学特征提取方法。该方法通过提取音频信号中的共振峰信息,使用动态自适应方法对中高频部分的Mel滤波器组进行加权,从而模仿人耳覆膜的频率选择映射。相比较于传统的MFCC特征,更适用于行车噪声环境下的快速声学事件检测任务;弥补了传统的Mel滤波器组高频部分分辨率低,从而导致对噪声鲁棒性较差的问题。实验结果表明:在信噪比较低的行车环境中,该特征有助于提高声学事件的检出率。 相似文献
2.
声学事件是指一段单一完整并能够引起人们感知注意的短时连续声音信号,而声学事件检测是指对这些声学事件进行识别。随着便携式摄像机与视频网站的迅猛发展,基于内容的声学事件检测在各领域的应用日趋广泛,例如个性化多媒体搜索、数字图书馆、网络管理与信息安全等。近年来,尽管研究者们提出了很多声学事件检测方法,但是由于采集设备、采集环境与传输条件等的千差万别,新环境下的音频数据日趋繁杂,使得类内数据差异较大且类间数据易混,从而导致传统识别方法的性能急剧下降,因此迫切需要研究当前环境下的鲁棒声学事件检测方法。 相似文献
3.
基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出了一种基于后验概率的索引方法,对向量空间模型进行改进,以音节和K步邻接音节对作为索引项,以它们在语音文档中的后验概率值作为索引项权重.检索实验表明,文中的方法更适用于基于音节Lattice的语音文档检索任务,各项改进都达到了预期效果. 相似文献
4.
5.
TMS320C50是美国TI公司生产的第五代定点数字信号处理器,由于其特殊的结构设计,非常适合于实时高速运算。本文介绍分析TMS320C50的结构特点,并对其性能做出评价。 相似文献
6.
一种PC机与TMS320C25信息交换的方法 总被引:1,自引:0,他引:1
TMS 320系列是超大规模数字信号处理器,中国科学院声学所为开发其应用曾分别制成了与PC机兼容的各种开发系统。这些产品都是由PC机与TMS 320数字信号处理板(DSPB)构成的主从式系统。PC机作为主系统,负责对DSPB进行数据加载,控制启停,监视执行,以及进行数据通讯等。DSPB作为从系统,具有自己的处理器(320)和存储器等资源。我们在工作中采用的是TMS 320 C 25 A型开发板(以下简称为320板),它有16 K字的程序存储器和32K字的数据存储器。这些存储器又分别分为片内、片外存储器。 相似文献
7.
基于HMM的汉语语音识别中,易混淆语音的识别率仍然不高.在分析HMM固有缺陷的基础上,本文提出一种使用SVM在HMM系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节,提高系统性能和效率.通过充分利用Viterbi解码获得的信息来构造新的分类特征,从而解决标准SVM难以处理可变长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和SVM识别器构造等问题.语音识别实验的结果显示,与采用HMM/SVM混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使识别率有明显提高.这表明所提出的具有置信估计环节的HMM/SVM两级结构用于易混淆语音识别是可行的. 相似文献
8.
应力影响下的变异语音是由于说话人受到重力加速度变化而产生的,与正常语音相比,变异语音频谱能量在频带范围内分布更加分散。把整个频带划分成8个子带,采用子带频谱能量的比值为特征,提出一种基于子空间方法的正常/变异语音分类方法。该方法采用CLAFIC方法设计初始向量子空间,并通过LSM算法对两类样本子空间按不同的旋转方式训练,用预分类的结果调整分类器的参数来改善分类器的性能。实验结果表明,该方法对应力影响下的变异语音与正常语音具有良好分类效果,平均分类正确率达到了95.9%。 相似文献
9.
韵律参数和频谱包络修改相结合的情感语音合成技术研究 总被引:1,自引:0,他引:1
情感语音合成可以增强合成语音的表现力、人情味,是近年来的新兴课题.除了韵律特征之外,音质类和发声器官类参数对情感语音的表达也有着至关重要的影响,而通常的研究大多都是基于规则或者预先为某种情感设计的滤波器来进行这两类参数的修改.本文提出了通过频谱包络综合地调整音质类和发声器官类参数来合成情感语音的方法,并通过实验验证了这一方法的有效性.另外,实验结果也显示了当韵律参数和频谱包络同时得到修改时,相对于单独修改某类参数可以获得更好的情感合成效果. 相似文献
10.
基于支持向量机的变异语音分类研究 总被引:6,自引:0,他引:6
变异语音的训练样本有限,采用传统的分类方法进行分类,效果不够理想,而支持向量机方法在有限样本情况下可以保持很好的分类推广能力.采用支持向量机方法进行变异语音分类,提取基频和TE0基频作为变异语音分类的特征,讨论了样本预处理和参数选择等问题.提出了直接截取和DTW规正两种方法来解决语音样本特征向量长度不一致的问题.基于TE0基频特征,采用指数径向基函数(ERBF)内核,对应力(G—force)影响下的变异语音进行分类,分类正确率可达到99.2%,比传统的贝叶斯分类器和HMM分类器,分类性能分别平均提高了12.6%和6.0%.实验结果表明,采用支持向量机方法进行变异语音分类是可行的. 相似文献