共查询到19条相似文献,搜索用时 85 毫秒
1.
提出一种噪声下的多数据流子带语音识别方法。传统的子带特征方法虽然能提高噪声下的语音识别性能,但通常会使无噪声情况下的识别性能下降。新方法提取感知线性预测(PLP)特征和子带特征,分别进行识别,然后在识别概率层将两者相结合。通过E-Set在NoiseX92下的白噪声的识别实验表明,新方法不仅具有更好的抗噪性能,而且同时能提高无噪声情况下的识别性能。 相似文献
2.
基于语音帧检测和子带谱跟踪的噪声估计算法 总被引:1,自引:0,他引:1
针对传统基于最小统计和递归平均的噪声估计算法存在较长时间延迟的问题,提出一种快速跟踪的噪声估计算法,将语音活性检测应用于子带谱跟踪来估计非稳定噪声的功率谱。仿真结果表明,该算法保证了噪声估计的精确性,当噪声为非稳定时,相比其他算法其跟踪速度更快。 相似文献
3.
4.
5.
基于子带GMM-UBM的广播语音多语种识别 总被引:2,自引:0,他引:2
提出了一种基于概率统计模型的与语言内容无关的语种识别方法,它不需要掌握各语种的专业语言学知识就可以实现几十种语言的语种识别;并针对广播语音噪声干扰大的特点,采用GMM-UBM模型作为语种模型,提高了系统的噪声鲁棒性;由于广播语音的背景噪声不是简单的全频带加性白噪声,因此本文构建了一种基于子带GMM-UBM模型的多子系统结构的语种识别系统,后端采用神经网络进行系统级融合。本文通过对37种语言及方言的识别实验,证明了子带GMM-UBM方法的有效性。 相似文献
6.
提出了一种基于X^2分布的子带噪声估计方法。带噪语音信号在临界带进行分解,并且假设子带信号服从X^2分布,然后在各个子带,采用基于X^2分布的改进最小统计量控制递归平均方法进行噪声估计。与传统的改进最小统计量控制递归平均噪声估计相比,该子带噪声估计方法可以利用人耳感知特性,并大大减少计算量。实验结果表明,提出的方法具有较好的噪声跟踪能力和较小的计算需求。采用该噪声估计的语音增强系统具有更强的噪声抑制性能和较好的增强语音信号质量。 相似文献
7.
语音识别中的噪声抑制方法 总被引:1,自引:1,他引:0
1.引言 当前有很多语音识别系统和产品,但绝大部分是工作衣安静环境下的,一旦在噪环境下使用,语音信号中混人严重的背景噪声,信噪比就大为下降,影响了参数的稳定性,而通常采用的语音特征在 相似文献
8.
9.
10.
11.
文章提出了一种抗噪声的语音特征。首先让语音信号的功率谱通过一组带通滤波器,再计算各滤波器输出的差分值。理论分析和实验一致证明,以此作为语音信号的特征,可以大幅度提高语音识别系统在噪声环境中的性能。 相似文献
12.
环境噪声对语音分布和语音识别性能影响的人工模拟分析 总被引:1,自引:0,他引:1
语音识别技术已经取得了很大的成就,然而目前绝大多数识别系统的仍色局限于在安静的环境下使用。实际环境中的背景噪声和传输通道变化所引起的畸变严重影响了语音识别系统的性能。本文分析和讨论环境声对语音信号以及语音识别性能生的影响。 相似文献
13.
14.
韩纪庆 《计算机工程与应用》2002,38(1):69-70,77
众所周知,训练和测试环境的不同严重影响了语音识别系统的性能。该文提出了一种新的测试环境自适应的方法,它能在测试进行过程中逐步地学得环境特征,而不需要事先获得测试环境的样本数据,从而改变了语音识别系统性能。 相似文献
15.
一种基于调制谱特征的带噪语音识别方法 总被引:1,自引:0,他引:1
在语音识别过程中,提取语音特征参数是重要的步骤之一。为了提高整个识别系统的性能,要求所选语音参数应具有较好的鲁棒性。文章在时频分析理论基础上,设计了一种基于语音调制谱的特征参数。这种参数利用了语音调制谱的时频集聚性并通过对语音调制谱作适当的滤波及归一化处理以削弱其对加性噪声和通道失真等干扰的敏感性。实验结果表明,该参数在提高语音识别系统的的抗噪性方面有明显的贡献。 相似文献
16.
SOM结合MLP的神经网络语音识别系统 总被引:2,自引:0,他引:2
提出一种结合自组织特征映射(Self-organizingFea-tureMap,SOM)和多层感知器(MultilayerPerceptron,MLP)的神经网络语音识别系统,该系统有较好的识别效果 相似文献
17.
针对声音突发特征(笑声、哭声、叹息声等,称之为功能性副语言)携带大量情感信息,而包含这类突发特征的语句由于特征突发性的干扰整体情感识别率不高的问题,提出了融合功能性副语言的语音情感识别方法。该方法首先对待识别语句进行功能性副语言自动检测,根据检测结果将功能性副语言从语句中分离,从而得到较为纯净的两类信号:功能性副语言信号和传统语音信号,最后将两类信号的情感信息使用自适应权重融合方法进行融合,从而达到提高待识别语句情感识别率和系统鲁棒性的目的。在包含6种功能性副语言和6种典型情感的情感语料库上的实验表明:该方法在与人无关的情况下得到的情感平均识别率为67.41%,比线性加权融合、Dempster-Shafer(DS)证据理论、贝叶斯融合方法分别提高了4.2%、2.8%和2.4%,比融合前平均识别率提高了8.08%,该方法针对非特定人语音情感识别具有较好的鲁棒性及识别准确率。 相似文献
18.
基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现.针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法.该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变.这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法. 相似文献
19.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 相似文献