首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
基于概率加权平均的Mel子带特征重建算法   总被引:1,自引:0,他引:1  
罗宇  杜利民 《电子学报》2004,32(10):1738-1741
本文提出基于概率加权平均的Mel子带特征数据重建算法.该算法选择K个最优重建结果的概率加权平均作为被加性噪声掩蔽的语音特征分量的估计.实验结果表明,基于概率加权平均的语音特征数据重建算法降低了重建误差,减少了帧间突变现象,增强了Mel子带特征的帧间连续性,从而显著提高了语音识别系统对加性噪声的鲁棒性能.  相似文献   

2.
根据人耳的听觉感知特性,提出了一种基于子带滤波的优化语音增强方法。基于临界频带设计滤波器将输入信号分成若干子带,依据估计出的每个子带的短时信噪比来对相应子带的时域信号逐帧进行独立的自适应处理后再合成。语音增强性能评估结果表明,有效地去除背景噪声的同时还抑制了音乐噪声,减少了语音的听觉失真,提高了增强语音的可懂度。  相似文献   

3.
提出了一种平行子状态隐马尔可夫模型用作噪声鲁棒语音识别的声学模型。该模型融合了纯净语音和背景噪声信息,模型的每个状态包含平行关系的子状态。在此基础上,提出了两种用于平行子状态隐马尔可夫模型的识别解码策略——子状态最大似然解码和联合转移子状态最大似然解码。实验结果表明,声学模型及其解码策略在各种噪声下取得了良好鲁棒识别效果。  相似文献   

4.
语音感知是无人系统的重要组成部分,已有的工作大多集中于单个智能体的语音感知,受噪声、混响等因素的影响,性能存在上限。因此研究多智能体语音感知,通过多智能体自组织、相互协作,提高感知性能非常必要。假设每个智能体输出一个通道的语音流条件下,本文提出一种多智能体自组织语音系统,旨在综合利用所有通道提高感知性能;并进一步以语音识别为例,提出能处理大规模多智能体语音识别的通道选择方法。基于Sparsemax算子的端到端语音识别流注意机制,将带噪通道权重置零,使流注意力具备通道选择能力,但Sparsemax算子会将过多通道权重置零。本文提出Scaling Sparsemax算子,只将带噪较强的通道权重置零;同时提出了多层流注意力结构,有效降低了计算复杂度。在30个智能体的无人系统环境下,基于conformer架构的识别系统实验结果表明,在通道数失配的测试环境下,提出的Scaling Sparsemax在仿真数据集上的文字差错率(WER)相比Softmax降低30%以上,在半真实数据集上降低20%以上。  相似文献   

5.
王金明  张雄伟 《信号处理》2003,19(1):117-120
噪声鲁棒性是话者确认系统实用化的关键问题之一,本文设计了一种基于子带加权和GMM的话者确认系统,该系统将语音谱分为若干子带,采用基于短时能量分布的算法估计各子带噪声强度,并根据噪声强度来进行子带加权,最终生成具有更高鲁棒性的语音特征,语音识别模型采用简化的GMM.实验表明,上述方法能有效提高话者确认系统的性能,增强其噪声鲁棒性,而且在低噪声环境下,仍能保证系统性能不下降.  相似文献   

6.
蒋文建  韦岗 《电子学报》2001,29(Z1):1829-1832
本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能.  相似文献   

7.
噪声自适应的多数据流复合子带语音识别方法   总被引:3,自引:0,他引:3  
张军  韦岗 《电子与信息学报》2006,28(7):1183-1187
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。  相似文献   

8.
陈胜  徐岩 《电子质量》2014,(12):80-84
针对传统子空间语音增强算法中,因语音增强方法中去除噪声而出现的音乐噪声和失真问题,提出了一种人耳感知掩蔽效应的子空间语音增强算法,并结合频域到特征值域的变换,在Bark域内实现人耳的感知掩蔽效应的语音增强。实验结果表明,该算法在白噪声和有色噪声的背景下,与传统子空间语音增强算法相比,不仅提高了语音信号的信噪比,而且减少了语音失真和音乐噪声,提高了增强后语音的听觉质量。  相似文献   

9.
为了进一步提高低信噪比下语音激活检测(VAD)的准确率,该文提出一种基于子带双特征的自适应保留似然比鲁棒语音激活检测算法。算法采用子带归一化最大自相关函数与子带归一化平均过零率双重特征设置频率分量似然比的保留权值,同时利用已过去固定时长的VAD判决结果及对应的子带特征参数自适应地估计似然比的保留阈值。实验结果表明,此算法的VAD检测准确率相比原保留似然比算法在10 dB, 0 dB和-10 dB平稳白噪声下分别提高了1.2%, 7.2%和8.1%,在10 dB和0 dB非平稳Babble噪声下分别提高了1.6%和3.4%。当其被用于2.4 kbps低速率声码器系统时,合成语音的感知语音质量评价(PESQ)比原声码器系统在白噪声下提高了0.098~0.153,在Babble噪声下提高了0.157~0.186。  相似文献   

10.
噪声下差分复合子带语音识别方法   总被引:4,自引:0,他引:4  
蒋文建  韦岗 《通信学报》2002,23(1):18-24
本文根据子带特征反映语音信号局部特性和全带特征反映语音信号整体特性的事实,提出了 一种差分复合子带语音识别新方法。先用频谱差分减少噪声的干扰,再将多子带特征识别概率与全带特征识别概率相结合进行综合判决,以得到最终识别结果。将新方法应用于TIMIT数据包0-9十个英文数字和E-Set在NoiseX92的白噪声和F16战机噪声下的识别实验。实验结果表明新方法比传统方法识别性能有很大提高。  相似文献   

11.
基于子带能量累积变化的语音端点检测   总被引:1,自引:0,他引:1  
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。  相似文献   

12.
Wavelet transform has been found to be an effective tool for the time-frequency analysis of non-stationary and quasi-stationary signals. Recent years have seen wavelet transform being used for feature extraction in speech recognition applications. In the paper a sub-band feature extraction technique based on an admissible wavelet transform is proposed and the features are modified to make them robust to additive white Gaussian noise. The performance of this system is compared with the conventional mel frequency cepstral coefficients (MFCC) under various signal to noise ratios. The recognition performance based on the eight sub-band features is found to be superior under the noisy conditions compared with MFCC features.  相似文献   

13.
Wireless Personal Communications - In this paper, we propose novel sub-band spectral centroid weighted wavelet packet cepstral coefficients (W-WPCC) for robust speech emotion recognition. Wavelet...  相似文献   

14.
非线性统计匹配用于子带鲁棒语音识别   总被引:1,自引:0,他引:1  
由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性,根据各子带噪声特点采用统计匹配、MAP估计和HMM/MLP非线性映射来补偿噪声环境的影响。实验表明该算法明显改善了识别系统在噪声环境下的性能。  相似文献   

15.
基于鲁棒听觉特征的说话人识别   总被引:3,自引:0,他引:3       下载免费PDF全文
林琳  陈虹  陈建 《电子学报》2013,41(3):619-624
 为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数.  相似文献   

16.
训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。  相似文献   

17.
张志华  王炳锡  彭煊 《电声技术》2005,(5):52-54,69
给出一种新的话音检测方法,即在SNR算法的基础上,应用线性判别分析(LDA)对语音特征参数进行降维。在大噪声环境下,该方法提高了系统的稳健性。同时将这种新的方法与基于信噪比(SNR)和基于噪声/语音统计量(N&S STAT)的算法做了比较,实验表明该方法可以提高检测效率。  相似文献   

18.
并行子带HMM最大后验概率自适应非线性类估计算法   总被引:1,自引:0,他引:1  
目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化.本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性.本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降.实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号