首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 102 毫秒
1.
蒋学仕 《电讯技术》2021,61(8):1026-1033
针对传统能量熵的短时能量与子带谱熵容易受噪声环境影响,低信噪比下端点检测性能下降的问题,提出一种基于噪声估计的改进能量熵语音端点检测算法.首先对语音进行噪声估计并以此计算语音存在概率;然后利用估计的噪声能量修正短时能量,用语音存在概率作为加权系数优化子带谱熵,并将两者结合生成改进的能量熵;最后给出基于噪声估计的动态门限以及实时的端点检测策略.实验结果表明,在信噪比5 dB、0 dB的多种噪声环境中,基于噪声估计的改进能量熵端点检测算法相比传统能量熵算法与改进子带能谱比算法,检测正确率平均提升7%.  相似文献   

2.
在低信噪比环境下,为了提高语音端点检测的效果,提出了一种适应于低信噪比环境的语音端点检测方法。基于子带谱熵法,引入正参数对基本的谱熵法进行算法改进,得到改进后的子带谱熵法,通过增加预判环节选择合适的正参数,加大语音信号与噪声信号的区分度,进一步改善在低信噪比环境下算法的效果,得到新的语音端点检测算法。仿真实验表明,新的算法不仅快速高效,具有较强鲁棒性,而且适合在低信噪比环境中较准确的检测出语音端点。  相似文献   

3.
基于熵函数的语音端点检测算法研究   总被引:4,自引:0,他引:4  
本文在分析基本谱熵端点检测算法局限的基础上,引入基于二阶累积量的门限更新方法,加入短时能量参数,提出基于加权谱熵的检测方法;此外,引入特征空间能量熵定义,建立新的门限确定准则,提出基于特征空间能量熵的检测方法.通过对平稳高斯白噪声、M109坦克噪声和F16战斗机噪声这三种典型噪声环境下信噪比(SNR)从-5dB到20dB的带噪语音信号进行的仿真实验分析表明,所提两种方法能更为准确地检测到语音的端点.  相似文献   

4.
为了解决传统方法在强噪声环境下,语音检测性能急剧下降的缺陷,提高信号在低信噪比(0 db以下)语音端点检测的准确性,本文提出了一种将多窗谱估计谱减法和自适应子带能熵比相结合的检测算法.该算法利用增益因子可变的多窗谱估计谱减法对低信噪比信号进行降噪,提高其信号的信噪比,再将每帧信号分为若干个子带(其数量可自适应选择),提取每个子带能熵比参数进行端点检测.实验结果表明,当信噪比为-10 db时,信号检测准确性维持在95%左右.该方法能在低信噪比情况下,显著提高端点检测准确性和可靠性.  相似文献   

5.
基于子带能量累积变化的语音端点检测   总被引:1,自引:0,他引:1  
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。  相似文献   

6.
为提高低信噪比环境下语音端点检测算法性能不高的问题,提出将MFCC倒谱距离与对数能量结合进行端点检测.首先,对语音计算对数能量,然后计算改进的倒谱距离,将MFCC倒谱距离与对数能量融合,获得了一种新的语音参数,该参数能有效地提高低信噪比情况下语音与噪声的区别,对参数进行顺利滤波用于语音端点检测,采用自动更新的双阈值进行语音端判别.仿真实验表明,该算法具有较好的适用不同噪声,在低信噪比下依然能获得比较理想的端点检测效果.  相似文献   

7.
王辉  袁淑丹 《电声技术》2013,(11):40-44
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。  相似文献   

8.
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法.首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音.实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能.  相似文献   

9.
本文提出一种语音激活检测的改进算法。首先在传统噪声估计的基础上,用Bark子带代替了DFr频域变换,目的在于降低计算复杂度;其次将估计的噪声谱进行白化滤波,并运用于子带谱熵算法中的谱熵计算中。把谱熵值作为VAD算法提取的特征参数,通过门限设定与比较,得出最初的VAD判决结果。增加拖尾延迟保护机制得出最终的VAD判决结果。  相似文献   

10.
基于倒谱特征的带噪语音端点检测   总被引:44,自引:0,他引:44       下载免费PDF全文
胡光锐  韦晓东 《电子学报》2000,28(10):95-97
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测.  相似文献   

11.
一种基于噪声估计的语音激活检测算法   总被引:1,自引:0,他引:1  
针对当前语音激活检测算法在低信噪比和复杂噪声模型的环境下性能损失的问题,提出了一种基于噪声估计的语音激活检测算法,通过对背景噪声进行自适应估计,得到准确的信噪比门限,同时利用估计背景噪声对短时谱进行白化处理,从而使得谱熵判决准则得以适用于复杂噪声模型的环境。实验证明,算法在低信噪比和复杂噪声模型下性能优于G.729B和AMR中的语音激活检测算法。  相似文献   

12.
针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。  相似文献   

13.
柳燕  鲍长春 《信号处理》2006,22(1):57-60
本文提出了一种新的语音激活检测算法,这种方法基于竞争神经网络,主要应用了自组织特征映射网络并结合学习向量量化算法进行实现,并与其它神经网络算法进行了比较。该算法在多种噪声背景下具有较强的鲁棒性,仿真结果表明,这种基于竞争神经网络的算法优于ITU—T G.729B建议的算法。  相似文献   

14.
王文益  伊雪 《信号处理》2020,36(1):32-41
在非平稳环境下,由于时间递归平均噪声功率谱估计算法会出现跟踪延迟和估计误差等问题,本文采用一种新的方式对其核心部分语音存在概率(speech presence probability, spp)进行估计。利用时域特征能量与频域特征谱熵的比值能熵比作为新的特征来构建其与spp的正比关系,从而得到当前语音帧的spp估计值;然后用双平滑系数对该值进行平滑;最后结合时间递归平均算法得到估计的噪声功率谱。该算法充分利用语音帧频点的特征信息控制spp的估计值,以此自适应地跟踪噪声变化。实验结果表明:在地空通信环境下,该方法能够准确且连续地跟踪噪声功率谱、快速响应其变化。集成到语音增强系统后,可以提高语音质量,降低残留噪声。   相似文献   

15.
夏丙寅  鲍长春 《信号处理》2013,29(10):1336-1345
为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均 (MCRA) 方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平均幅度差函数进行话音活动性检测(VAD),而后结合噪声估计与功率谱最小值比例等辅助参数判定是否对噪声估计进行强制更新。ITU-T G. 160测试结果表明,噪声估计加速算法的引入未对噪声强度平稳情况下的语音增强算法性能产生影响,但显著降低了噪声强度突变时的收敛时间,并在很大程度上抑制了噪声估计收敛段中的音乐噪声。   相似文献   

16.
Traditionally, most of voice activity detection (VAD) methods are based on speech features such as spectrum, temporal energy, and periodicity. The robustness of these features plays a critical role on the performance of VAD. However, since these features are always directly generated from observed signal, the robustness of these features would be significantly degraded in non-stationary noise environments, especially at low level signal-to-noise ratio (SNR) condition. This paper proposes a kind of robust feature for VAD based on sparse representation with an optimized learned dictionary. To do so, a speech dictionary and a noise dictionary are first learned from speech corpus and noise corpus, respectively. Then an optimization algorithm is designed to reduce the mutual coherence between the two learned dictionaries. After that the proposed feature is generated from the optimized dictionary-based sparse representation, and a VAD method is derived from the proposed feature. The proposed method is evaluated over seven types of noise and four types of SNR level, experimental results show that the optimized dictionary is important for enhancing the robustness of the proposed method, and the proposed method performs well under non-stationary noise, especially at low level SNR condition.  相似文献   

17.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号