共查询到17条相似文献,搜索用时 102 毫秒
1.
针对传统能量熵的短时能量与子带谱熵容易受噪声环境影响,低信噪比下端点检测性能下降的问题,提出一种基于噪声估计的改进能量熵语音端点检测算法.首先对语音进行噪声估计并以此计算语音存在概率;然后利用估计的噪声能量修正短时能量,用语音存在概率作为加权系数优化子带谱熵,并将两者结合生成改进的能量熵;最后给出基于噪声估计的动态门限以及实时的端点检测策略.实验结果表明,在信噪比5 dB、0 dB的多种噪声环境中,基于噪声估计的改进能量熵端点检测算法相比传统能量熵算法与改进子带能谱比算法,检测正确率平均提升7%. 相似文献
2.
《电子技术与软件工程》2015,(1)
在低信噪比环境下,为了提高语音端点检测的效果,提出了一种适应于低信噪比环境的语音端点检测方法。基于子带谱熵法,引入正参数对基本的谱熵法进行算法改进,得到改进后的子带谱熵法,通过增加预判环节选择合适的正参数,加大语音信号与噪声信号的区分度,进一步改善在低信噪比环境下算法的效果,得到新的语音端点检测算法。仿真实验表明,新的算法不仅快速高效,具有较强鲁棒性,而且适合在低信噪比环境中较准确的检测出语音端点。 相似文献
3.
4.
5.
基于子带能量累积变化的语音端点检测 总被引:1,自引:0,他引:1
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。 相似文献
6.
7.
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。 相似文献
8.
9.
10.
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测. 相似文献
11.
12.
针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。 相似文献
13.
本文提出了一种新的语音激活检测算法,这种方法基于竞争神经网络,主要应用了自组织特征映射网络并结合学习向量量化算法进行实现,并与其它神经网络算法进行了比较。该算法在多种噪声背景下具有较强的鲁棒性,仿真结果表明,这种基于竞争神经网络的算法优于ITU—T G.729B建议的算法。 相似文献
14.
在非平稳环境下,由于时间递归平均噪声功率谱估计算法会出现跟踪延迟和估计误差等问题,本文采用一种新的方式对其核心部分语音存在概率(speech presence probability, spp)进行估计。利用时域特征能量与频域特征谱熵的比值能熵比作为新的特征来构建其与spp的正比关系,从而得到当前语音帧的spp估计值;然后用双平滑系数对该值进行平滑;最后结合时间递归平均算法得到估计的噪声功率谱。该算法充分利用语音帧频点的特征信息控制spp的估计值,以此自适应地跟踪噪声变化。实验结果表明:在地空通信环境下,该方法能够准确且连续地跟踪噪声功率谱、快速响应其变化。集成到语音增强系统后,可以提高语音质量,降低残留噪声。 相似文献
15.
为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均 (MCRA) 方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平均幅度差函数进行话音活动性检测(VAD),而后结合噪声估计与功率谱最小值比例等辅助参数判定是否对噪声估计进行强制更新。ITU-T G. 160测试结果表明,噪声估计加速算法的引入未对噪声强度平稳情况下的语音增强算法性能产生影响,但显著降低了噪声强度突变时的收敛时间,并在很大程度上抑制了噪声估计收敛段中的音乐噪声。 相似文献
16.
Datao You Jiqing Han Guibin Zheng Tieran Zheng Jie Li 《Circuits, Systems, and Signal Processing》2014,33(7):2267-2291
Traditionally, most of voice activity detection (VAD) methods are based on speech features such as spectrum, temporal energy, and periodicity. The robustness of these features plays a critical role on the performance of VAD. However, since these features are always directly generated from observed signal, the robustness of these features would be significantly degraded in non-stationary noise environments, especially at low level signal-to-noise ratio (SNR) condition. This paper proposes a kind of robust feature for VAD based on sparse representation with an optimized learned dictionary. To do so, a speech dictionary and a noise dictionary are first learned from speech corpus and noise corpus, respectively. Then an optimization algorithm is designed to reduce the mutual coherence between the two learned dictionaries. After that the proposed feature is generated from the optimized dictionary-based sparse representation, and a VAD method is derived from the proposed feature. The proposed method is evaluated over seven types of noise and four types of SNR level, experimental results show that the optimized dictionary is important for enhancing the robustness of the proposed method, and the proposed method performs well under non-stationary noise, especially at low level SNR condition. 相似文献