共查询到17条相似文献,搜索用时 250 毫秒
1.
基于语音存在概率和听觉掩蔽特性的语音增强算法 总被引:1,自引:0,他引:1
低信噪比下,谱减语音增强法中一直存在的去噪度、残留的音乐噪声和语音畸变度三者间均衡这一关键问题显得尤为突出。为降低噪声对语音通信的干扰,提出了一种适于低信噪比下的语音增强算法。在传统的谱减法基础上,根据噪声的听觉掩蔽阈值自适应调整减参数,利用语音存在概率,对语音、噪声信号估计,避免低信噪比下端点检测(VAD)的不准确,有更强的鲁棒性。对算法进行了客观和主观测试,结果表明:相对于传统的谱减法,在几乎不损伤语音清晰度的前提下该算法能更好地抑制残留噪声和背景噪声,特别是对低信噪比和非平稳噪声干扰的语音信号,效果更加明显。 相似文献
2.
针对传统谱减法存在的算法缺陷,提出一种基于联合最大后验概率的改进谱减法.传统谱减法通过获取带噪语音与噪声的幅度差值,并提取带噪语音的相位信息进行语音信号重建.该方法因为谱相减产生“音乐噪声”,并因为相位估计不准确,导致低信噪比下信号增强效果不理想.为此,引入多频带谱减法和相位估计,通过划分频谱,分别在子频带进行谱减法,有效降低“音乐噪声”的影响;同时构建基于最大后验概率的相位估计器,联合信号幅度函数和相位函数,通过多次交替迭代得到相位估值.实验结果表明,相对于传统谱减法,在低信噪比下该算法有效提高增强语音的质量感知和可懂度. 相似文献
3.
4.
5.
基于最小统计噪声估计的信号子空间语音增强 总被引:1,自引:0,他引:1
针对传统子空间方法中,采用语音活动检测(Voice activity detection,VAD)估计噪声的缺陷,提出了一种基于子空间域的最小统计噪声估计算法。噪声估计通过跟踪带噪语音协方差矩阵用每个特征向量上的特征值的最小值来获得,该方法不需要VAD明确区分语音段和噪声段,能够在整个信号期间实现噪声的连续估计和不断更新。实验结果表明,相对于传统的基于VAD的子空间方法,本文提出的算法对语音增强效果有非常显著的提高。 相似文献
6.
为提高MMSE-LSA语音增强算法在低信噪比下的语音增强效果,提出一种改进的MMSE-LSA算法。该算法采用非因果先验信噪比估计法来估计先验信噪比,并引入无语音概率的思想,对增益函数进行改进。实验结果表明,相比传统MMSE-LSA算法,改进算法能更好地抑制残留噪声,提高语音的信噪比,增强效果更好。 相似文献
7.
针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型;同时,为了适应语音信号的实时处理,降低了语音参数提取的复杂度,并对判决阈值提出改进,以保证语音信号帧间的相关性。在不同噪声环境下对改进算法进行性能测试并与自适应多速率编码(AMR)标准、国际电信联盟电信标准分局(ITU-T)的G.729B标准比较,测试结果表明,改进算法在实时语音信号处理中能够有效提高检测的准确率及噪声跟踪能力。 相似文献
8.
针对传统单通道语音增强方法中用带噪语音相位代替纯净语音相位重建时域信号,使得语音主观感知质量改善受限的情况,提出了一种改进相位谱补偿的语音增强算法。该算法提出了基于每帧语音输入信噪比的Sigmoid型相位谱补偿函数,能够根据噪声的变化来灵活地对带噪语音的相位谱进行补偿;结合改进DD的先验信噪比估计与语音存在概率算法(SPP)来估计噪声功率谱;在维纳滤波中结合新的语音存在概率噪声功率谱估计与相位谱补偿来提高语音的增强效果。相比传统相位谱补偿(PSC)算法而言,改进算法可以有效抑制音频信号中的各类噪声,同时增强语音信号感知质量,提升语音的可懂度。 相似文献
9.
单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针对此问题,提出一种基于计算听觉场景分析(CASA)的时频掩蔽估计与优化算法。首先,通过直接判决(DD)算法估计先验信噪比(SNR)并计算初始掩蔽;其次,利用噪声与带噪语音在Gammatone频带内的互相关(ICC)系数来计算噪声的存在概率,结合带噪语音能量谱得到新的噪声估计,减少原估计噪声中的过估成分;然后,利用优化算法对初始掩蔽进行迭代处理以减少其中因噪声过估而存在的误差并增加其中的目标语音成分,在满足条件后停止迭代并得到新的掩蔽;最后,利用新的掩蔽合成增强语音。实验结果表明在不同的背景噪声下,相比优化前,新的掩蔽使增强语音获得了较高的主观语音质量(PESQ)和语音可懂度(STOI)值,提升了语音听感与可懂度。 相似文献
10.
MCRA最小值递归平均算法对噪声的估计值较为准确,而且对一段话音内噪声功率谱的变化也能准确的追踪.但是面对噪声功率谱突然陡增这种情况,需要经过一段时间的自适应才能得到准确的噪声估计值,而在这个自适应期间,会留下较强的残留噪声,影响人的听感.本文在MCRA算法的基础上,引入一种利用最大对数似然比结合能零比的VAD (Voice activity Detection)辅助算法,得到一种改进型噪声估计算法.实验仿真结果也表明,改进的噪声估计算法在噪声估计速度方面优于MCRA算法. 相似文献
11.
非因果先验信噪比估计的LSA算法改进 总被引:1,自引:0,他引:1
对于大多数的语音增强算法,先验信噪比及背景噪音频谱估计的准确与否,对语音增强的效果影响至关重要.为此,在传统MMSE-LSA算法的基础上,提出一种基于非因果先验信噪比估计的LSA 改进算法,较好地弥补了传统 LSA 算法在先验信噪比上估计的不足,同时采用平滑系数动态更新噪音频谱值,使估计值能更好地跟踪噪音的变化.实验结... 相似文献
12.
DOA估计算法的一种修正MUSIC算法的研究 总被引:1,自引:0,他引:1
传统改进 MUSIC 算法通过对接收信号协方差矩阵作预处理,使信号协方差矩阵分解得到信号子空间与噪声子空间正交,从而降低噪声的影响。但当信号间隔很小时,随着信噪比的降低,传统改进MUSIC算法已无法分辨出信号。基于此问题提出的修正MUSIC算法在使信号子空间与噪声子空间正交的基础上,充分利用了噪声子空间及其特征值对噪声子空间的修正,进而构造谱峰搜索函数估计出信号。通过仿真实验,证实了在信噪比很低的情况下,信号间隔很小且存在相关信号时,修正MUSIC算法能准确地估计出传统改进MUSIC算法不能估计的信号。 相似文献
13.
该文提出了一种基于EEMD域统计模型的话音激活检测算法。算法首先利用总体平均经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)对带噪语音进行分解,得到信号的本征模式函数(Intrinsic Mode Function,IMF)分量,选择与原信号的相关性最高的两个分量相加组成主分量;然后对主分量进行频域分解,引入统计模型,求出EEMD域特征参数;最后利用噪声与语音的EEMD域特征参数的不同来进行语音激活检测。实验结果表明,在不同信噪比情况下,本文算法性能优于目前常用的 VAD算法,特别在噪声强度大时体现出明显的优势。 相似文献
14.
提出了一种基于EEMD域统计模型的话音激活检测算法。算法首先利用总体平均经验模态分解(Ensemble empirical mode decomposition,EEMD)对带噪语音进行分解,得到信号的本征模式函数(Intrinsicmode function,IMF)分量,选择与原信号的相关性最高的两个分量相加组成主分量;然后对主分量进行频域分解,引入统计模型,求出EEMD域特征参数;最后利用噪声与语音的EEMD域特征参数的不同来进行语音激活检测。实验结果表明,在不同信噪比情况下,本文算法性能优于目前常用的VAD算法,特别在噪声强度大时体现出明显的优势。 相似文献
15.
针对传统中值滤波算法比较运算量大、处理效率低、无法满足实时性的问题,以中值滤波原理为基础,对滤波排序算法和实现方案进行了研究,提出了一种基于System Generator的快速中值滤波算法。该算法通过两次行、列排序将3×3窗口中9个像素取中值简化为3个像素的排序运算,使得单窗口查找中值的比较次数由传统排序算法的36次最少降到了14次。结合System Generator系统建模工具,将处理速度提升到传统方法的近6倍,达到了快速抑制噪声的目的,满足了图像实时处理的要求。 相似文献
16.
17.
In last 10 years, several noise reduction (NR) algorithms have been proposed to be combined with the blind source separation techniques to separate speech and noise signals from blind noisy observations. More often, techniques use voice activity detector (VAD) systems for the optimal solution. In this paper, we propose a new backward blind source separation (BBSS) structure that uses the input correlation properties to provide: (i) high convergence rates and good tracking capabilities, since the acoustic environments imply long and time-variant noise paths, and (ii) low misalignment and robustness against different noise type variations and double-talk. The proposed algorithm has an automatic behavior to enhance noisy speech signals, and do not need any VAD systems to separate speech and noise signals. The obtained results in terms of several objective criteria show the good performance properties of the proposed algorithm in comparison with state-of-the-art algorithms. 相似文献