首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
陈胜  徐岩 《电子质量》2014,(12):80-84
针对传统子空间语音增强算法中,因语音增强方法中去除噪声而出现的音乐噪声和失真问题,提出了一种人耳感知掩蔽效应的子空间语音增强算法,并结合频域到特征值域的变换,在Bark域内实现人耳的感知掩蔽效应的语音增强。实验结果表明,该算法在白噪声和有色噪声的背景下,与传统子空间语音增强算法相比,不仅提高了语音信号的信噪比,而且减少了语音失真和音乐噪声,提高了增强后语音的听觉质量。  相似文献   

2.
在利用深度学习方式进行语音分离的领域,常用卷积神经网络(RNN)循环神经网络进行语音分离,但是该网络模型在分离过程中存在梯度下降问题,分离结果不理想。针对该问题,该文利用长短时记忆网络(LSTM)进行信号分离探索,弥补了RNN网络的不足。多路人声信号分离较为复杂,现阶段所使用的分离方式多是基于频谱映射方式,没有有效利用语音信号空间信息。针对此问题,该文结合波束形成算法和LSTM网络提出了一种波束形成LSTM算法,在TIMIT语音库中随机选取3个说话人的声音文件,利用超指向波束形成算法得到3个不同方向上的波束,提取每一波束中频谱幅度特征,并构建神经网络预测掩蔽值,得到待分离语音信号频谱并重构时域信号,进而实现语音分离。该算法充分利用了语音信号空间特征和信号频域特征。通过实验验证了不同方向语音分离效果,在60°方向该算法与IBM-LSTM网络相比,客观语音质量评估(PESQ)提高了0.59,短时客观可懂(STOI)指标提高了0.06,信噪比(SNR)提高了1.13 dB,另外两个方向上,实验结果同样证明了该算法较IBM-LSTM算法和RNN算法具有更好的分离性能。  相似文献   

3.
提出了一种基于听觉掩蔽效应的语音增强算法。算法对含噪语音的增强包括谱减法语音增强和感知加权语音增强两个步骤,分别从客观和主观两方面来提高含噪语音的质量。在谱减法阶段考虑了语音和噪声谱的交叉项,有效地减少了增强语音中的残余噪声;在感知加权处理中充分利用了人耳的掩蔽效应,设计了感知加权滤波器,对谱减法增强后的语音进行滤波,进一步消除残余噪声。对算法进行了数值实验,实验结果表明该算法能有效提高含噪语音的质量,比传统的谱减法有较大改进。  相似文献   

4.
基于二进制小波变换和维纳滤波的语音降噪研究   总被引:3,自引:0,他引:3  
侯正风 《信号处理》2002,18(3):257-260
本文综合应用小波变换理论和维纳滤波技术,提出一种语音降噪算法,该算法不仅能够较好地提高信噪比,而且能够有效地抑制传统的维纳滤波所产生的音乐噪声。本文最后提供的实验结果表明,该算法对于受自噪声干扰的语音具有较好的降噪效果。  相似文献   

5.
讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。  相似文献   

6.
高质量鲁棒600BPS甚低速率语音编码算法   总被引:3,自引:0,他引:3  
邹霞  陈亮  张雄伟 《信号处理》2003,19(Z1):109-112
本文提出了一种600bps高质量鲁棒语音编码算法,该算法采用多帧参数分类联合矢量量化、动态比特分配、参数内插和参数相关预测等技术降低语音编码速率.为了提高算法的抗信道误码能力,算法采用了鲁棒的矢量量化.非正式主观试听表明该算法的合成语音质量优于传统的2.4kbps线性预测(LPC-l0e)语音编码算法,接近于2.4kbps的MELP,并且该算法在1%的随机误码信道条件下仍然具有良好的可懂度.  相似文献   

7.
基于一种改进的监督流形学习算法的语音情感识别   总被引:2,自引:0,他引:2  
为了有效提高语音情感识别的性能,需要对嵌入在高维声学特征空间的非线性流形上的语音特征数据作非线性降维处理。监督局部线性嵌入(SLLE)是一种典型的用于非线性降维的监督流形学习算法。该文针对SLLE存在的缺陷,提出一种能够增强低维嵌入数据的判别力,具备最优泛化能力的改进SLLE算法。利用该算法对包含韵律和音质特征的48维语音情感特征数据进行非线性降维,提取低维嵌入判别特征用于生气、高兴、悲伤和中性4类情感的识别。在自然情感语音数据库的实验结果表明,该算法仅利用较少的9维嵌入特征就取得了90.78%的最高正确识别率,比SLLE提高了15.65%。可见,该算法用于语音情感特征数据的非线性降维,可以较好地改善语音情感识别结果。  相似文献   

8.
根据传统的基于短时谱的维纳滤波算法,提出了一种改进方法,能有效地对噪声估计环节引入的偏差做修正,提高了整个语音增强系统的抑噪功效。运用MATLAB进行试验仿真,并与传统维纳滤波算法相比较,结果表明该算法能十分有效地滤除噪声,增强语音,同时对有效语音信号带来的失真也非常小,使语音信号的清晰度与可懂度同时得到了提高。  相似文献   

9.
由于传统特征波形内插语音编码算法对特征波形相位信息的忽略,以及对特征波形的整体对齐,往往造成语音高频谐波分量丢失,从而导致语音的噪声感。为了提高合成语音的质量,该文引入语音多带清浊音标志,并以此为依据对波形内插编码模型中的慢渐变波形和快渐变波形的相位谱进行估计,在语音合成时则对特征波形采取部分对齐的方法,最后提出了一种基于多带的2.4 kbit/s特征波形内插算法。与传统算法相比,新算法明显提高了语音的清晰度。与标准2.4 kbit/sMELP算法相比,该算法合成语音质量亦略显优势。  相似文献   

10.
一种基于感知滤波的语音去噪算法   总被引:3,自引:3,他引:0  
文中针对加性白噪声的环境下,通过在传统的Wiener滤波算法中引入人耳听觉感知特性及谱减算法,提出了一种新的基于感知滤波的语音去噪算法.该算法的关键是采用LPC分析得出的感知加权函数修正维纳滤波方程,使噪声谱分布随语音而变.不仅保持Wiener滤波算法的优点,而且降低噪声对纯净语音的影响.实验表明,该方法能更有效地抑制背景噪声,提高语音质量,且具有较低的计算复杂度.  相似文献   

11.
一种新的自适应语音增强系统   总被引:4,自引:0,他引:4  
针对自适应噪声对消(ANC)语音增强系统的性能高度依赖于参考信号的质量,任何原始语音信号泄漏到参考信号中,都会导致原始语音信号失真和噪声抵消性能恶化这一问题,本文提出一种对泄漏不敏感的附加随机噪声(ARN)自适应噪声对消语音增强系统。它通过在参考信号中加入一个低功率的宽带随机训练信号,然后用该训练信号作参考信号对噪声传输函数(NTF)进行自适应建模,并在使用自适应预测滤波器(APF)消除NTF自适应建模的语音信号干扰的同时,用补偿滤波器(CPF)来修正由APF引起的参考信号失真。计算机仿真表明,这种ARNANC语音增强系统在泄漏情况下能将原始语音信号从带噪语音信号中有效分离出来。  相似文献   

12.
建立了一种基于自组织神经网络的语音识别系统。对语音信号进行了预处理,提取了语音信号的线性预测系数、线性预测倒谱系数和Mel倒谱特征系数,建立了基于自组织神经网络的识别判决模型。深入分析和改进了自组织神经网络的分类聚类能力,通过加强训练和设定阈值函数的方法,有效地确定了边界神经元的归属,划分出了合理的输出模式类。验证了自组织神经网络适合于处理孤立词语音识别,并具有快速性和结构简单等特征。MATLAB仿真实验表明,语音识别率达到96%。  相似文献   

13.
张永生  李道本 《通信学报》1997,18(10):70-74
本文研究了对多径衰落信道的Volterra自适应预测。通过计算机模拟,分析比较了Voltera滤波器和一般线性横向滤波器的预测性能。结果表明,采用Voltera滤波器能够有效地提高预测的精度。同时,研究了信道预测在功率控制中的具体应用。  相似文献   

14.
For linear predictive coding (LPC) of speech, the speech waveform is modeled as the output of an all-pole filter. The waveform is divided into many short intervals (10–30 msec) during which the speech signal is assumed to be stationary. For each interval the constant coefficients of the all-pole filter are estimated by linear prediction by minimizing a squared prediction error criterion. This paper investigates a modification of LPC, called time-varying LPC, which can be used to analyze nonstationary speech signals. In this method, each coefficient of the all-pole filter is allowed to be time-varying by assuming it is a linear combination of a set of known time functions. The coefficients of the linear combination of functions are obtained by the same least squares error technique used by the LPC. Methods are developed for measuring and assessing the performance of time-varying LPC and results are given from the time-varying LPC analysis of both synthetic and real speech.  相似文献   

15.
Nonlinear adaptive prediction of nonstationary signals   总被引:3,自引:0,他引:3  
We describe a computationally efficient scheme for the nonlinear adaptive prediction of nonstationary signals whose generation is governed by a nonlinear dynamical mechanism. The complete predictor consists of two subsections. One performs a nonlinear mapping from the input space to an intermediate space with the aim of linearizing the input signal, and the other performs a linear mapping from the new space to the output space. The nonlinear subsection consists of a pipelined recurrent neural network (PRNN), and the linear section consists of a conventional tapped-delay-line (TDL) filter. The nonlinear adaptive predictor described is of general application. The dynamic behavior of the predictor is demonstrated for the case of a speech signal; for this application, it is shown that the nonlinear adaptive predictor outperforms the traditional linear adaptive scheme in a significant way  相似文献   

16.
为了进一步压缩比特率,在线性预测(LP)语音编码中使用了可变阶数方法。即根据当前语音帧的性质决定相应LP滤波器的阶数。但是,如果预测阶数太小,由于语音频谱的动态范围大,可能使LP分析不能够正确地匹配较高的共振峰。讨论了一个用于语音编码的频域技术,用以在浊音语音共振峰模型方面改善低阶数线性预测(LP)的性能。  相似文献   

17.
The performance of linear prediction of fullband and subband signals is described in terms of the respective prediction gain. The subband prediction gain is characterized in terms of the fullband signal power spectral density and the frequency response of the subband filters. For Gaussian fullband signals, the asymptotic subband prediction gain can never be larger than the asymptotic fullband prediction gain. Simulation results compare fixed and adaptive fullband and subband prediction gains for Gaussian sources and speech. For speech, the subband prediction gain can exceed the fullband prediction gain  相似文献   

18.
ANovelVoiceCoderAt4800BPS(HSEV)WangXiaofengANDZhaoEryuan(DepartmentofTelecomrnunicationEngineering,BeijingUniversityofPosts&T...  相似文献   

19.
A modified autocorrelation method of linear prediction is proposed for pitch-synchronous analysis of voiced speech. The method needs one full period of speech data for analysis and assumes periodic extension of the data. This method guarantees the stability of the estimated all-pole filter and is shown to perform better than the covariance and autocorrelation methods of linear prediction.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号