首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 20 毫秒
1.
为有效解决现有语音信号压缩算法基本没有考虑人耳听觉特性,所划分出的子带与人耳听觉特性相去甚远,语音质量不高的问题,提出了一种基于不完全小波包分解的语音数据压缩算法.该算法充分考虑语音信号的特点以及人耳听觉特性,利用小波包合理分割子带,在每个子带内进行编码,并采用优化目标函数,作为选择最优小波基的评价函数,使划分出的子带更符合人耳听觉特性.实例仿真计算表明,该方法能取得较高的压缩率,压缩后恢复的语音信号具有良好的清晰度和自然度.  相似文献   

2.
针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在幅度补偿支路上直接对信号的全频带进行处理,提取全频带信息。复数谱支路负责初步恢复干净语音的幅度和相位,同时,该支路上学到的子带中间特征会被特定的模块传递给幅度补偿支路进行补偿;幅度补偿支路上的输出会对复数谱支路上输出的幅度做进一步的补偿,达到恢复干净语音频谱的目的。实验结果表明,提出的模型在恢复语音质量和可懂度方面优于其他先进的单通道语音增强模型。  相似文献   

3.
提出了一种基于人类听觉系统的多频带非线性谱减法来进行语音增强。根据人耳听觉特性,将含噪语音信号分在24个临界频带内,由各频带的不同信噪比来确定对应的谱减参数值。实验结果证明,在相同实验条件下,与功率谱减法(PSS)、非线性谱减法(NSS)和传统多频带谱减法(MBSS)相比,该方法增强后的语音信号具有更高的输出信噪比;能更好地消除背景噪声,抑制残留噪声;增强后的语音具有更好的可懂度和清晰度。  相似文献   

4.
基于感知小波变换的语音增强方法研究   总被引:3,自引:1,他引:2  
在ERB尺度下构造的感知小波符合人耳对固有语音的频率感知特性,通过一种纯数学算法计算其参数,在听觉感知上可以近乎完美地使信号进行重构。首先采用感知小波对带噪语音进行分解,其次在语音信号的子带层次上用一种类似于软阈值的无穷阶可导的函数进行阈值处理,最后应用谱减法进行二次增强。实验表明,该算法使信噪比和PESQ得分都有较大提高,特别是在信噪比较高时,语音具有很好的清晰度和可懂度。  相似文献   

5.
提出一种符合人耳听觉感知的语音增强方法,使电子耳蜗能在噪声环境下获得准确的语音信息。利用Bark子波变换实现电子耳蜗中的语音处理,结合人耳听觉系统特性实现语音增强。使用根据人耳听觉掩蔽效应提出的自适应减参数。实验结果表明该算法在低信噪比情况下,信噪比可提高30 dB左右,更好地抑制了残留噪声和背景噪声,合成的语音具有较好清晰度和可懂度。  相似文献   

6.
维纳滤波算法是改善噪声环境下听障患者语音理解度的常用算法之一。针对传统维纳滤波算法噪声谱估计偏差大的问题,提出一种基于改进的多通道维纳滤波算法的助听器语音降噪算法。算法首先结合人耳听觉特性和助听器响度补偿的特点,将语音信号进行Gammatone分解为多路子带信号。然后在每个子带内用基于先验信噪比估计的维纳滤波器进行语音增强处理。最后通过综合子带信号,得到增强的语音。此外,为了改善维纳滤波算法噪声谱估计的问题,提出一种基于包络估计的语音活动检测算法,并用于改善维纳滤波性能。实验结果表明,与传统维纳滤波法相比,该方法能更有效地抑制残留噪声,提高语音可懂度,具有较高的实用价值。  相似文献   

7.
提出一种基于人类听觉特性的自适应小波滤波算法。该方法用听觉感知小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,将经听觉感知小波变换所分离出来的噪声成分作为自适应滤波器的输入。通过采用递推最小二乘算法从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声。结果表明,该方法能实现非平稳信号在同频段对噪声成分和有用信号的最佳估计,提高了语音的清晰度和可懂度。  相似文献   

8.
提出一种基于谱减法和听觉掩蔽效应的改进的卡尔曼滤波语音增强算法.引入基于谱减法的AR参数估计使卡尔曼算法降低了复杂度和计算量从而易于实现.用卡尔曼滤波滤除噪声的同时结合人耳听觉掩蔽特性设计一个后置感知滤波器,使得从卡尔曼滤波获得的估计误差低于人耳掩蔽阈值,在去噪和语音失真之间取较好的折中.仿真结果表明所提方法优于传统的卡尔曼滤波增强法,能够有效地减少语音失真,并且更符合人耳听觉特性,特别是在低信噪比的情况下,语音具有更好的清晰度和可懂度.  相似文献   

9.
基于临界频带及能量熵的语音端点检测   总被引:1,自引:0,他引:1  
张婷  何凌  黄华  刘肖珩 《计算机应用》2013,33(1):175-178
语音端点检测的准确性直接关系着语音识别、合成、增强等语音领域的准确性,为了提高语音端点检测的有效性,提出了一种基于临界频带及能量熵的语音端点检测算法。算法充分利用人耳听觉特性的频率分布,将含噪语音信号进行临界频带划分,并结合各频带内信号的能量熵值在语音段和噪声段的不同分布,实现不同背景噪声下语音端点检测。实验结果表明,提出的语音端点检测算法与传统的短时能量法相比,检测正确率平均高1.6个百分点。所提方法在不同噪声的低信噪比(SNR)环境下均能实现语音端点检测。  相似文献   

10.
针对现有的助听器语音增强算法在非平稳噪声环境下,残留大量背景噪声的同时还引入了“音乐噪声”,致使增强语音可懂度和信噪比不理想等问题。提出了一种基于噪声估计的二值掩蔽语音增强算法,该算法利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理。采用最小值控制递归平均(Minima-Controlled Recursive Averaging,MCRA)算法获得估计噪声和初步增强语音;将估计噪声和初步增强语音分别通过可以模拟人工耳蜗模型的gammatone滤波器组进行滤波处理,得到各自的时频表示形式;利用人耳的听觉掩蔽特性,计算含噪语音在时频域的二值掩蔽;利用二值掩蔽得到增强语音。实验结果表明:该算法很大程度上去除了谱减法引入的“音乐噪声”,与基于MCRA谱减法相比,增强语音的语言可懂度指数(Speech Intelligibility Index,SII)、主观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)和信噪比(Signal to Noise Ratio,SNR)都得到了提高。  相似文献   

11.
针对频域受限子空间语音增强在构造增强矩阵时,采用固定拉格朗日乘子,使得减小语音畸变和提高语音可懂度的过程中,有音乐噪声残留,提出一种变拉格朗日乘子的算法。利用听觉特性中较强的频率成分对噪声进行掩蔽,通过掩蔽阈值的频率域与子空间特征值之间的变换算法,用变量控制子空间拉格朗日乘子计算增益函数的对角矩阵。对比实验和试听结果表明,提出算法增强的语音信号不仅信噪比有较大提高,语音质量主观感知度也有明显改善。  相似文献   

12.
语音信号是一种典型的非平稳信号。为了分析语音的非平稳特性,提出一种基于经验模态分解(EMD)与递推最小二乘算法(RLS)自适应滤波器相结合的语音信号去噪预处理器,进一步提高语音信号的信噪比和可懂度。再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。  相似文献   

13.
一种Bark子波变换的电子耳蜗语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种Bark子波变换的电子耳蜗语音增强算法。该算法首先引入与人耳听觉系统更为适应的Bark子波变换来进行电子耳蜗CIS语音信号处理,然后在每个Bark通道中利用非线性谱减法对其进行语音增强,谱减法的参数由人耳隐蔽阈值来控制。结果表明:即使在低信噪比的情况下,信噪比也能提高16 dB左右,合成的语音对于电子耳蜗使用者具有较好的清晰度和可懂度。  相似文献   

14.
基于听觉掩蔽效应的MMSE语音增强算法   总被引:2,自引:2,他引:0       下载免费PDF全文
针对MMSE语音增强算法低信噪比时产生较大的语音畸变的缺点,提出了一种结合人耳听觉掩蔽效应的MMSE语音增强算法。该算法利用掩蔽阈值来调整MMSE算法中的增益值,使得增强后的语音信号残留噪声和语音畸变较小。通过计算机仿真对增强前后语音信号的信噪比分析以及主观试听表明:改进的MMSE语音增强算法不仅提高了语音信号的信噪比,而且减少了语音畸变,提高了语音的可懂度。  相似文献   

15.
胡峰松  曹孝玉 《计算机工程》2012,38(21):168-170,174
目前主流说话人特征参数在噪声环境中的鲁棒性较差。为此,提出一种可用于说话人识别的听觉倒谱特征系数。分析人耳听觉模型的工作机理,采用Gammatone滤波器组代替传统的三角滤波器组模拟人耳耳蜗的听觉模型,用指数压缩代替固定的对数压缩,模拟人耳听觉模型处理信号的非线性特性。在基于高斯混合模型分类器的识别算法下进行仿真实验,结果表明,该听觉特征具有比梅尔频率倒谱系数和线性预测倒谱系数更好的抗噪声能力。  相似文献   

16.
在Bark子波的构造的基础上,提出一种改进的Bark子波变换构造方法,即直接由临界带中心频率确定Bark子波的中心频率,保证了其通带和临界带的对应一致性,并与人耳的听觉系统十分吻合。采用Bark子波对带噪语音进行分解,在语音信号的子带层次上用一种类似于软阈值的无穷阶可导的函数进行阈值处理,并应用谱减法进行二次增强。仿真实验表明,构建Bark子波与增强算法使信噪比和PESQ得分都有较大提高,特别是在信噪比较高时,语音具有很好的清晰度和可懂度。  相似文献   

17.
语音增强的多频带处理技术日益受到重视,提出G_W联合算法,使用Gammatone滤波器组将含噪语音信号分解成若干个频带信号,通过改进的Wiener滤波技术对各个频带信号进行降噪,最后综合这若干频带,得到增强后的语音。实验结果表明,该方法能够更为有效地抑制宽带噪声,降低音乐噪声残留,获得较好的听觉舒适度,具有实用价值。  相似文献   

18.
提出了一种具有较高可懂度的基于子空间的语音增强算法.现有的多数语音增强算法无法有效提高增强后语音的可懂度,一个重要原因是这些算法均只使用最小均方误差来限制语音的畸变,却忽视了不同区域语音畸变对可懂度的影响存在较大差异.为了弥补这一缺陷,提出了借助先验信噪比和增益矩阵来判断语音畸变区域,通过改变增益矩阵将对可懂度影响较大的放大倍数大于6.02dB的畸变进行幅度谱限制.客观评价表明,该算法能提高增强后语音可懂度NCM评测值.主观试听结果表明,该算法确实提高了增强后语音的可懂度.  相似文献   

19.
对于开放型办公室语音掩蔽系统性能的评价,语言可懂度是很重要的一个方面,目前通常采取的客观评价方法是STI。将语音信号按一定时间帧长反转后得到的信号我们称为时间反转语音,时间反转语音已被作为有效掩蔽信号之一。虽然对于由平稳噪声掩蔽的语音信号,STI与主观理解的语言可懂度相关性很好。但研究发现STI不适用于估计由时间反转语音掩蔽的语音信号的语言可懂度。文章分析了STI、PESQ及mNCM客观评价方法并进行了实验,实验结果表明,PESQ及mNCM对于由反转语音掩蔽的语音信号仍能较好估计语言可懂度。文章根据客观评价结果,进一步比较了反转语音掩蔽算法的不同参数(反转帧长与信噪比)对于语言可懂度的影响。发现反转帧长的增加和信噪比的降低会导致较低的语言可懂度。  相似文献   

20.
语音可懂度是语音信号的一种重要属性,在归一化协方差评价方法(NCM)的基础之上,以相对均方根(RMS)为阈值对语音信号进行分割,对高于均方值的语音段和低于均方值的语音段进行了分段可懂度评估,同时,提出了一种新的可懂度评价模型,结合了这两种语音段对语音可懂度的相对贡献,共同评价语音的可懂度。实验结果表明,高均方语音段相对于低均方语音段对可懂度具有更高的贡献,利用新的模型将这两种语音段的评价结果进行重新结合,评价效果得到了显著提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号