期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于加权巴克谱失真的语音质量客观评价算法 总被引：1，自引：0，他引：1

孙新建邹霞曹铁勇张雄伟赵汉武《数据采集与处理》2006,21(3):302-306

提出了一种基于加权巴克谱失真（WBSD）的语音质量客观评价算法。鉴于不同巴克带谱失真对语音质量的影响程度不同，该算法提出在巴克域中对不同巴克带谱失真进行加权来求失真语音的客观失真测度。并且通过分析改进型巴克谱失真测度（MBSD）中15个巴克带失真与平均意见分（MOS）间的相关度，提出了一组以相关系数幂次方为权重的有效巴克谱失真权重矢量。实验结果表明：与MBSD算法相比，WBSD在算法复杂度没有明显增加的情况下与MOS的相关度提高了3％。相似文献

2.

基于Gammatone滤波器组的客观语音质量评估

李庆先卞昕刘良江朱宪宇周鑫《计算技术与自动化》2016,(3):76-80

语音质量是评价通信系统的一项重要指标。现有的语音质量感知评估算法采用基于Bark谱的感知模型,其算法复杂度较大,并且对于人耳的频率选择性的模拟存在不足。针对这一问题,本文提出一种新的客观语音质量评估方法,采用更加符合人耳听觉特性的Gammatone滤波器组提取特征参数,计算原始语音与失真语音的平均失真距离,并由主观平均意见分值和归一化平均失真距离之间的映射关系求出客观平均意见分值。实验表明,与感知评估方法相比,本文所提出算法的计算复杂度大大降低,同时保持了客观平均意见分值与主观平均意见分值之间的高相关度。相似文献

3.

面罩语音质量评价算法适用性研究

王霞马俊晖王光艳张艳《计算机工程与应用》2017,53(19):114-117

针对语音编码的音质评价算法性能已十分明确,但对于面罩语音不一定适用。讨论了语音质量评价算法对空气语音与面罩语音在不同噪声环境下的适用性。采用主观意见得分和三种客观评价测度对多种信噪比的带噪语音和增强语音进行评价,包括分段信噪比、改进的巴克谱失真（MBSD）和语音感知质量评价（PESQ）,根据与主观评价的一致性判断客观评价方法的适用性。增强算法采用维纳滤波法和对数谱最小均方误差法（LSA-MMSE）,噪声采用粉红噪声、海浪噪声。仿真结果表明,语音质量评价算法的适用性与语音类型、信噪比、背景噪声、增强算法种类有关。粉红噪声环境下,PESQ不适合评价经维纳滤波增强的空气语音;MBSD算法只适用于评价经LSA-MMSE增强的面罩语音。海浪噪声环境下,PESQ适用于评价面罩语音,MBSD不适合评价面罩语音。相似文献

4.

基于新阈值函数和自适应阈值的小波包语音增强研究

刘冲冲邹翔周正仙《计算机应用研究》2017,34(11)

针对传统的小波包语音增强算法增强后的语音失真严重的问题,本文提出了一种基于自适应阈值和新阈值函数的小波包语音增强算法。该算法在小波包域将带噪语音加窗分帧,基于相邻帧快速傅立叶变换功率谱的互相关值,计算各帧存在语音的概率,然后通过语音存在概率对传统通用小波包阈值进行调整,使得阈值在非语音帧中较大,在语音帧中较小,实现阈值的自适应调整,可以在最大程度消除噪声的同时,尽可能的保留语音,减小语音失真。本文还设计了一种新阈值函数,克服了传统硬阈值函数不连续和软阈值函数会带来恒定偏差的缺点,进一步减小了语音失真。本文采用TIMIT 数据库和NOISEX-92 数据库中的语音和噪声进行了大量的模拟实验,主观评比和客观评比结果均证明本文提出的语音增强算法比现有的两种算法有更好的增强效果,采用本文算法增强后的语音失真更小,听觉效果更好。相似文献

5.

拉普拉斯分布下的MMSE谱减语音增强算法

王永彪张文喜王亚慧孔新新吕彤《计算机应用》2020,40(3):878-882

针对基于高斯分布的谱减语音增强算法,增强语音出现噪声残留和语音失真的问题,提出了基于拉普拉斯分布的最小均方误差（MMSE）谱减算法。首先,对原始带噪语音信号进行分帧、加窗处理,并对处理后每帧的信号进行傅里叶变换,得到短时语音的离散傅里叶变换（DFT）系数;然后,通过计算每一帧的对数谱能量及谱平坦度,进行噪声帧检测,更新噪声估计;其次,基于语音DFT系数服从拉普拉斯分布的假设,在最小均方误差准则下,求解最佳谱减系数,使用该系数进行谱减,得到增强信号谱;最后,对增强信号谱进行傅里叶逆变换、组帧,得到增强语音。实验结果表明,使用所提算法增强的语音信噪比（SNR）平均提高了4.3 dB,与过减法相比,有2 dB的提升;在语音质量感知评估（PESQ）得分方面,与过减法相比,所提算法平均得分有10%的提高。该算法有更好的噪声抑制能力和较小的语音失真,在SNR和PESQ评价标准上有较大提升。相似文献

6.

改进相位谱补偿的语音增强方法

下载免费PDF全文

吉慧芳贾海蓉王雁《计算机工程与应用》2019,55(8):48-52

针对传统单通道语音增强方法中用带噪语音相位代替纯净语音相位重建时域信号，使得语音主观感知质量改善受限的情况，提出了一种改进相位谱补偿的语音增强算法。该算法提出了基于每帧语音输入信噪比的Sigmoid型相位谱补偿函数，能够根据噪声的变化来灵活地对带噪语音的相位谱进行补偿；结合改进DD的先验信噪比估计与语音存在概率算法（SPP）来估计噪声功率谱；在维纳滤波中结合新的语音存在概率噪声功率谱估计与相位谱补偿来提高语音的增强效果。相比传统相位谱补偿（PSC）算法而言，改进算法可以有效抑制音频信号中的各类噪声，同时增强语音信号感知质量，提升语音的可懂度。相似文献

7.

非平稳噪声环境下结合听觉掩蔽的语音增强

张勇刘轶《计算机工程与设计》2015,(5)

针对现有语音增强算法面临残留噪声这一问题,提出一种结合人耳听觉掩蔽的改进算法。将MMSE-LSA谱估计法和一种最优感知增强滤波器融入一个两极语音增强算法框架,利用人耳听觉掩蔽去除残留噪声;给出算法实施的具体步骤和最优感知滤波器的理论推导。实验结果表明,在非平稳噪声环境下,该算法可以有效降低语音失真和残余噪声,提升增强语音信号的主观和客观质量。相似文献

8.

一种改进的语音质量感知评估算法

下载免费PDF全文

黄石磊刘轶程刚《计算机工程》2012,38(18):19-21

为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静音具有不同的特性。实验结果表明,该算法能在窄带语音上提高PESQ得分与主观平均意见分的相关性。相似文献

9.

改进增益函数的MMSE语音增强算法

余建潮张瑞林《计算机工程与设计》2010,31(14)

讨论了基于语音短时对数谱最小均方误差(MMSE-STSA)的语音增强算法,将先验信噪比估计引入增益函数的计算中,有效消除噪声.在带噪信号模型中引入语音存在的不确定度,估计出每个频点的先验无声概率,对增益函数进行改进.通过客观与主观两种评价方法将改进算法与小波变换算法和MMSE估计算法进行比较,实验结果表明,改进算法能更好地抑制背景噪声并且使增强后的语音有较小的失真,增加语音清晰度和理解度. 相似文献

10.

改进相关统计模型的语音增强算法

杨化斌余永林《计算机工程与设计》2009,30(9)

语音和噪声的时频相关特性研究表明,"音乐噪声"区别于语音的一个重要特征是"音乐噪声"谱时频不相关.根据这一特点,在传统先验信噪比估计相关统计模型基础上给出了两点相关性补充假设.在此基础上,通过改进对数谱最小均方误差语音增强(LSA-MMSE)算法中的D-D先验信噪比估计,提出了改进对数谱最小均方误差语音增强算法.仿真实验采用了主观综合评分测度(MOS)和MBSD两种评价机制,实验结果表明,新模型和算法可以有效地抑制"音乐噪声"现象. 相似文献

11.

基于改进谱平滑策略的IMCRA算法及其语音增强

张建伟陶亮周健王华彬《计算机工程与应用》2017,53(1):153-157

噪声谱估计算法在单通道语音增强方法中起着重要作用,为了改善噪声谱估计算法对噪声的估计和更新能力,结合最小统计（MS）算法,对改进的基于控制的递归平均（IMCRA）噪声谱估计算法的递归平均参数进行改进,并用一阶递归的方式对平滑功率谱的最小值进行改进。采用谱减法对含噪语音信号作去噪处理,从客观和主观两方面对不同算法的性能进行评价,对比分析不同噪声不同信噪比下增强前后语音的分段信噪比（segSNR）、PESQ得分、MOS得分。实验结果表明,提出的方法能够更好地跟踪噪声信号变化,改善语音质量。相似文献

12.

Bark子带小波包自适应阈值语音去噪方法

田玉静左红伟董玉民魏德生《计算机应用》2010,30(11):3111-3114

为了克服低信噪比输入下,语音增强造成清音弱分量损失,导致信号重构失真的问题,提出了一种新的语音增强方法。该方法采用小波包拟合语音感知模型的临界带,按子带能量对语音清浊音分离,然后对清音和浊音信号分别作8层和4层小波包分解,在阈值计算上采用Bark子带小波包自适应节点阈值算法,在Bark子带实时跟踪噪声水平,有效保护清音中高频弱分量,减少失真。通过与传统语音增强方法的仿真对比实验,证实该方法在低信噪比输入时,具有明显优势,输出信噪比高,语音失真度低。将该方法与谱减法相结合,进行语音二次增强,能进一步提高增强语音质量。相似文献

13.

A Multiresolution Model of Auditory Excitation Pattern and Its Application to Objective Evaluation of Perceived Speech Quality

《IEEE transactions on audio, speech, and language processing》2006,14(6):1912-1923

This paper proposes a multiresolution model of auditory excitation pattern and applies it to the problem of objective evaluation of subjective wideband speech quality. The model uses wavelet packet transform for time-frequency decomposition of the input signal. The selection of the wavelet packet tree is based on an optimality criterion formulated to minimize a cost function based on the critical band structure. The models of the different auditory phenomena are reformulated for the multiresolution framework. This includes the proposition of duration dependent outer and middle ear weighting, multiresolution spectral spreading, and multiresolution temporal smearing. As an application, the excitation pattern is used to define an objective measure of auditory distortion of a distorted speech signal compared to the undistorted one. The performance of this objective measure is evaluated with a database of various kinds of NOISEX-92 degraded wideband speech signals in predicting the subjective mean opinion score (MOS) and is compared with the fast Fourier transform (FFT)-based ITU-T PESQ P.862.2 algorithm. The proposed measure is found to achieve comparable correlation between subjective MOS and objective MOS as PESQ P.862.2, with a trend suggesting better correlation for the nonstationary degradations compared to the stationary ones. Further refinement of the measure for distortion types other than additive noise is anticipated. 相似文献

14.

基于Bark域噪声估计及掩蔽效应的语音增强 总被引：4，自引：3，他引：1

下载免费PDF全文

赵欢熊敏侯卫国《计算机工程》2009,35(12):261-263

针对非平稳环境下噪声估计和语音增强性能降低的特点,提出一种基于Bark域的快速自适应噪声谱估计算法。它基于听觉模型,将带噪信号变换到Bark域,并在Bark域内实现基于人耳掩蔽的语音增强。仿真实验表明该算法能充分利用Bark带内频带间的相关性,跟踪快变的背景噪声,提高语音增强性能,减少运算量和复杂度。相似文献

15.

Single-Ended Speech Quality Measurement Using Machine Learning Methods

《IEEE transactions on audio, speech, and language processing》2006,14(6):1935-1947

We describe a novel single-ended algorithm constructed from models of speech signals, including clean and degraded speech, and speech corrupted by multiplicative noise and temporal discontinuities. Machine learning methods are used to design the models, including Gaussian mixture models, support vector machines, and random forest classifiers. Estimates of the subjective mean opinion score (MOS) generated by the models are combined using hard or soft decisions generated by a classifier which has learned to match the input signal with the models. Test results show the algorithm outperforming ITU-T P.563, the current “state-of-art” standard single-ended algorithm. Employed in a distributed double-ended measurement configuration, the proposed algorithm is found to be more effective than P.563 in assessing the quality of noise reduction systems and can provide a functionality not available with P.862 PESQ, the current double-ended standard algorithm. 相似文献