期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机应用与软件》2016,(5)

针对传统自适应小波包阈值算法增强的语音存在失真的问题,提出联合改进子空间的自适应小波包阈值语音增强算法。提出的新算法对带噪语音首先做KL变换(Karhunen Loeve Transform)得到其特征值,并用自适应小波包阈值算法对该特征值进行处理,以去除部分噪声子空间;接着用递归最小二乘算法(RLS)对噪声的特征值进行估计,修正传统子空间算法容易导致的特征值估计偏差问题;最后用经过自适应小波包阈值算法处理得到的新的特征值减去噪声特征值,以去除所有噪声子空间并由KL逆变换最终还原出纯净语音。仿真结果表明新算法相比传统自适应小波包阈值算法有更优的增强效果,减少了语音失真。并且在信噪比较低的情况下,新算法对增强的语音的信噪比和分段信噪比提高得更多。相似文献

2.

一种基于HHT的语音增强算法研究与仿真 总被引：1，自引：0，他引：1

汝振李昕陈飞杨李箭李翔《计算机技术与发展》2010,20(8):116-119

语音增强是语音识别、语音编码等语音分析系统中一个重要的环节,直接影响到语音信号的处理过程。回顾了语音增强算法的发展历程,提出一种基于希尔伯特黄（HHT）算法的语音增强算法。使用HHT对含噪语音进行EMD变换,得到各阶IMF分量和残差,对高频的IMF分量采用小波去噪的软阈值方法进行处理,把经过阈值处理的高频IMF和低频IMF相加,得到增强的语音信号。针对三种典型噪声（白噪声、babble噪声和volvo噪声）的降噪问题,应用HHT算法取得了良好的结果。相似文献

3.

基于仿生小波变换和自适应阈值的语音增强方法

杨玺樊晓平《控制与决策》2006,21(9):1033-1036

提出一种基于仿生小波变换以及自适应阈值的语音增强方法．含噪语音通过仿生小波变换后，针对不同的尺度采用不同的阈值函数进行去噪．由于在小波变换过程中考虑了人耳的听觉特性，所提出方法优于基本的小波语音增强方法．实验表明，该方法在多种噪声条件下均具有较好的语音增强效果．相似文献

4.

基于改进的小波阈值函数语音增强方法

董胡谭乔来《计算机系统应用》2015,24(8):160-164

传统的小波阈值去噪方法会造成有用语音信号的损失, 信噪比改善情况不理想. 通过分析小波去噪原理, 提出了一种改进的小波阈值函数语音增强方法. 该方法结合小波软、硬阈值函数去噪的优点, 克服了硬阈值函数的不连续及软阈值函数存在偏差的缺点. 该方法首先对清浊音信号进行判断, 接着采用变化的阈值对清浊音信号的小波系数进行不同的阈值处理. 仿真实验结果表明, 改进的方法非常适用于强噪声背景下的语音增强, 无论在保留含噪语音信号中的清音信息, 还是在信噪比改善指标上均优于传统的软阈值法、谱减法和听觉感知小波变换法. 相似文献

5.

基于小波变换的语音增强方法研究 总被引：4，自引：1，他引：3

下载免费PDF全文

董胡钱盛友《计算机工程与应用》2007,43(31):58-60

分析了小波去噪原理,根据随机噪声的小波变换系数在不同尺度上的传递特性和噪声信号奇异性与小波模极大值的关系,同时考虑到语音中浊音和清音的特点,提出了一种改进阈值的小波域语音增强方法。在阈值函数中引入参数,通过调整参数以获得最佳的小波系数的阈值估计,使得改进阈值介于硬阈值与软阈值之间。利用改进阈值对染噪语音信号的小波系数进行阈值处理,既抑制了噪声,又减少了语音段信息的损失。仿真结果表明,这是一种有效的语音增强方法。相似文献

6.

基于子带谱熵的仿生小波语音增强

刘艳倪万顺《计算机应用》2015,35(3):868-871

前端噪声处理直接关系着语音识别的准确性和稳定性,针对小波去噪算法所分离出的信号不是原始信号的最佳估计,提出一种基于子带谱熵的仿生小波变换(BWT)去噪算法。充分利用子带谱熵端点检测的精确性,区分含噪语音部分和噪声部分,实时更新仿生小波变换中的阈值,精确地区分出噪声信号小波系数,达到语音增强目的。实验结果表明,提出的基于子带谱熵的仿生小波语音增强方法与维纳滤波方法相比,信噪比(SNR)平均提高约8%,所提方法对噪声环境下语音信号有显著的增强效果。相似文献

7.

基于小波熵自适应阈值的语音信号去噪新方法

陈晓娟王文婷贾明超宋娜《计算机应用研究》2014,31(3):753-755

针对语音信号去噪问题, 提出小波熵自适应阈值去噪法。首先利用小波变换分解带噪语音信号, 计算小波分解后信号子带区间的小波熵, 然后将小波熵和自适应阈值相结合确定各层高频系数的阈值门限, 采用折中指数阈值函数对各层高频系数进行去噪处理, 重构降噪后的语音信号, 最后对比小波熵自适应阈值、极大极小阈值、固定阈值和无偏风险阈值去噪方法的性能。实验结果表明, 当输入信噪比为5 dB时, 小波熵自适应阈值去噪法的输出信噪比是最大的, 且其输入输出信噪比曲线高于其他三种阈值去噪法的输入输出信噪比曲线, 从而证实该算法具有更好的去噪性能。相似文献

8.

小波消噪和ICA在语音信号分离中的应用

下载免费PDF全文

王晓伟石林锁杨隆鲁秘《计算机工程与应用》2012,48(3):120-121

为了消除语音信号分离中仍存在的部分混叠声音,提出一种基于小波消噪和独立分量分析（ICA）结合的信号分离方法。该方法将小波变换和独立分量分析结合,利用小波变换的去噪作用,滤除原始语音信号中的噪声后作为ICA的输入信号,采用FastICA算法在小波域进行独立分量分析,对输入信号实施分离。实验结果表明,该方法大大调高了传统独立分量分析对语音信号的分离效果。相似文献

9.

二次离散小波变换的语音增强方法

下载免费PDF全文

孙浩袁慧梅《计算机工程与应用》2009,45(31):125-127

提出了一种基于二次离散小波变换（DWT）的语音增强算法。该算法首先对带噪语音信号进行离散小波变换,提取离散细节信号,并对其进行第二次离散小波变换。再按照不同的规则选取阈值,对信号进行去噪处理。最后再对出来后的语音信号进行合并。对比实验结果表明,该方法具有良好的消除噪声的效果,提高了语音的清晰度和可懂度。相似文献

10.

一种时间自适应阈值的小波包改进语音增强算法

田岚侯正信孙晋松《控制与决策》2009,24(6)

针对传统小波语音增强算法存在过度周值处理的问题,提出一种改进的时间自适应阈值小波包去噪算法.该方法采用听觉感知小波包对噪声语音进行分解,得到小波包听觉感知节点上的系数,并基于语音存在概率估计按帧自动调节去噪周值,因改进的闲值能更好地避免语音小波包系数被过度阈值处理的情况,从而在抑制噪声的同时保留了更多的原始语音成分,进一步提高了降噪效果,实验结果表明,该算法比常规小波自适应闻值算法能得到更清晰的语音增强信号. 相似文献

11.

基于GMM-UBM/SVM的维吾尔语电话语音监控系统

李晓阳伊·达瓦吾守尔·斯拉木勾坂芳典《计算机应用与软件》2012,(1):46-48,77

讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。相似文献

12.

基于GMM的说话人识别技术研究

下载免费PDF全文

曹洁潘鹏《计算机工程与应用》2011,47(11):114-117

为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。相似文献

13.

基于FPGA的关键词识别系统实现

下载免费PDF全文

阙大顺田犇赵永安《计算机工程与应用》2013,49(8):217-221

随着微电子技术的高速发展,基于片上系统SOC的关键词识别系统的研究已成为当前语音处理领域的研究热点和难点。运用Xilinx公司ViterxII Pro开发板作为硬件平台,结合ISE10.1集成开发环境,完成了语音帧输出、MFCC、VQ和HMM等子模块的设计;提出了一种语音帧压缩模块架构,有效实现了语音帧信息到VQ标号序列的压缩,实现了由语音帧压缩模块和HMM模块构建的FPGA关键词识别系统。仿真实验结果表明,该系统具有较高的识别率和实时性,为关键词识别系统的FPGA硬件电路的实现研究提供了实例。相似文献

14.

Comparison of the impact of some Minkowski metrics on VQ/GMM based speaker recognition

Cemal Hanilçi Figen Erta? 《Computers & Electrical Engineering》2011,37(1):41-56

This paper evaluates the impact of three special forms of the Minkowski metric (Euclidean, City Block, and Chebychev distances) on the performance of the conventional vector quantization (VQ) and Gaussian mixture model (GMM) based closed-set text-independent speaker recognition systems, in terms of recognition rate and confidence on decisions. For the VQ based system, evaluations are carried out using the two most common clustering algorithms, LBG and K-means, and it is revealed which clustering algorithm and distance pair should be used to exploit the best attribute of both to achieve the best recognition rate for a given codebook size. In the case of GMM based system, we introduce the metrics into the GMM using a concatenation of the LBG and K-means algorithms in estimating the initial mean vectors, to which the system performance is sensitive, and explore their impact on system performance. We also make comparison of results obtained from evaluations on clean speech (TIMIT) and telephone speech databases (NTIMIT and NIST2001) with the modern classifiers VQ-UBM and GMM-UBM. It is found that there are cases where conventional VQ based system outperforms the modern systems. Moreover, the impact of distance metrics on the performance of the conventional and modern systems depends on the recognition task imposed (verification/identification). 相似文献

15.

短语音噪声环境下说话人识别特征提取

高会贤马全福郑晓势《计算机应用》2010,30(10):2712-2714

为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率,基于矢量量化识别算法,对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC)的提取相结合,并将改进后的特征与谱质心特征进行了组合,建立了一种美尔频率小波变换系数+谱质心(MFWTC+SC)的新的组合特征参数。经实验表明,该组合特征可以有效地提高说话人识别系统的性能。相似文献

16.

Speaker recognition utilizing distributed DCT-II based Mel frequency cepstral coefficients and fuzzy vector quantization

M. Afzal Hossan Mark A. Gregory 《International Journal of Speech Technology》2013,16(1):103-113

In this paper, a new and novel Automatic Speaker Recognition (ASR) system is presented. The new ASR system includes novel feature extraction and vector classification steps utilizing distributed Discrete Cosine Transform (DCT-II) based Mel Frequency Cepstral Coefficients (MFCC) and Fuzzy Vector Quantization (FVQ). The ASR algorithm utilizes an approach based on MFCC to identify dynamic features that are used for Speaker Recognition (SR). A series of experiments were performed utilizing three different feature extraction methods: (1) conventional MFCC; (2) Delta-Delta MFCC (DDMFCC); and (3) DCT-II based DDMFCC. The experiments were then expanded to include four classifiers: (1) FVQ; (2) K-means Vector Quantization (VQ); (3) Linde, Buzo and Gray VQ; and (4) Gaussian Mixed Model (GMM). The combination of DCT-II based MFCC, DMFCC and DDMFCC with FVQ was found to have the lowest Equal Error Rate for the VQ based classifiers. The results found were an improvement over previously reported non-GMM methods and approached the results achieved for the computationally expensive GMM based method. Speaker verification tests carried out highlighted the overall performance improvement for the new ASR system. The National Institute of Standards and Technology Speaker Recognition Evaluation corpora was used to provide speaker source data for the experiments. 相似文献

17.

子空间与维纳滤波相结合的语音增强方法

下载免费PDF全文

张雪英贾海蓉靳晨升《计算机工程与应用》2011,47(14):146-148

针对复杂背景噪声下语音增强后带有音乐噪声的问题,提出一种子空间与维纳滤波相结合的语音增强方法。对带噪语音进行KL变换,估计出纯净语音的特征值,再利用子空间域中的信噪比计算公式构成一个维纳滤波器,使该特征值通过这个滤波器,从而得到新的纯净语音特征值,由KL逆变换还原出纯净语音。仿真结果表明,在白噪声和火车噪声的背景下,信噪比都比传统子空间方法有明显提高,并有效抑制了增强后产生的音乐噪声。相似文献

18.

基于支撑向量机的说话人确认系统 总被引：2，自引：1，他引：1

何昕刘重庆李介谷《计算机工程与应用》2000,36(12):70-71,91

支撑向量机(SVM)是一种新的统计学习方法,和以往的学习方法不同的是SVM的学习原则是使结构风险(Structural Risk)最小,而经典的学习方法遵循经验风险(Empirical Risk)最小原则,这使得SVM具有较好的总体性能.文章提出一种基于支撑向量机的文本无关的说话人确认系统,实验表明同基于向量量化(VQ)和高斯混合模式(GMM)的经典方法相比,基于SVM的方法具有更高的区分力和更好的总体性能. 相似文献

19.

基于改进Citation-KNN算法的性别识别研究

下载免费PDF全文

朱俊梅顾明亮张世形贾晶晶《计算机工程与应用》2015,51(15):206-210

为了简化系统模型训练方法,提高性别识别系统的整体效率,提出了一种基于改进Citation-KNN算法的说话人性别识别方法。该方法将连续语音切分,训练每段语音的高斯混合模型（Gaussian Mixture Model,GMM）作为多示例包,其所有混合元为相应包中示例;采用改进的Hausdorff距离作为包与包之间的距离测度,通过Citation-KNN算法进行性别识别。该方法以多示例包间距离为分类依据,简化了系统训练,且识别率优于一些传统算法。相似文献

20.

改进的基于小波包变换的语音特征提取算法

下载免费PDF全文

吴亮春潘世永何金瑞张东海《计算机工程与应用》2011,47(5):210-212

针对语音信号的非平稳特性,传统的应用短时分析技术容易丢失信息的现状,提出了一种利用小波包变换的技术对语音信号的共振峰特征（FDWPT）进行提取的方法。对整个语音信号进行多分辨分析的小波包变换,这样可以得到每个频带的小波分解值,结合共振峰的频率特性,选取适当的小波包分解结点,对这些结点建立共振峰参数,使用矢量量化模型进行识别,从而提高了说话人识别的效果。相似文献