首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
非线性统计匹配用于子带鲁棒语音识别   总被引:1,自引:0,他引:1  
由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性,根据各子带噪声特点采用统计匹配、MAP估计和HMM/MLP非线性映射来补偿噪声环境的影响。实验表明该算法明显改善了识别系统在噪声环境下的性能。  相似文献   

2.
黄文娜  彭亚雄 《电声技术》2016,40(11):44-47
为了改善发声力度变化对说话人识别系统性能的影响.针对不同发声力度下语音信号的分析,提出了使用发声力度最大后验概率(Vocal Effort Maximum A Posteriori,VEMAP)自适应方法更新基于高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)的说话人识别系统模型.实验表明,所提出的方法使不同发声力度下系统EER%降低了88.45%与85.16%,有效解决了因发声力度变化引起的训练语音与测试语音音量失配,从而导致说话人识别性能降低的问题,改善说话人识别系统性能效果显著.  相似文献   

3.
噪声自适应的多数据流复合子带语音识别方法   总被引:3,自引:0,他引:3  
张军  韦岗 《电子与信息学报》2006,28(7):1183-1187
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。  相似文献   

4.
蒋文建  韦岗 《电子学报》2001,29(Z1):1829-1832
本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能.  相似文献   

5.
基于概率加权平均的Mel子带特征重建算法   总被引:1,自引:0,他引:1  
罗宇  杜利民 《电子学报》2004,32(10):1738-1741
本文提出基于概率加权平均的Mel子带特征数据重建算法.该算法选择K个最优重建结果的概率加权平均作为被加性噪声掩蔽的语音特征分量的估计.实验结果表明,基于概率加权平均的语音特征数据重建算法降低了重建误差,减少了帧间突变现象,增强了Mel子带特征的帧间连续性,从而显著提高了语音识别系统对加性噪声的鲁棒性能.  相似文献   

6.
短波天波信道存在多径效应及冲击和高斯噪声.针对短波信道特点,提出先利用零记忆非线性系统抑制冲击噪声,后分段盲均衡,基于最大后验概率识别的分类方法.零记忆非线性系统可抑制冲击噪声,而让信号无失真通过.分段均衡减弱信道时变和参数估计误差对均衡器影响.由于冲击噪声的瞬时性和信道时变性,使每段信号均衡效果并不一样,采用最大后验概率的方法选用均衡效果最好的一段信号识别.仿真表明,在典型短波信道且含有冲击噪声情况下,信噪比10 dB时,平均识别概率大于90%,该算法适合在实际中应用.  相似文献   

7.
基于单高斯模型集的汉语美子带特征重建算法   总被引:2,自引:0,他引:2       下载免费PDF全文
罗宇  杜利民 《电子学报》2004,32(10):1654-1657
本文提出了基于单高斯模型集的汉语美子带特征重建(SGMDI)方法,并通过试验研究了该算法对提高语音识别系统加性噪声鲁棒性的作用.实验结果表明:SGMDI方法能够明显提高语音识别系统对各类音子尤其是容易被加性噪声破坏的清辅音音子的识别正确率,从而显著增强了语音识别系统的噪声鲁棒性.  相似文献   

8.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

9.
孙暐  吴镇扬 《信号处理》2006,22(4):559-563
根据Flether等人的研究,基于感知独立性假设的子带识别方法被用于抗噪声鲁棒语音识别。本文拓展子带方法,采用基于噪声污染假定的多带框架来减少噪声影响。论文不仅从理论上分析了噪声污染假定多带框架在识别性能上的潜在优势,而且提出了多带环境下的鲁棒语音识别算法。研究表明:多带框架不仅回避了独立感知假设要求,而且与子带方法相比,多带方法能更好的减少噪声影响,提高系统识别性能。  相似文献   

10.
噪声环境下说话人识别的组合特征提取方法   总被引:1,自引:0,他引:1  
芮贤义  俞一彪 《信号处理》2006,22(5):673-677
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。  相似文献   

11.
We consider the feature recombination technique in a multiband approach to speaker identification and verification. To overcome the ineffectiveness of conventional feature recombination in broadband noisy environments, we propose a new subband feature recombination which uses subband likelihoods and a subband reliable‐feature selection technique with an adaptive noise model. In the decision step of speaker recognition, a few very low unreliable feature likelihood scores can cause a speaker recognition system to make an incorrect decision. To overcome this problem, reliable‐feature selection adjusts the likelihood scores of an unreliable feature by comparison with those of an adaptive noise model, which is estimated by the maximum a posteriori adaptation technique using noise features directly obtained from noisy test speech. To evaluate the effectiveness of the proposed methods in noisy environments, we use the TIMIT database and the NTIMIT database, which is the corresponding telephone version of TIMIT database. The proposed subband feature recombination with subband reliable‐feature selection achieves better performance than the conventional feature recombination system with reliable‐feature selection.  相似文献   

12.
噪声下差分复合子带语音识别方法   总被引:4,自引:0,他引:4  
蒋文建  韦岗 《通信学报》2002,23(1):18-24
本文根据子带特征反映语音信号局部特性和全带特征反映语音信号整体特性的事实,提出了 一种差分复合子带语音识别新方法。先用频谱差分减少噪声的干扰,再将多子带特征识别概率与全带特征识别概率相结合进行综合判决,以得到最终识别结果。将新方法应用于TIMIT数据包0-9十个英文数字和E-Set在NoiseX92的白噪声和F16战机噪声下的识别实验。实验结果表明新方法比传统方法识别性能有很大提高。  相似文献   

13.
提出了一种DCT域的语音增强改进算法。该算法依据DCT域语音分量和噪声分量统计分布的不同,采用最大后验概率估计方法对语音分量进行精确估计,实现将语音信号从噪声环境中分离出来,从而有效地改善语音质量。在低信噪比条件下,该算法可以有效降噪,且增强效果较频域增强算法更好。  相似文献   

14.
In this paper, we study the effects of different ASE noise models on the performance of turbo code (TC) decoders. A soft-decoding algorithm, the Bahl, Cocke, Jelinek, and Raviv (BCJR) decoding algorithm, is generally used in TC decoders. The BCJR algorithm is a maximum a posteriori probability (MAP) algorithm, and is very sensitive to noise statistics. The Gaussian approximation of ASE noise is widely used in the study of optical-fiber communication systems, and there exist standard TCs for additive white Gaussian noise (AWGN) channels. We show that using a MAP decoding algorithm based on the Gaussian noise assumptions, however, may significantly degrade the TC decoder performance in an optical-fiber channel with non-Gaussian ASE noise. To take full advantage of TC, accurate noise statistics in optical-fiber transmissions should be used in the MAP decoding algorithm.  相似文献   

15.
The author presents a study of large-vocabulary continuous Mandarin speech recognition based on a segmental probability model (SPM) approach. The SPM was found to be very suitable for recognition of isolated Mandarin syllables especially considering the monosyllabic structure of the Chinese language. To extend the application of the model to continuous Mandarin speech recognition, a concatenated syllable matching (CSM) algorithm in place of the conventional Viterbi search algorithm is first introduced. Also, to utilise the available training material efficiently, a training procedure is proposed to re-estimate the SPM parameters using the maximum a posteriori (MAP) algorithm. A few special techniques integrating acoustic and linguistic knowledge are developed further to improve the performance step by step. Preliminary experimental results show that the final achievable rate is as high as 91.62%, which indicates a 18.48% error rate reduction and more than three times faster than the well studied subsyllable-based CHMM  相似文献   

16.
An iterative equalization scheme for suppressing intrachannel nonlinearities in high-speed optical transmission systems operating at 40 Gb/s is presented. The proposed method employs a noise-predictive filter to mitigate the colored noise due to amplified spontaneous emission noise and optical filtering. The maximum a posteriori probability symbol detection implemented as the Bahl-Cocke-Jelinek-Raviv (BCJR) algorithm is employed to suppress the intrachannel nonlinear effects. Soft decision outputs provided by the noise-predictive BCJR equalizer are processed by an iterative low-density parity-check decoder.  相似文献   

17.
梁萌  付中华 《信号处理》2020,36(6):921-931
在免提通话系统和移动通信设备中,扬声器常常工作在较高的音量下,容易发生过载现象,从而产生明显的非线性声学回声,这在小微型扬声器中更加常见。常用的线性AEC(Acoustic Echo Cancellation)算法无法消除此类非线性回声,因此通话质量受到严重影响。非线性回声主要表现为额外的高频谐波分量,这些分量使得全带系统不再满足线性关系,而通常的AEC算法都是基于最小化全带误差推导而来,因此性能很容易受到非线性失真的影响。本文提出了一种基于多相滤波器组的子带AEC算法,把全带误差变成了各个子带的误差,因而把谐波失真成分变成了某些子带内的加性噪声,这使得谐波失真较小的那些子带依然能够正常收敛。通过仿真和实测实验,当出现非线性失真时,新方法的ERLE(Echo Return Loss Enhancement)明显高于经典的全带时域和频域方法,对于非线性失真明显的语音信号,ERLE提升约10 dB。   相似文献   

18.
基于EMD和改进双门限法的语音端点检测   总被引:3,自引:0,他引:3  
语音端点检测的准确与否直接影响到语音识别系统的计算复杂度和识别能力,在基于短时能量和过零率的端点检测算法中,能量计算方法不尽合理而且在低信噪比下检测效果大大降低。对此提出了一种基于经验模式分解和改进双门限法的语音端点检测算法,仿真结果表明在低信噪比情况下本文算法有更好的端点检测能力,显示了算法的优越性。  相似文献   

19.
一种基于检测元音的孤立词端点检测算法   总被引:2,自引:0,他引:2  
邝航宇  张军  韦岗 《电声技术》2005,(3):40-43,48
提出了基于检测元音的端点检测算法。首先检测到语音中的元音的端点。然后利用元音的端点作为参考端点检测出语音真实的端点。将新方法应用在T146数据包在NoiseX-92的5种噪声下的端点检测和识别实验。并和基于能量的端点检测算法比较。2种不同的实验表明,提出的基于检测元音的孤立词端点检测算法可以在不同信噪比下提高端点检测的准确率,并在低信噪比的环境下能明显提高语音识别系统的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号