首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于小波变换和Teager能量算子浊音段提取   总被引:1,自引:0,他引:1  
王义元  赵黎明 《控制工程》2004,11(Z1):99-101
对语音信号浊音段的提取在很多应用中都是重要的一个步骤.在小波域上用Teager能量算子(TEO)提取语音信号的浊音段,并对原始语音信号和加有高斯白噪声的不同信噪比的语音信号进行了仿真实验.实验结果表明,该算法能够准确地提取出浊音段,并具有较强的抗噪声能力.  相似文献   

2.
给出了一种基于卡尔曼滤波的语音增强算法,并对语音信号的清浊音加以区分.通过在浊音段提取多脉冲激励信号加入语音的状态方程,有效地重建语音的高频谐波.采用对数谱测度LSD(Log-spectral distortion)和语音感知质量评价PESQ(Perceptual evaluation of speech quality)评分对语音增强的效果进行评测.实验表明,算法提高了增强语音的质量,对白噪声和汽车噪声均有满意的效果.  相似文献   

3.
基于能量和浊音特性的语音端点检测   总被引:1,自引:0,他引:1  
论文提出一种适用于实际噪声环境的语音端点检测算法,并将其用于语音识别系统中。首先通过跟踪平稳噪声能量,检测能量变化非平稳的信号;然后在这段信号中根据浊音特性搜索并跟踪谐波,确定浊音的位置;最后结合能量和浊音信息检测语音的精确起止点。实验证明,该算法能在多种环境噪声中保持稳定可靠的性能。  相似文献   

4.
为了进行有效的语音信号处理,并降低语音信号的冗余度,通常采用端点检测技术来提取语音信号中的有效部分。本文在传统语音端点检测方法的基础上,提出了一种基于基音周期对语音段末尾进行判别的方法,针对汉语发音都是以浊音结尾的特点,同时利用基音周期对浊音段信号比较敏感这一特性,能够有效地避开汉语语音信号尾部拖音段中所包含的无效信息,既提高了端点检测的准确性,又减少了后续语音识别系统样本训练时间。实验结果证明,该方法对于汉语中孤立词末尾的拖音段,可以得到较好的端点检测效果。  相似文献   

5.
在低信噪比和非平稳噪声干扰下,语音信号的清浊音检测是语音信号处理中的一个重要研究问题。论文基于语音正弦模型,提出了一种清浊音分类和浊音谐波提取算法。该方法在分析了语音的三阶累积量谱后,用子谐波-谐波方法取得基音,并计算出谐波参数和高低频能量比值。它利用谱包络估计器得到谱包络及尖峰信号,结合最小均方估计准则下的迭代算法计算语音谐波的信噪比;通过对上面各计算结果的综合评价得出语音帧的浊音度,从而得到语音清浊音的分类和浊音谐波数。仿真结果表明,该算法在复杂噪声背景下,能有效进行语音分类,准确得到浊音度。同时该算法还具有实时性好、语音参数分析精度高的特点。  相似文献   

6.
黄海亮  谢康林  杜平  吴边 《计算机工程》2004,30(Z1):343-345
为了得到准确的基音曲线,该文提出了一个有效的解决方案,通过利用人工神经网络进行浊音判决,以及计算基音频率时利用基于 自相关函数的动态规划算法,有效地克服了在语音信号清音和无声段错误的基音提取以及在浊音段的2倍频或1/2倍频错判。实验证明,利用 该文提出的方案,可以大大提高基音频率提取的准确度,从而得到非常准确的语音基频曲线。  相似文献   

7.
基于可调Q-因子小波变换的语音增强算法   总被引:1,自引:0,他引:1  
针对语音增强算法中传统的小波阈值法的局限性,提出一种基于可调Q-因子小波变换和清浊音分离的语音增强算法。首先用过零率和短时能量法判别清音和浊音;然后在可调Q-因子小波变换下,对清、浊音采用不同的阈值处理,在不同尺度上,分别结合系数能量和噪声方差得到的阈值作为清音和浊音的阈值确定准则;再利用改进的阈值函数分别处理清音和浊音的小波系数,估计出不含噪声的系数;最后进行小波逆变换,得到抑制了噪声的语音信号。对含有高斯白噪声和有色噪声的语音进行仿真实验,结果表明:与目前许多经典的去噪方法相比,该方法在去噪效果和提高语音可懂度方面均有一定的改善。  相似文献   

8.
针对单声道语音分离中浊音分离的问题,提出了一种准确估计基音周期的方法。首先,以语音的短时平稳性和基音周期的连续性等为线索,利用语音信号的倒谱峰值构成基音周期谱图,并自动提取基音周期轨迹。然后,利用谐波频率为基音频率整数倍的性质来拾取各次谐波的频谱。最后,通过傅里叶逆变换对浊音进行重构。实验结果表明,该方法能准确提取基音周期轨迹,有效分离浊音信号。  相似文献   

9.
在特定人语音识别系统中,噪声严重影响语音特征提取,并导致语音识别率明显下降。针对在噪声环境下语音识别率偏低的问题,通过谱减法去除语音信号噪声,并根据语音信号语谱图可视化的特点,运用脉冲耦合神经网络从语音信号的语谱图中提取熵序列作为特征参数进行语音识别。实验结果表明,该方法能较好地去除语音信号中的噪声,并能使在噪声环境下的特定人语音识别系统具有较好的识别效果。  相似文献   

10.
提出了一种在宽带语音(50-7500Hz)中进行清浊音分类的方法,该方法通过估计和跟踪信号的高频能量和低频能量提取语音信号,并针对宽带语音的特点,用特殊的高低频谱能量比和周期性水平组合参数进行清浊音分类.算法设计了一种可以在所有语音帧更新阈值的方法,在比较复杂的背景噪声条件下仍能较准确地更新阈值,从而保证清浊音分类有效进行.仿真结果表明,本文方法能准确地对宽带语音进行分类,具有一定的抗噪声性能,且算法的复杂度较低,具有一定的实用价值.  相似文献   

11.
结合网格编码的固定鲁棒性嵌入水印算法   总被引:1,自引:0,他引:1       下载免费PDF全文
将网格编码技术与固定鲁棒性嵌入相结合提出了一种新的网格编码水印算法。该算法将带边信息的编码和带边信息的嵌入技术相结合,首先运用脏纸网格对水印信息进行编码,然后计算使水印系统归一化相关检测系数降到给定阈值时所能抵抗的噪声幅度,并将其作为鲁棒性参数,在恒定的鲁棒性参数下利用规格化正交嵌入水印,用维特比算法进行水印检测。实验结果表明,该算法有效地提高了基于网格编码的数字水印系统抵抗高斯噪声和幅度缩放的能力。  相似文献   

12.
联合听觉掩蔽效应的子空间语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在经典子空间语音增强算法中,因语音特征值估计偏差会造成语音失真和音乐噪声。针对该问题,提出一种联合听觉掩蔽效应的语音增强算法。该算法联合掩蔽阈值自适应调节噪声特征值的抑制系数,并利用维纳滤波对音乐噪声的抑制性,对该特征值并行修正,最终还原出纯净的语音。实验结果证明,该算法在白噪声和有色噪声的背景下,与经典子空间的语音增强算法相比,能提高信噪比,减少语音失真和音乐噪声。  相似文献   

13.
小波阈值降噪算法中最优分解层数的自适应选择   总被引:13,自引:0,他引:13  
蔡铁  朱杰 《控制与决策》2006,21(2):217-0220
小波阚值降噪算法是一种去除数字信号中白噪声的有效算法.针对加性高斯白噪声的情况,提出一种自适应小波降噪算法,用于语音信号的增强.它能根据带噪信号的特点,自适应选择小波变换的最优分解层数.实验结果表明,该算法比经典的小波降噪算法具有更好的降噪效果,能有效提高算法的实用性能.  相似文献   

14.
为了克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述中,提出了5维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;介绍了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法(F-LBG);用提取算法提取、建立了浊音隶属度码本的训练样本集,用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器进行语音编、解码仿真;结果表明,用浊音隶属度矢量描述和合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。  相似文献   

15.
当前数字水印对常见的图像处理攻击如高斯噪声、中值滤波、有损压缩等具有较强的抵抗能力,但其抵抗剪切、缩放等几何攻击的能力较差。因此,为提高数字水印的鲁棒性,结合尺度不变特征变换算子和视觉感知模型,提出一种基于不变特征的水印嵌入方法。基于广义高斯分布模型对小波系数进行刻画,并根据二值假设检验理论确定水印的检测阈值,由此进一步给出水印虚警和漏警之间的工作特性曲线关系。实验仿真结果表明提出的水印方法在抗压缩、叠加噪声、缩放、剪切、旋转等攻击时具有较好的鲁棒性能。  相似文献   

16.
In this paper, we try to present the problem of epoch detection from a different perspective that not only deals with estimation of epoch instances (i.e., glottal activity) but also with quantification of the absence of epochs (i.e., no glottal activity) in the unvoiced regions of speech signal. Most of the epoch detection methods perform significantly well in the voiced regions of speech but are not robust enough in the unvoiced regions of speech, i.e., they detect a number of pseudo epochs in the unvoiced regions of speech. We propose a simple method based on Teager Energy Operator (TEO) which not only determines the epochs in voiced region (due to its superior temporal resolution and its ability to capture airflow properties through the glottis) but also is very effective in unvoiced region. Recently proposed methods such as 0-Hz resonator-based method and DYPSA method gave a combined rate (CR) (for detecting epochs in voiced and unvoiced regions of speech) of 74.7% and 60%, respectively and a pseudo epoch rate (PER) (i.e., spurious epochs in the unvoiced regions of speech) of 62.9% and 54.04%, respectively. On the other hand, our proposed method gave a CR and PER of 87% and 0.27%, respectively. This result suggests that the proposed method captures glottal activity more efficiently both in voiced and unvoiced regions of speech signal. The performance of the proposed method is demonstrated using publicly available CMU-Arctic database using the epoch information from the electro-glottograph (EGG) as reference signal to serve as ground truth for estimation of glottal closure instants (GCI). Due to the noise suppression capability of TEO, the proposed method has almost no or little effect (i.e., robust) against signal degradations like white, babble, high frequency and vehicle noises as compared to 0-Hz resonator and DYPSA methods.  相似文献   

17.
基于小波变换和Kalman滤波的语音增强方法   总被引:1,自引:0,他引:1  
针对受加性噪声干扰的语音信号,采用基于小波变换的Kalman滤波方法,提出一种有效的语音增强方法.分析在实际处理中所遇到的二进小波变换、滤波参数估计、Kalman滤波发散等问题.语音增强的效果采用信噪比来进行评估.仿真实验表明在加性噪声为高斯白噪声和色噪的情况下,该方法均具有较好的有效性.  相似文献   

18.
In this paper, a novel method for voiced-unvoiced decision within a pitch tracking algorithm is presented. Voiced-unvoiced decision is required for many applications, including modeling for analysis/synthesis, detection of model changes for segmentation purposes and signal characterization for indexing and recognition applications. The proposed method is based on the generalized likelihood ratio test (GLRT) and assumes colored Gaussian noise with unknown covariance. Under voiced hypothesis, a harmonic plus noise model is assumed. The derived method is combined with a maximum a-posteriori probability (MAP) scheme to obtain a pitch and voicing tracking algorithm. The performance of the proposed method is tested using several speech databases for different levels of additive noise and phone speech conditions. Results show that the GLRT is robust to speaker and environmental conditions and performs better than existing algorithms.  相似文献   

19.
语音信号的三阶累积量通常不等于零,因而可以用来检测噪声环境中语音的起始点和终止点。提出一种采用累积量矩阵的最大奇异值来实现语音端点检测的方法,并引入一种自适应的实现方法。仿真实验表明,所提方法在很大程度上降低了传统端点检测方法的错误率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号