首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法.首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得到两类信号对数能量谱比的统计分布,并基于贝叶斯决策准则推导最佳判决阈值.信号输入时,逐帧计算高低频带对...  相似文献   

2.
一种改进的基于倒谱特征的带噪端点检测方法   总被引:6,自引:0,他引:6  
影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1)将语音信号经滤波后分成高低频两子带,分别进行分析;(2)用LPC美尔倒谱特征LPCCMCC代替常规倒谱特征作为特征参数;(3)改进噪声估计,使其具有自适应性。实验结果表明本方法在低信噪比下有较好的检测性能。  相似文献   

3.
基于自适应倒谱距离的强噪声语音端点检测   总被引:4,自引:0,他引:4  
赵新燕  王炼红  彭林哲 《计算机科学》2015,42(9):83-85, 117
在有噪声干扰的情况下,传统的语音端点检测方法的检测准确度明显下降。为了在强背景噪声环境下有效区分出语音信号和非语音信号,针对倒谱距离端点检测方法进行了研究,提出了一种基于自适应倒谱距离的强噪声语音端点检测方法。本方法引入倒谱距离乘数和门限增量系数,针对不同信噪比采用不同的倒谱距离乘数,并采用自适应判决门限的方法进行语音端点检测。MATLAB仿真实验结果显示,在不同背景噪声和不同信噪比下,本方法对于语音端点检测具有较高的检测正确率,其端点检测效果明显优于传统端点检测方法,适用于强背景噪声下的端点检测。  相似文献   

4.
为了提高车载噪声环境下语音端点检测的准确性,介绍了一种新的时间序列复杂性测度:模糊熵,并将其应用于语音信号的特征提取。分别以样本熵和模糊熵提取含噪语音信号的特征,使用双门限法对语音信号进行端点检测,特征门限值使用模糊C均值聚类算法和贝叶斯信息准则算法确定。仿真结果表明在车载噪声环境下与样本熵算法相比,模糊熵算法能更好地区分噪声信号和语音信号,具有更好的端点检测性能,相同环境下模糊熵算法的错误率比样本熵算法降低了16%以上。  相似文献   

5.
何俊红  王彪 《计算机与数字工程》2014,(11):2014-2016,2083
为了提高语音信号端点检测的准确率,提出了一种基于倒谱距离—频带方差的检测方法。该方法将语音信号倒谱距离和频带方差结合起来,作为检测语音信号起始位置和终止位置的参数。仿真实验表明,该方法比传统方法更有效、更优越,能够比较准确地检测语音信号。  相似文献   

6.
短时能量与熵是语音端点检测的常用方法,但在低信噪比环境中都不能有效定位端点。因此给出结合这两种方法检测语音段的位置,同时采用自适应于不同的噪音背景下的判决准则,经实验证明该算法行之有效,对于连续数字音,准确率较原有算法平均提高16%,单个数字音提高26%。  相似文献   

7.
改进的能量谱熵端点检测算法   总被引:1,自引:0,他引:1  
董胡  钱盛友 《测控技术》2016,35(6):26-29
为了提高传统谱熵算法在信噪比较低环境下的端点检测效果,将短时能量特征与谱熵特征相结合,提出一种改进的能量谱熵特征,将模糊C均值聚类算法和贝叶斯信息准则结合对改进的能量谱熵特征门限进行估计,最后采用双门限算法进行端点检测.仿真实验结果表明,在信噪比为-5 dB的白噪声环境下,改进的能量谱熵算法的端点检测正确率为76.9%,远高于短时能量算法和谱熵算法,在低信噪比环境下具有更优的端点检测效果与稳健性.  相似文献   

8.
在讨论传统倒谱距离语音端点检测方法不足的基础上,提出了一种基于倒谱距离和短时能量的语音端点检测改进方法。基于倒谱距离的单参数端点检测方法在高信噪比环境下效果较好,然而在低信噪比的环境下其端点检测性能急剧下降。通过分析倒谱距离和短时能量各自的端点检测特性,建立了一种结合二者特点的双参数判决准则,在保证运算量没有显著增大的前提下提高了端点检测的准确率。仿真实验结果表明,新方法相对于基本倒谱距离端点检测方法,在低信噪比的高斯白噪声环境下端点检测性能有较明显提高。  相似文献   

9.
在讨论传统倒谱距离语音端点检测方法不足的基础上,提出了一种改进方法.通过对语音信号三个端点检测的特征参数短时能量、短时平均过零率和倒谱距离逐一分析研究,提出了一种结合三者特征的语音参数,将其应用于端点检测中.实验结果表明,该方法相对于基本倒谱距离检测方法,在低信噪比时检测性能有较明显提高.  相似文献   

10.
一种噪声环境下的实时语音端点检测算法   总被引:12,自引:0,他引:12  
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。  相似文献   

11.
介绍一种基音检测的新方法。该算法首先对分帧语音采用Burg算法进行LPC分析,获取最佳预测系数构造逆滤波器;然后通过逆滤波得到预测误差序列代替原输入语音序列进行倒谱分析;最后在恰当的范围里测出最大峰值,进行基音检测。实验结果表明,与传统方法相比,该方法鲁棒性好,在信噪比低的情况下仍可获得较高的准确率。  相似文献   

12.
针对滑动变长窗口BIC算法冗余分割点多的问题,提出了基于小波子带平均能量方差和BIC的音频分割算法相结合。该算法用小波子带平均能量方差将连续音频流分割成音频段,然后用改进的滑动变长窗口BIC算法在音频段上检测声学改变点。实验表明,该算法取得了较好的分割效果,与滑动变长窗口的BIC算法相比,该算法的准确率、召回率和综合性能都得了提高。  相似文献   

13.
传统的快速聚类算法大多基于模糊C均值算(Fuzzy C-means,FCM),而FCM对初始聚类中心敏感,对噪音数据敏感并且容易收敛到局部极小值,因而聚类准确率不高。建立使用分治策略解决聚类问题的算法架构,充分考虑数据本身特性并对传统的FCM算法进行改进,标准数据集的实验结果表明这种基于分治策略的FCM聚类算法较好地提高了算法的聚类准确率,加快了收敛速度。  相似文献   

14.
随着卫星通信网的推广,其安全性越来越重要。针对卫星通信网中可能出现的严重威胁其自身安全的地球站被盗用或伪造等问题,提出了地球站行为异常检测的概念,采用聚类分析和模式匹配相结合的检测方法,设计并实现了一个卫星通信网地球站异常检测系统。提出了一种改进的KFCM聚类异常检测算法,该算法可获得局部最优划分。实验结果表明,改进后的算法具有更好的聚类效果,系统达到了较好的检测性能。  相似文献   

15.
对传统的C0复杂度语音端点检测方法改进,提出一种基于小波变换的C0复杂度(WC0)方法,其特征门限估计采用模糊C均值聚类算法和贝叶斯信息准则算法,并采用双门限法进行语音端点检测。在TIMIT连续语音库上的实验表明,在低信噪比环境下,WC0法的检测性能明显优于基于传统的C0复杂度法,特别是在车辆噪声和车内噪声环境下,WC0法表现出更好的检测性能。  相似文献   

16.
This paper presents a novel method for QRS detection in electrocardiograms (ECG). It is based on the S-Transform, a new time frequency representation (TFR). The S-Transform provides frequency-dependent resolution while maintaining a direct relationship with the Fourier spectrum. We exploit the advantages of the S-Transform to isolate the QRS complexes in the time–frequency domain. Shannon energy of each obtained local spectrum is then computed in order to localize the R waves in the time domain.  相似文献   

17.
提出一种基于最小概率距离和改进部分体积(PV)插值的图像配准方法。采用Powell优化算法迭代搜索对称KL距离的最小值,获取最小概率距离,将其作为配准测度,并利用改进的PV插值算法提高图像配准的鲁棒性。实验结果表明,与基于互信息的图像配准方法相比,该方法能有效地减少耗费时间,提高配准精度。  相似文献   

18.
根据联合战术信息分发系统(Joint Tactical Information Distribution System,JTIDS)信号的特点,提出一种基于多相滤波的JTIDS信号接收方法。该接收模型具有全概率接收JTIDS信号的特点,而且所需计算复杂度低。在信号接收后,通过能量检测对输出信号进行脉冲宽度检测,判断信号是否为JTIDS信号。仿真结果表明该方法在信噪比为正时具有较好的性能。  相似文献   

19.
This paper proposes a multimodal approach to distinguish silence from speech situations, and to identify the location of the active speaker in the latter case. In our approach, a video camera is used to track the faces of the participants, and a microphone array is used to estimate the Sound Source Location (SSL) using the Steered Response Power with the phase transform (SRP-PHAT) method. The audiovisual cues are combined, and two competing Hidden Markov Models (HMMs) are used to detect silence or the presence of a person speaking. If speech is detected, the corresponding HMM also provides the spatio-temporally coherent location of the speaker. Experimental results show that incorporating the HMM improves the results over the unimodal SRP-PHAT, and the inclusion of video cues provides even further improvements.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号