首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于动静态组合特征参数的语音识别   总被引:1,自引:0,他引:1  
基于语音信号的时变特性,本文提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC(Mel-Frequency Cepstrum Coefficient)参数的提取方法,用小波包变换代替傅立叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC(Discrete Wavelet Packet Transform Mel-Frequency Coefficient),然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数,通过试验和仿真,此参数具有很高的识别率,是一种很好的语音特征参数.并且把混沌特性引入到神经元,构成混沌神经网络,把这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较.试验结果表明,混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率.  相似文献   

2.
基于听觉感知的电子耳蜗共振峰提取方案   总被引:1,自引:1,他引:0  
使用听觉感知的小波变换来提取电子耳蜗中的共振峰参数。首先用听觉感知的小波变换对原始语音信号进行分解重构,然后分别用自相关和格型法对合成语音信号和原始语音信号进行共振峰提取。实验结果表明:使用听觉感知的小波变换进行共振峰参数提取的可行性,合成语音信号能更好地表征原始语音信号的特征;同时也证实了电子耳蜗语音处理器中使用由格型法提取共振峰参数比自相关法更精确。  相似文献   

3.
针对使用语音变换技术的语音篡改,提出一种自动检测方法。在分析语音变换基本模型和变换语音失真的基础上,提取语音信号的声道参数以及相关的信号统计量,并通过支持向量机递归特征消除法,选择出对语音变换比较敏感的特征作为分类特征,使用支持向量机进行语音变换检测和变换语音的说话人性别判别。对于一种语音变换软件的实验结果表明,该方法具有较高的检测准确率,其中语音变换检测的平均准确率为94.90%,变换语音的说话人性别判别平均准确率为92.09%。  相似文献   

4.
通过对MFCC算法的研究,发现其中的FFT在整个时频空间使用固定的分析窗,这不符合语音信号的特性,而小波变换具有多分辨率特性,更符合人耳的听觉特性。提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC参数的提取方法,用小波包变换代替傅里叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC,然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数。仿真实验证明:基于新特征的识别率比原来MFCC的识别率有了很大提高,特别是在低信噪比情况下。  相似文献   

5.
提出了一种基于二次离散小波变换(DWT)的语音增强算法。该算法首先对带噪语音信号进行离散小波变换,提取离散细节信号,并对其进行第二次离散小波变换。再按照不同的规则选取阈值,对信号进行去噪处理。最后再对出来后的语音信号进行合并。对比实验结果表明,该方法具有良好的消除噪声的效果,提高了语音的清晰度和可懂度。  相似文献   

6.
基于小波混沌神经网络的语音识别*   总被引:1,自引:1,他引:0  
基于语音信号的时变特性,提出了一种新型神经网络语音识别方法——小波混沌神经网络方法,即把小波变换和混沌特性引入到神经元,构成小波混沌神经网络,将这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较。实验结果表明,小波混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率。  相似文献   

7.
有效的基于内容的音频特征提取方法   总被引:1,自引:1,他引:0       下载免费PDF全文
音频特征提取是音频分类的基础,好的特征将会有效提高分类精度。在提取频域特征Mel频率倒谱系数(MFCC)的同时,对每一帧信号做离散小波变换,提取小波域特征,把频域和小波域特征相结合计算其统计特征。通过SVM模型建立音频模板,对纯语音、音乐及带背景音乐的语音进行分类识别,取得了较高的识别精度。  相似文献   

8.
基于前置滤波和小波变换的带噪语音基音周期检测方法   总被引:10,自引:0,他引:10  
根据语音信号的基音周期范围有限和在声门闭合时刻语音信号出现锐变的特点,提出一种基于前置滤波和小波变换的基音周期检测方法。带噪语音信号经过3阶椭圆低通滤波器滤波后,采用以二次样条小波作为小波函数,进行一级小波变换检测语音信号的锐变点,再计算基音周期。实验表明,本文提出的基音周期检测方法,与平均幅度差函数(AMDF)和自相关函数(ACF)方法相比,提高了提取基音周期的准确率;与多尺度小波变换的基音周期检测方法相比,减小了计算量,削弱了噪声信号和语音的共振峰对基音周期检测的影响。  相似文献   

9.
针对基音周期检测实时性的要求,提出了基于小波变换的实时语音基音周期检测算法。该算法利用小波变换极值与信号突变点之间的关系,将小波域波形与时域波形相结合,采取自适应基准、多特征参数提取小波系数极大值,并在2.5ms时间内捕捉并检测到新的基音脉冲位置。实验表明,该算法对语音和残差信号取得了较好结果。  相似文献   

10.
基于小波变换的脉象信号特征提取方法   总被引:11,自引:0,他引:11  
为了较好地区分正常人与心脏病人的脉象信号,利用小波变换奇异性检测功能与多尺度分辨特性,提出了两种提取脉象信号特征的方法:连续小波变换法和二进小波变换法。在此基础上,构造了两种特征向量:小波变换系数的尺度——主波峰值和小波变换的尺度——能量值。经过对临床采集的235例脉象信号的处理与分析统计,所得数据具有较好的重复性与稳定性,可以作为用于脉象信号识别的特征向量。  相似文献   

11.
以声纹为特征的身份识别技术具有十分广阔的应用前景。该文介绍了声纹识别系统的应用分类及其基本技术原理,重点分析了声纹识别系统中的特征参数提取、模式匹配判断等关键技术问题,并总结声纹识别技术的研究进展。  相似文献   

12.
通过对大型电力变压器(电抗器)声纹信号采集、处理与特征分析,提出了一种基于声纹识别技术的变压器工况检测方法及验证系统,实现对变压器工作状态的判断检测。首先,通过声纹采集传感器实地采集获取73组变压器音频,共约1800 min;其次,分别运用分段、分帧、加窗音频预处理方法对所采集的变压器声纹进行去噪处理;再次,综合运用能量特征、频率特征、梅尔频率倒谱系数、频率压缩方法提取变压器声纹特征并进行有效融合;最后,针对变压器工况声音由稳定工作状况发出的声音与不稳定的瞬时杂音加性叠加问题,提出一种基于余弦相似度算法实现声纹叠加的分离检测,同时建立一套变压器工况检测与验证分析系统。  相似文献   

13.
为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的表征能力.从训练结果可以看出,通过深度可分离卷积,网络的参数量减少了25.5%,模型...  相似文献   

14.
设计了一套基于LabVIEW的语音身份认证系统,以LabVIEW2009为开发平台,采用改进的美尔倒频谱系数法进行语音信号特征提取,采用矢量量化模型进行语音识别,实现了与文本、性别无关的声纹识别.实验结果表明该系统能够有效克服环境噪声、说话人声音变异带来的影响.  相似文献   

15.
通过分析掌纹、指纹、虹膜、人脸、步态、声纹等生物特征识别技术的特点以及煤矿现场对入井人员生物特征的影响,指出虹膜识别、人脸识别、步态识别、声纹识别适用于煤矿入井人员唯一性检测;提出了一种基于人员定位和生物特征识别的煤矿入井人员唯一性检测技术方案,将生物特征识别技术嵌入人员定位系统,利用人员定位识别卡实现识别卡数量及人员身份的唯一性检测;指出煤矿入井人员唯一性检测技术的研究关键点是严重污染人脸的识别算法、对设备遮挡情况下人员步态图像的采集及对混入人员语音信号的煤矿现场噪声消除算法。  相似文献   

16.
传统说话人识别框架大多建立在高斯混合模型(GMM)上的,然而这种浅层学习模型不能有效地表征数据特征之间的高阶相关性,识别效果较差。本文提出一种基于深度神经网络(Deep Neural Network, DNN)与基音周期(Pitch Period, PP)相结合的说话人识别方法,模型主线识别以对数梅尔滤波器组特征参数作为DNN的输入,通过训练DNN模型提取说话人的声纹特征;针对DNN模型阈值设定人的主观性影响,利用动态时间规整技术匹配说话人基音周期进行辅助识别。实验结果表明,这种双重识别方法等错误率可以达到1.6%,较DNN系统与EM-GMM系统等错误率分别降低了1.2%和2.4%,并且在噪声环境中仍具有较好的鲁棒性。  相似文献   

17.
声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话人辨认两种应用角度进行性能比较。在取不同特征参数阶数、不同高斯混合度和使用不同时长的训练语音与测试语音的情况下,从理论识别效果、实际识别效果、识别所用时长、识别时长占比等多个方面进行了分析与研究。最终结果表明:在GMM-UBM模式识别方法下,三种静态特征参数中MFCC绝大多数时候具有最佳识别效果,同时其系统识别耗时最长;识别率与语音特征参数的阶数之间并非单调上升关系。静态参数在结合较佳阶数的动态参数时能够提升识别效果;增加动态参数阶数与提高系统识别效果之间无必然联系。  相似文献   

18.
传统声纹识别人控制系统识别准确率低,存在语音识别噪声鲁棒性问题。针对上述问题,基于非单调共轭梯度算法设计了一种新的声纹识别机器人控制系统,采用BioVoice 2.0 标准声纹采集器采集数据,提取声纹特征,根据提取的声纹特征建立模型库,同时引用了两个声纹数据采集终端,型号分别是TMC104-B和TMC104,选用型号为AS-MrobotR的机器人配合采集器和采集终端实现工作。在Windows平台下使用C/C+语言研究了一种专用的程序,在程序内部添加mde-api数据库,完成训练程序和识别程序。实验结果表明,基于非单调共轭梯度算法的声纹识别机器人控制系统能够很好地解决语音识别噪声鲁棒性问题,在有噪声环境下识别准确率提高15.24%,在无噪声环境下识别准确率提高21.55%。  相似文献   

19.
声纹识别系统的识别性能会随着环境噪声的增强而急剧降低,为了使系统具备一定的噪声鲁棒性,提出了一种基于数据驱动缺失特征检测与重建的声纹识别前端处理方法。充分利用大量数据训练得到的信息估计子带信噪比,检测、标记和重建被噪声污染严重的子带特征,从而得到噪声鲁棒性特征参数。实验表明,该方法在低信噪比环境下取得了较高的识别率提升,在非平稳噪声下系统性能也有着较好的改善。  相似文献   

20.
目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型。在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选出与测试者声纹特征最相近的K个目标说话人声纹模型。在第二层识别模型中,采用GMM-UBM(Gaussian Mixture Model-Universal Background Model)模型,精确匹配上层模型得到的K个目标说话人声纹模型,并做出最终的判决。实验验证,双层识别模型在确保高识别精度的前提下,大幅度的提高了系统的识别速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号