共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
低空目标声信号是时变的、非平稳的,若以传统的Mel倒谱系数(MFCC)作为特征参数,虽然能模拟人耳的听觉特性,但不能更好地反映低空声信号的动态特性。基于小波变换可以精确反映非平稳信号瞬间变化的特点,文中用小波变换替代MFCC参数提取过程中的FFT变换,将改进后的MFCC与能够很好表征时变信号特性的隐马尔可夫模型(HMM)结合,对低空目标声信号进行检测识别。最后用实际采集到的直升机声信号和非直升机声信号进行实验,取得了较好的识别效果。实验的对比结果验证了该方法的有效性和可行性。 相似文献
3.
基于压缩感知的分布式语音压缩与重构 总被引:7,自引:3,他引:4
本文首先阐述了压缩感知(CS)的理论框架,然后分析了语音信号的特点--短时平稳性、离散余弦(DCT)基下的稀疏性,最后提出了基于CS理论的分布式语音压缩重构的框架.基于此框架采用基追踪(BP)和正交匹配追踪(OMP)算法对已压缩的语音信号进行重构,得出结论:每帧语音信号选取的帧长的大小,基于CS理论压缩得到的观测数的多少,都对重构性能有影响. 相似文献
4.
5.
论文以新的语音信号稀疏基—准KLT基的构造为基础,提出了一种新的基于稀疏分解的单通道混合语音分离方法.论文首先以理想准KLT基的构造为基础,从理论上提出并证明了基于各源语音信号的理想准KLT基,利用l exp(0)-范数优化算法,可实现单通道混合语音的完美分离.鉴于单通道混合语音分离时,无法精确求取各源语音信号的理想准KLT基,论文提出先基于正交匹配追踪算法,以混合语音信号为已知条件,构造各源语音信号的正交匹配追踪模板匹配准KLT基,再由l exp(0)-范数优化算法来分离单通道混合语音.仿真实验表明论文所提理论的正确性,和基于正交匹配追踪模板匹配准KLT基来分离单通道混合语音信号的有效性. 相似文献
6.
7.
8.
使用STM32F103ZET6处理器及LCD构建了一个嵌入式语音识别设备,使用片内12 bit ADC实现16 kHz音频中断采样,使用分段处理语音数据的方式,减少了SRAM的使用量,在采样间隙进行预处理及MFCC参数提取,充分利用了CPU时间,使总识别时间减少。最后使用DTW匹配算法进行模式识别,经实验使用24维MFCC参数进行识别匹配时识别率为93%。 相似文献
9.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法. 相似文献
10.
为了提高语音信号的识别率,提出了一种改进的语音信号特征提取算法。该算法在MFCC参数的基础上,增加每帧信号的短时能量和短时过零率,使得新参数能够更为准确地表征语音信号。通过仿真实验。说明了新特征参数取得了较高的识别率。 相似文献
11.
12.
13.
本文根据语音信号在离散余弦变换(discrete cosine transform,DCT)域上的近似稀疏性,将压缩感知(compressed sensing,CS)应用于语音增强。提出了一种基于压缩感知的语音增强新算法。算法采用对语音信号具有一定鲁棒性的行阶梯矩阵,对含噪语音进行压缩观测,通过改进的正交匹配追踪OMP(orthogonal matching pursuit,OMP)算法重构语音信号,最后用低通滤波器对重构语音进行平滑滤波,实现语音增强。实验结果表明:本文所提语音增强算法在提高输出信噪比的同时,减少了重构时间,具有较强的鲁棒性。 相似文献
14.
为了提高利用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)特征向量进行心音信号分类的准确率,本文提出以一种基于独立成分分析(Independent Component Analysis, ICA)及权值优化的MFCC特征向量优化方法。首先,通过消除趋势项、降噪、提取心动周期与基础心音分割等步骤对心音信号预处理;接着,对提取的基础心音信号做Mel频谱变换及倒谱分析提取MFCC特征向量,其中用ICA替代离散余弦变换去除分量间高阶量的相关性,同时采用相关系数为权值优化整体混合矩阵;最后,采用F比衡量特征向量贡献率,并以其为权值优化各维特征向量。通过提取MFCC特征向量采用支持向量机(Support Vector Machine, SVM)的分类器识别第一心音及第二心音,并与人工标注心音状态集进行对比。实验结果表明,基于ICA及权值优化的MFCC特征向量在SVM分类器中识别率得到了有效的提升,且优化算法具备一定抗噪性能。 相似文献
15.
16.
17.
基于ARM的说话人识别系统的研究与实现 总被引:1,自引:0,他引:1
提出了一种基于压缩感知(CS)的说话人识别算法以及在ARM系统中的实现,首先,介绍压缩感知理论框架,提出说话人识别可以与压缩感知理论相结合的依据;其次,提出基于压缩感知的说话人识别算法的基本方法,即建立说话人语音特征数据库和基追踪匹配得到最大均值系数,其中,语音特征向量由GMM均值超向量核算法得到,大量实验数据表明,该方法一定程度上提高了识别率,并且在说话人集合较大的情况下识别效果较好。 相似文献
18.
19.
针对人脸语音动画提出了基于小波包分析的语音特征提取算法,为了表征语音的动态特性,采用了特征差分和基于口形帧前后关联的多帧语音特征提取,井利用主成分分析(Principle Component Analysis,PCA)降低了输入语音的特征维数.基于隐马尔可夫模型(Hidden Markov Model,HMM)的可视语音合成系统的实验表明该算法提取的语音参数比传统的Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficients,MFCC)合成的口形效果要好,有利于可视语音合成的研究. 相似文献
20.
利用隐马尔可夫模型(HMM)的动态时间序列建模能力及神经网络的模式分类能力,构成混合语音识别模型,同时考虑到语音信号的非平稳性,采用小波分析方法提取语音特征向量。通过时间规整方法,将所有具有可变长度的语音特征向量转换为相同维数的特征向量,从而简化了神经网络的结构。仿真结果表明,采用混合语音识别模型以及时间规整方法,不仅可提高识别率,同时大大缩减了训练时间,获得了很好的识别效果。 相似文献