首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
李战明  苏敏  赵正天  李二超 《电声技术》2007,31(12):44-46,50
基于隐马尔可夫模型(HMM)和改进后的概率神经网络(PNN)模型提出了一种用于语音识别的混合模型,该模型首先利用HMM生成最佳语音状态序列,然后对最佳状态序列进行时间规整,最后通过PNN神经网络进行分类识别。给出了HMM参数训练及时间规整的算法。实验结果表明这种模型比HMM具有更好的识别效果。  相似文献   

2.
低空目标声信号是时变的、非平稳的,若以传统的Mel倒谱系数(MFCC)作为特征参数,虽然能模拟人耳的听觉特性,但不能更好地反映低空声信号的动态特性。基于小波变换可以精确反映非平稳信号瞬间变化的特点,文中用小波变换替代MFCC参数提取过程中的FFT变换,将改进后的MFCC与能够很好表征时变信号特性的隐马尔可夫模型(HMM)结合,对低空目标声信号进行检测识别。最后用实际采集到的直升机声信号和非直升机声信号进行实验,取得了较好的识别效果。实验的对比结果验证了该方法的有效性和可行性。  相似文献   

3.
基于压缩感知的分布式语音压缩与重构   总被引:7,自引:3,他引:4  
本文首先阐述了压缩感知(CS)的理论框架,然后分析了语音信号的特点--短时平稳性、离散余弦(DCT)基下的稀疏性,最后提出了基于CS理论的分布式语音压缩重构的框架.基于此框架采用基追踪(BP)和正交匹配追踪(OMP)算法对已压缩的语音信号进行重构,得出结论:每帧语音信号选取的帧长的大小,基于CS理论压缩得到的观测数的多少,都对重构性能有影响.  相似文献   

4.
在语音信号分析的理论基础上,考虑了语音识别系统的实际应用要求,提出了小波去噪技术的研究。文中介绍了小波分析的基本理论,选取了最佳小波基,有效去除了语音信号中大部分噪声。采用了MFCC参数和HMM算法,最终建立了噪声环境下语音识别系统。  相似文献   

5.
郭海燕  杨震  朱卫平 《电子学报》2012,40(4):762-768
 论文以新的语音信号稀疏基—准KLT基的构造为基础,提出了一种新的基于稀疏分解的单通道混合语音分离方法.论文首先以理想准KLT基的构造为基础,从理论上提出并证明了基于各源语音信号的理想准KLT基,利用l exp(0)-范数优化算法,可实现单通道混合语音的完美分离.鉴于单通道混合语音分离时,无法精确求取各源语音信号的理想准KLT基,论文提出先基于正交匹配追踪算法,以混合语音信号为已知条件,构造各源语音信号的正交匹配追踪模板匹配准KLT基,再由l exp(0)-范数优化算法来分离单通道混合语音.仿真实验表明论文所提理论的正确性,和基于正交匹配追踪模板匹配准KLT基来分离单通道混合语音信号的有效性.  相似文献   

6.
为解决特殊群体使用计算器困难的问题,设计了一种基于TMS320VC5509 DSP的可语音识别的计算器系统.该计算器系统的核心是采用HMM算法建立语音识别模型.通过对实时语音信号(数字、运算符号等语音)进行处理,将得到的参数与模板库参数进行匹配并加以识别,利用TMS320VC5509 DSP自带的计算模块实现语音信号整数100以内的加、减、乘、除等计算功能.实验结果表明,该计算器系统在低噪声场合和高噪声场合下识别率分别达到94.73%和76.55%.  相似文献   

7.
特征提取是雷达目标识别系统中很关键的环节,获得一种稳健的目标特征尤为重要。可以利用稀疏分解的方法把雷达高分辨距离像(HRRP)表示在一个超完备Gabor时频字典上,进而提取字典原子的特征参数作为特征向量进行识别;针对匹配追踪算法计算量大的问题,利用遗传算法搜索能力强收敛速度快的优点对OMP算法进行改进。通过对雷达高分辨距离像(HRRP)的识别实验表明,采用Gabor原子提取的特征参数作为特征向量对雷达目标的分类效果比较好。同时,基于GA改进的OMP算法大大降低了参数寻优的计算量。  相似文献   

8.
王冲  施玉霞 《电声技术》2013,37(2):58-61
使用STM32F103ZET6处理器及LCD构建了一个嵌入式语音识别设备,使用片内12 bit ADC实现16 kHz音频中断采样,使用分段处理语音数据的方式,减少了SRAM的使用量,在采样间隙进行预处理及MFCC参数提取,充分利用了CPU时间,使总识别时间减少。最后使用DTW匹配算法进行模式识别,经实验使用24维MFCC参数进行识别匹配时识别率为93%。  相似文献   

9.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法.  相似文献   

10.
王彪 《电子设计工程》2011,19(21):59-61
为了提高语音信号的识别率,提出了一种改进的语音信号特征提取算法。该算法在MFCC参数的基础上,增加每帧信号的短时能量和短时过零率,使得新参数能够更为准确地表征语音信号。通过仿真实验。说明了新特征参数取得了较高的识别率。  相似文献   

11.
针对语音识别这种典型的多类分类问题,提取MFCC参数作为语音特征,采用支持向量机(SVM)作为识别算法,进行非特定人孤立词识别.在给出一种多类分类方法并分析该算法优缺点的基础上,对算法中的所有参数进行测试,选取最佳参数进行实验,识别率达到95%以上.为了满足语音识别系统对实时性和便携性的要衷,将该算法在0MAP5912嵌入式系统开发平台上进行实现,与传统的语音识别系统相比,该系统易于使用,语音识别更为快速便捷.并且具有一定的通用性.  相似文献   

12.
基于PCANN/HMM混合结构的语音识别方法   总被引:1,自引:0,他引:1  
赵力  邹采荣  吴镇扬 《信号处理》2001,17(5):473-476
本文提出了一种基于PCANN/HMM混合结构的语音识别方法,它采用相继几帧组成的特征参数矢量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息,同时为了改善多帧特征输入HMM的输出概率密度函数性能,在HMM的前端增加语音参数压缩的主分量分析神经网络(PCANN).通过对多讲者汉语连续语音识别实验,证实了本文提出方法的有效性.  相似文献   

13.
周伟栋  杨震  于云 《信号处理》2016,32(3):287-295
本文根据语音信号在离散余弦变换(discrete cosine transform,DCT)域上的近似稀疏性,将压缩感知(compressed sensing,CS)应用于语音增强。提出了一种基于压缩感知的语音增强新算法。算法采用对语音信号具有一定鲁棒性的行阶梯矩阵,对含噪语音进行压缩观测,通过改进的正交匹配追踪OMP(orthogonal matching pursuit,OMP)算法重构语音信号,最后用低通滤波器对重构语音进行平滑滤波,实现语音增强。实验结果表明:本文所提语音增强算法在提高输出信噪比的同时,减少了重构时间,具有较强的鲁棒性。   相似文献   

14.
为了提高利用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)特征向量进行心音信号分类的准确率,本文提出以一种基于独立成分分析(Independent Component Analysis, ICA)及权值优化的MFCC特征向量优化方法。首先,通过消除趋势项、降噪、提取心动周期与基础心音分割等步骤对心音信号预处理;接着,对提取的基础心音信号做Mel频谱变换及倒谱分析提取MFCC特征向量,其中用ICA替代离散余弦变换去除分量间高阶量的相关性,同时采用相关系数为权值优化整体混合矩阵;最后,采用F比衡量特征向量贡献率,并以其为权值优化各维特征向量。通过提取MFCC特征向量采用支持向量机(Support Vector Machine, SVM)的分类器识别第一心音及第二心音,并与人工标注心音状态集进行对比。实验结果表明,基于ICA及权值优化的MFCC特征向量在SVM分类器中识别率得到了有效的提升,且优化算法具备一定抗噪性能。   相似文献   

15.
研究语音识别技术在康复机器人控制系统中的运用.通过对语音信号进行分析,提取线性预测系数(LPC)作为特征参数.然后采用隐马尔可夫模型(HMM)进行模板匹配,对有限的词汇进行识别雇康复机器人的语音控制中,语音识别模块作为独立的子系统,与上位机之间通过USB串口进行数据交换.上位机将读取的语音识别结果转换成命令,控制康复机器人执行指定的康复运动.  相似文献   

16.
为了方便学生使用中文或英文说出学号与名字登录注册系统,设计了中英文数字语音登录系统。采用MFCC(Mel频率倒谱系数)作为语音特征参数,在隐马尔可夫模型HMM(HiddenMarkovModel)框架下建立了基于语音识别开发工具包HTK的中英文连续数字语音识别系统,包括对语音信号的预处理、特征参数的提取,识别模版的训练,最后送到识别器进行识别。通过建立中文、英文和中英文混合训练集和测试集声学模型,并得到了较高的识别率,从而加强多媒体注册系统的稳定性和鲁棒性。  相似文献   

17.
基于ARM的说话人识别系统的研究与实现   总被引:1,自引:0,他引:1  
提出了一种基于压缩感知(CS)的说话人识别算法以及在ARM系统中的实现,首先,介绍压缩感知理论框架,提出说话人识别可以与压缩感知理论相结合的依据;其次,提出基于压缩感知的说话人识别算法的基本方法,即建立说话人语音特征数据库和基追踪匹配得到最大均值系数,其中,语音特征向量由GMM均值超向量核算法得到,大量实验数据表明,该方法一定程度上提高了识别率,并且在说话人集合较大的情况下识别效果较好。  相似文献   

18.
目前,关于语音识别的研究尚处在实验室环境中,而实际的语音总是与噪声和干扰并存。人类能够在信噪比很低甚至在有干扰声音存在的环境中正确识剐语音主要是依靠人的双耳输入作用,本文就模仿人耳的听觉掩蔽效应来掩蔽噪声信号,提出了一种MFCC(Mel频率倒谱系数)改进提取算法。该算法能更好地减少噪声信号对纯净语音信号的影响,从而提高语音信号的识别率。实验表明改进后的算法相对于传统的MFCC提取算法大约有4.43%~8.42%的相对性能提升。  相似文献   

19.
针对人脸语音动画提出了基于小波包分析的语音特征提取算法,为了表征语音的动态特性,采用了特征差分和基于口形帧前后关联的多帧语音特征提取,井利用主成分分析(Principle Component Analysis,PCA)降低了输入语音的特征维数.基于隐马尔可夫模型(Hidden Markov Model,HMM)的可视语音合成系统的实验表明该算法提取的语音参数比传统的Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficients,MFCC)合成的口形效果要好,有利于可视语音合成的研究.  相似文献   

20.
利用隐马尔可夫模型(HMM)的动态时间序列建模能力及神经网络的模式分类能力,构成混合语音识别模型,同时考虑到语音信号的非平稳性,采用小波分析方法提取语音特征向量。通过时间规整方法,将所有具有可变长度的语音特征向量转换为相同维数的特征向量,从而简化了神经网络的结构。仿真结果表明,采用混合语音识别模型以及时间规整方法,不仅可提高识别率,同时大大缩减了训练时间,获得了很好的识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号