首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率.但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低.为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法.上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度.利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类.在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率.  相似文献   

2.
线性预测分析在连接词语音识别中的研究   总被引:1,自引:0,他引:1  
特征参数的提取是关系到语音识别系统性能好坏的关键,而线性预测分析是目前普遍采用的特征参数提取方法.针对在连接词和连续语音识别系统中,传统的线性预测系数已不能满足特征提取的要求,研究采用了三种主要的线性预测推演参数,即线性预测反射系数、线谱对系数和线性预测倒谱系数,及其在连接词语音识别系统中的应用,并进行计算机仿真.仿真结果表明,在输入语音库与信噪比一致的情况下,线性预测倒谱系数的识别率最高.从而证明,在包含语义特征信息和说话人特征方面,线性预测倒谱系数性能要优于线谱对系数和线性预测反射系数.  相似文献   

3.
语音识别系统及其特征参数的提取研究   总被引:2,自引:0,他引:2  
魏星  周萍 《计算机与现代化》2009,(9):167-168,172
在语音识别系统中,特征参数的选择对系统的识别性能有关键性的影响,本文主要研究几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、基于小波分析的参数等,并对这些参数进行了分析和比较,最后对语音识别的研究未来进行了展望.  相似文献   

4.
在噪声环境下能准确有效地提取语音信息是语音识别的重点难点,将其应用于嵌入式系统中,有一定的研究意义.通过比较分析传统的语音特征参数提取的方法:线性预测倒谱系数,Mel频率倒谱系数,提出了一种新的方法,采用Mel频率倒谱系数与一阶差分Mel频率倒谱系数(MFCC+ A MFCC)相结合的方法提取语音特征参数,结合双门限检测法进行端点检测和HMM模型进行模型匹配,并进行了以ARMSX2410为核心硬件与软件的系统设计.该方法较传统方法提高了系统的鲁棒性、识别的准确率和系统效率,适用于噪声环境下的语音识别.  相似文献   

5.
语音倒谱特征的研究   总被引:24,自引:1,他引:24  
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。  相似文献   

6.
搭载Android智能手机平台,结合了梅尔倒谱系数和共振峰特征参数,在安卓平台上设计开发出一款集心音采集、心音显示以及心音识别等功能的心音身份识别系统。在该系统中,首先对采集的待测心音信号进行数字化、预加重、分帧、加窗处理,然后提取出心音信号的梅尔倒谱系数特征参数,利用动态时间规整算法将其与数据库模板心音逐一进行模式匹配,并将拥有最小欧氏距离的数据库模板心音作为最终识别结果,最后展示出待测心音和数据库所有模板心音的共振峰特性对比图,定性地反映待测心音和数据库模板心音的差异,给用户直观的判断和感受,进一步认证识别的结果。系统界面简洁,操作方便,识别速度较快,实现了真机运行,并达到了预期效果。  相似文献   

7.
杨海燕  吴雷  周萍 《测控技术》2019,38(5):88-93
在连续语音识别系统中,针对强噪声环境下传统双门限语音检测方法出现的误检问题,提出了一种结合压缩感知理论和MFCC倒谱系数的端点检测算法。该算法采用Hadamard随机观测矩阵和改进的OMP重构算法对语音信号进行压缩感知与重构,利用语音信号在离散余弦基上的近似稀疏性,提取重构信号的MFCC倒谱系数来检测语音信号的端点。仿真结果表明,提出的改进算法具有较强的鲁棒性,能满足在强噪声环境下对连续语音信号进行有效端点检测的要求。  相似文献   

8.
提出了基于多元自适应回归样条法(Multivariate adaptive regression spline,MARS)的语音清晰度客观评价方法.该方法提取语音信号的Mel倒谱系数作为评估语音清晰度的候选特征参数.在Mel倒谱系数的失真距离基础上,利用MARS方法选出时语音清晰度影响较大的特征参数,并结合主观DRT分建立最佳客观预测模型,实现特征参数失真距离到客观DRT分的映射.仿真结果表明,分别采用训练集合样本和测试集合样本进行测试时,使用该方法评价的客观DRT分与主观DRT分的相关度.分别达到0.958和0.910 2.  相似文献   

9.
几种语音识别特征参数的研究   总被引:2,自引:0,他引:2  
语音识别就是研究让机器最终能听懂人类口述的自然语言的一门学科,具有广阔的应用前景。在语音识别系统中,提取语音的特征参数是系统的关键问题之一。文中首先分析了常用的线性预测参数LPCC、梅尔倒谱参数MFOC及其它们的一阶差分△LPCC和△MFCC的原理和实现方法,提取了LPOC十△LPCC和MFCC+△MFCC,两种参数。其次,讨论了动态时间弯折DTW识别算法。最后,在Matlab平台上,分别采用LPCC、LPCC+△LPCC,MFCC,MFCC+△MFCC作为特征参数结合DTW识别算法进行实验仿真,结果表明MFCC+△MFCC参数的识别率最高,LPCC的识别率最低。  相似文献   

10.
陈晓  马建仓 《计算机测量与控制》2012,20(8):2028-2030,2033
根据人耳听觉特性,利用Mel倒谱系数提取有利于发动机振动故障识别的特征;前向神经网络的反向传播算法对类别数目小、但分类困难的模式识别问题有良好的分类效果;针对Mel倒谱系数分析提取的发动机振动故障分类的特征,分别采用BP网络和RBF网络对飞机发动机振动故障进行识别;结果表明:Mel倒谱系数的维数可以改变,选择合适的的Mel特征参数可以有效地提高发动机故障的识别率;RBF网络的故障识别率较高。  相似文献   

11.
杜晓青  于凤芹 《计算机工程》2013,(11):197-199,204
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱一感知线性预测倒谱系数(RASTA—PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。  相似文献   

12.
提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+α△MFCC+β△△MFCC为特征参数的分类正确率明显高于MFCC、MFCC+△MFCC和MFCC+△MFCC+△MFCC。  相似文献   

13.
毕继武  韩纪庆 《计算机科学》2002,29(12):150-153
1 引言话者在心理紧张和情绪变化时语音会发生变异,如在身体不适(如感冒)时、恐惧、愤怒、环境噪声影响下,以及生理情况受到影响(如加速度变化)时,其语音都会发生改变。发音变异可以引起各语音参数的不同变化,以致常规语音识别系统的识别率大大下降。从八十年代末开始,就有人研究顽健(ro-bust)语音识别问题,针对噪声下的研究工作已经取得了非常显著成效,但针对应力影响下变异语音识别的研究则很有限。应力影响下变异语音识别是一个难度较大的问题,因为应力影响同人的发音过程具有直接的物理关系,其所引起的发音  相似文献   

14.
针对语音情感的动态特性,利用动态递归Elman神经网络实现语音情感识别系统。通过连接记忆上时刻状态与当前网络一并输入,实现Elman网络模型的状态反馈。基于此设计了语音情感识别系统,该系统能在后台修改网络类型,并实现单语句与批量语句识别模式。针对系统进行语音情感识别实验表明,基于Elman神经网络的语音情感识别在同等参数模型设置前提下优于BP神经网络识别效果,且BP神经网络参数设置较Elman网络敏感。  相似文献   

15.
针对具有超重尾特性的语音信号,提出了混合拉普拉斯分布语音模型。从理论上探讨了混合拉普拉斯分布模型的参数估计,从原理与算法得以实现。通过最大期望(Expectation Maximization,EM)算法取得了良好效果。创新运用混合拉普拉斯模型研究语音信号处理。  相似文献   

16.
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。  相似文献   

17.
随着微电子技术的高速发展,基于片上系统SOC的关键词识别系统的研究已成为当前语音处理领域的研究热点和难点。运用Xilinx公司ViterxII Pro开发板作为硬件平台,结合ISE10.1集成开发环境,完成了语音帧输出、MFCC、VQ和HMM等子模块的设计;提出了一种语音帧压缩模块架构,有效实现了语音帧信息到VQ标号序列的压缩,实现了由语音帧压缩模块和HMM模块构建的FPGA关键词识别系统。仿真实验结果表明,该系统具有较高的识别率和实时性,为关键词识别系统的FPGA硬件电路的实现研究提供了实例。  相似文献   

18.
为更好地进行目标探测,利用虚拟仪器技术设计了超声信号测量系统,介绍了系统的构成和各模块工作原理。测距是目标探测的关键技术,重点从信号处理的角度,在分析传统超声射程时间TOF测量算法的基础上,提出了两种基于包络的改进算法,并利用LabVIEW软件来实现。最后利用超声信号测量系统完成超声波信号的采集、存储,回波信号的特征和幅值分析、测距分析等实验,结果表明该系统能对超声信号进行直观信号分析处理,测距准确,为后期目标识别提供了基础平台。  相似文献   

19.
刘婧婕  张刚  武淑红 《微机发展》2012,(2):61-64,68
在通信领域中,语音编码是语音信号处理的重要分支。为了适合信道传输,语音必须变换形式,基于承载信息并且保留信号,尽可能地处理。在当今的通信、计算机网络等应用领域中,具备低延迟、低码率两大特性的语音编码算法,发挥着决定性作用。在语音编码中,线性预测分析技术主要应用在感觉加权滤波器、综合滤波器及对数增益滤波器,该技术发挥着关键作用。文中的工作是呈现出一种混合LPC(Auditory-Acoustic-Hybrid-LPC)系数,它结合声学特性与听觉特性,以便提高编码后合成语音的听觉质量,这对编码算法的钻研有积极意义。  相似文献   

20.
情感特征的提取是语音情感识别的重要方面。由于传统信号处理方法的局限,使得提取的传统声学特征特别是频域特征并不准确,不能很好地表征语音的情感特性,因而对情感识别率不高。利用希尔伯特黄变换(HHT)对情感语音进行处理,得到情感语音的希尔伯特边际能量谱;通过对不同情感语音的边际能量谱基于Mel尺度的比较分析,提出了一组新的情感特征:Mel频率边际能量系数(MFEC)、Mel频率子带频谱质心(MSSC)、Mel频率子带频谱平坦度(MSSF);利用支持向量机(SVM)对5种情感语音即悲伤、高兴、厌倦、愤怒和平静进行了识别。实验结果表明,通过该方法提取的新的情感特征具有较好的识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号