首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
语音识别说话人自适应研究现状及发展趋势   总被引:12,自引:0,他引:12  
说话人自适应是提高非特定人语音识别系统识别性能的有效手段.本文介绍了说话人自适应研究的现状,包括自适应的不同方式和不同算法,并详细介绍了目前应用最为广泛的MLLR算法和MAP算法.本文还给出了对说话人自适应研究发展趋势的预测.  相似文献   

2.
基于小波神经网络的原理对与文本无关的说话人进行了识别.通过分析网络结构,提出了优化网络初始参数的方法,加快了小波网络的收敛速度;采用分组器与阵列搜索算法相结合,减少了识别时的搜索时间.实验结果表明该识别系统能大大提高识别人数和识别速度,在43人的语音识别中,识别率达到97.67%.  相似文献   

3.
基于自适应小生境混合遗传算法的说话人识别   总被引:4,自引:0,他引:4       下载免费PDF全文
林琳  王树勋 《电子学报》2007,35(1):8-12
为了解决传统高斯混合模型(Gaussian Mixture Model,GMM)对初值敏感,在实际训练中极易得到局部最优参数的问题,本文提出了一种GMM参数优化的新方法.将小生境技术与最大似然估计融入到遗传训练过程,形成了一种新的混合算法,缓解了遗传算法产生的"早熟"现象,提高了算法的局部搜索能力.采用自适应策略来控制交叉和变异算子,同时在适应度评价中融入了其他用户的区分性信息,提高了模型的分类精度,增强了GMM的泛化能力.实验表明,与传统和改进的两种方法相比,本文的方法都可以得到更优的模型参数,使得系统的识别率进一步提高.  相似文献   

4.
南兆营 《电声技术》2021,45(2):23-27,31
传统的法庭说话人识别方法存在对语音数据建模能力差、特征提取难以及容易受噪声干扰影响等问题,为了改进这些问题,提出一种基于卷积神经网络的法庭说话人识别方法.该方法以AlexNet网络为基础进行参数调整,为了弥补ReLU函数作为激活函数时易出现神经元坏死和偏移的现象,融合Tanh和ReLU函数的特性,构造一种新的TR函数作为网络的激活函数.同时,为了避免人工提取语音特征的主观性和不全面性,在实验中将语音转换成声纹图作为网络输入.实验结果表明,激活函数为TR函数时,该方法在法庭说话人识别数据集的准确率达到了92.24%,在花朵图像公开数库的准确率达到了96.13%,效果均好于Tanh和ReLU函数.  相似文献   

5.
尉洪  杨鉴  普园媛  赵征鹏 《信号处理》2005,21(Z1):196-199
说话人自适应是提高非特定人语音识别系统识别性能的有效手段,本文针对非母语说话人,结合常规的自适应技术MLLR和MAP,探索云南纳西族和傈僳族两种母语说话人的汉语普通话语音识别问题,实验结果显示有显著效果.  相似文献   

6.
王坚 《中国新通信》2007,9(11):60-63
针对语音识别中快速说话人自适应问题,对已有的说话人支持权重算法进行改进,利用支撑向量机(Support Vector Machines,SVM)参与支持说话人选择过程,并采用最大后验概率(Maximum a Posteriori,MAP)代替最大似然(Maximum Likelihood,ML)准则进行支撑说话人权重的估算,最后对测试说话人进行线性组合。与现有的相关自适应方法相比,该算法能够有效提高自适应数据较少时的性能。实验结果表明,在仅有一句自适应语句的情况下系统汉字正识率从原有非特定人(Speaker Independent,SI)系统的45.67%到58.05%,相对原有说话人支持权重算法提高4.67%。  相似文献   

7.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。  相似文献   

8.
贺涛  周正欧 《信号处理》2006,22(4):515-518
应用高阶统计量和RBF神经网络原理,针对数字调制通信信号提出了一种基于统计模式识别理论的信号调制类型识别新方法。采用信号四阶和六阶统计量提取信号特征,使用新设计的误差函数训练RBF神经网络,使得识别的效率和正确度得到了明显的改善。计算机仿真结果证明了此方法的可行性。  相似文献   

9.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。  相似文献   

10.
提出了针对说话人识别的GMM模型训练的新方法。理论推导和实验结果表明,与GMM常用的传统EM算法相比,提出的新算法能够解决训练中会出现奇异阵的问题,并能提高系统识别率。  相似文献   

11.
为了提高RBF回归建模的精度,该文提出了一种基于模糊分组和监督聚类的RBF回归建模的新方法。基本思想是:首先利用监督聚类将训练样本模糊划分为若干子集,然后分别针对各个子集的样本分布情况进行RBF回归建模,最后利用加权组合得到最终的输出。实验表明,该方法对于目标模型的局部细节具有更好的逼近精度。  相似文献   

12.
范明钰  李振邦 《通信技术》1996,(3):11-13,29
介绍基于误差反向传播算法的多层感知网络在说话者识别中的应用。给出了实验结果。  相似文献   

13.
本文给出了一种语言辨识的新方法。通常来讲,语言辨识系统是说话人无关的,但说话人的个体特征对语言辨识系统有很大的影响,文本采用了一种粗分类精识别的思想,利用说话人聚类技术有效解决了粗分类的问题,对每类相近说话人集合建立模型,然后进行识别。实验表明,该方法对于说话人无关的语言辨识问题是有效的。  相似文献   

14.
陈虹  田八林 《现代电子技术》2005,28(23):91-92,95
人口预测是根据过去人口数据总结人口变化规律,并利用这个规律对未来人口进行预测.神经网络对复杂非线性系统具有曲线拟合能力,能够较好地完成这种预测任务.采用Matlab的神经网络工具箱函数建立神经网络预测模型,编程简单;还能克服常规语言建立预测模型存在的模型结构复杂、训练时间长等缺点.本文通过编程实现了RBF(Radial BasisFunction)神经网络的建立、学习和训练.然后,利用RBF神经网络预测模型对陕西省1970~2004年人口实际数据进行非线性曲线拟合分析和进一步预测,预测最大误差为0.025 5%,算例证明了该方法的实用性和有效性.  相似文献   

15.
本文在MPEG2TM5建议我自适应量化策略的基础上,提出了一种MPEG2视频编码的神经网络自适应量化算法。  相似文献   

16.
自适应投影学习算法是一种简单有效的构造和训练径向基函数神经网络的方法,该方法能迭代地确定径向基函数的个数,中心的位置以及网络的权系数。本文将基于自适应投影学习算法的径向基函数神经网络应用于CDMA系统多用户检测,仿真表明:这种方法对远近问题不敏感,具有良好的误码率性能和抗多址干扰性能。  相似文献   

17.
采用遗传算法的VQ码本设计及说话人识别   总被引:2,自引:0,他引:2  
芮贤义  俞一彪 《信号处理》2005,21(3):289-292
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一。在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能。考虑到遗传算法(GA)是一种具有全局化寻优搜索能力的算法,本文提出了遗传算法和K均值算法相结合的综合分析方法GA-K进行码本设计,改善了码本的质量。讨论了具体的算法实现,分析了在不同的特征参数LPCC及MFCC、不同测试语音长度下的说话人识别性能。实验结果显示,GA-K方法优于传统的LBG算法,可以很好地协调收敛性和识别率之间的关系。  相似文献   

18.
提出了一种新的适用于离散HMM说话人辨认系统的VQ码本训练方法,码本的训练准则是使码本中各码字的利用率趋于均等.将新方法训练的码本与用LBG算法训练的码本进行了比较,实验表明,在基于离散HMM的说话人辨认系统中,用新方法训练的码本性能优于用LBG算法训练的码本,特别是在与文本无关的情况下,使系统的正确辨认率显著提高.  相似文献   

19.
In this paper, we describe a novelapproach to mobile station positioning using a GSMmobile phone. The approach is based on the use of aninherent feature of the GSM cellular system (themobile phone continuously measures radio signalstrengths from a number of the nearest base stations(antennas)) and on the use of this information to estimatethe phone's location. The current values of the signalstrengths are processed by a trained artificial neuralnetwork executed at the computer attached to themobile phone to estimate the position of the mobilestation in real time. The neural network configurationis obtained by using a genetic algorithm that searchesthe space of specific neural network types anddetermines which one provides the best locationestimation results. Two general methods are explored:the first is based on using a neural network forclassification and the second uses functionapproximation. The experimental results are reportedand discussed.  相似文献   

20.
抗非线性交叉串扰自适应噪声抵消的神经网络方法   总被引:5,自引:0,他引:5  
文中对于具有非线交叉串扰的自适应噪声抵消问题,给出了一种用神经网络来解决的方法,并以仿真实验的结果说明了方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号