共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
基于小波神经网络的原理对与文本无关的说话人进行了识别.通过分析网络结构,提出了优化网络初始参数的方法,加快了小波网络的收敛速度;采用分组器与阵列搜索算法相结合,减少了识别时的搜索时间.实验结果表明该识别系统能大大提高识别人数和识别速度,在43人的语音识别中,识别率达到97.67%. 相似文献
3.
为了解决传统高斯混合模型(Gaussian Mixture Model,GMM)对初值敏感,在实际训练中极易得到局部最优参数的问题,本文提出了一种GMM参数优化的新方法.将小生境技术与最大似然估计融入到遗传训练过程,形成了一种新的混合算法,缓解了遗传算法产生的"早熟"现象,提高了算法的局部搜索能力.采用自适应策略来控制交叉和变异算子,同时在适应度评价中融入了其他用户的区分性信息,提高了模型的分类精度,增强了GMM的泛化能力.实验表明,与传统和改进的两种方法相比,本文的方法都可以得到更优的模型参数,使得系统的识别率进一步提高. 相似文献
4.
传统的法庭说话人识别方法存在对语音数据建模能力差、特征提取难以及容易受噪声干扰影响等问题,为了改进这些问题,提出一种基于卷积神经网络的法庭说话人识别方法.该方法以AlexNet网络为基础进行参数调整,为了弥补ReLU函数作为激活函数时易出现神经元坏死和偏移的现象,融合Tanh和ReLU函数的特性,构造一种新的TR函数作为网络的激活函数.同时,为了避免人工提取语音特征的主观性和不全面性,在实验中将语音转换成声纹图作为网络输入.实验结果表明,激活函数为TR函数时,该方法在法庭说话人识别数据集的准确率达到了92.24%,在花朵图像公开数库的准确率达到了96.13%,效果均好于Tanh和ReLU函数. 相似文献
5.
6.
针对语音识别中快速说话人自适应问题,对已有的说话人支持权重算法进行改进,利用支撑向量机(Support Vector Machines,SVM)参与支持说话人选择过程,并采用最大后验概率(Maximum a Posteriori,MAP)代替最大似然(Maximum Likelihood,ML)准则进行支撑说话人权重的估算,最后对测试说话人进行线性组合。与现有的相关自适应方法相比,该算法能够有效提高自适应数据较少时的性能。实验结果表明,在仅有一句自适应语句的情况下系统汉字正识率从原有非特定人(Speaker Independent,SI)系统的45.67%到58.05%,相对原有说话人支持权重算法提高4.67%。 相似文献
7.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。 相似文献
8.
应用高阶统计量和RBF神经网络原理,针对数字调制通信信号提出了一种基于统计模式识别理论的信号调制类型识别新方法。采用信号四阶和六阶统计量提取信号特征,使用新设计的误差函数训练RBF神经网络,使得识别的效率和正确度得到了明显的改善。计算机仿真结果证明了此方法的可行性。 相似文献
9.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。 相似文献
10.
11.
为了提高RBF回归建模的精度,该文提出了一种基于模糊分组和监督聚类的RBF回归建模的新方法。基本思想是:首先利用监督聚类将训练样本模糊划分为若干子集,然后分别针对各个子集的样本分布情况进行RBF回归建模,最后利用加权组合得到最终的输出。实验表明,该方法对于目标模型的局部细节具有更好的逼近精度。 相似文献
12.
13.
14.
人口预测是根据过去人口数据总结人口变化规律,并利用这个规律对未来人口进行预测.神经网络对复杂非线性系统具有曲线拟合能力,能够较好地完成这种预测任务.采用Matlab的神经网络工具箱函数建立神经网络预测模型,编程简单;还能克服常规语言建立预测模型存在的模型结构复杂、训练时间长等缺点.本文通过编程实现了RBF(Radial BasisFunction)神经网络的建立、学习和训练.然后,利用RBF神经网络预测模型对陕西省1970~2004年人口实际数据进行非线性曲线拟合分析和进一步预测,预测最大误差为0.025 5%,算例证明了该方法的实用性和有效性. 相似文献
15.
16.
17.
采用遗传算法的VQ码本设计及说话人识别 总被引:2,自引:0,他引:2
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一。在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能。考虑到遗传算法(GA)是一种具有全局化寻优搜索能力的算法,本文提出了遗传算法和K均值算法相结合的综合分析方法GA-K进行码本设计,改善了码本的质量。讨论了具体的算法实现,分析了在不同的特征参数LPCC及MFCC、不同测试语音长度下的说话人识别性能。实验结果显示,GA-K方法优于传统的LBG算法,可以很好地协调收敛性和识别率之间的关系。 相似文献
18.
19.
In this paper, we describe a novelapproach to mobile station positioning using a GSMmobile phone. The approach is based on the use of aninherent feature of the GSM cellular system (themobile phone continuously measures radio signalstrengths from a number of the nearest base stations(antennas)) and on the use of this information to estimatethe phone's location. The current values of the signalstrengths are processed by a trained artificial neuralnetwork executed at the computer attached to themobile phone to estimate the position of the mobilestation in real time. The neural network configurationis obtained by using a genetic algorithm that searchesthe space of specific neural network types anddetermines which one provides the best locationestimation results. Two general methods are explored:the first is based on using a neural network forclassification and the second uses functionapproximation. The experimental results are reportedand discussed. 相似文献