首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。  相似文献   

2.
目的 获得具有更好的说话人鉴别特征,改善说话人识别系统.方法 首先用KFD对语音信号的MFCC特征进行再提取,然后用SVM对提取的特征分类辨认.结果 比较了LPC和KDA提取MFCC后的3种特征的识别结果.其中LPC的识别结果在89%左右,MFCC识别结果在96%左右,提取后的识别结果在97%左右.其识别率比提取前有明显的提高.结论 该方法对说话人有更好的识别能力.KFD比传统的LDA能提取出可分性更强的特征,提高了系统的识别率,同时由于该方法的复杂性,也增加了系统的运算时间.今后,应该针对如何进一步提高系统的识别率和缩短系统的运算时间等问题进行研究.  相似文献   

3.
基于GA/VQ的说话人辨认的研究与实现   总被引:3,自引:0,他引:3  
为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA/VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。  相似文献   

4.
针对最大似然训练分辨能力的不足,把最大互信息训练方法引入到高斯混合模型(GMM)的训练中,并直接采用进化策略实现模型参数的全局训练,以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强,而且摆脱了局部搜索的缺陷。实验结果表明,这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法(EM)生成的系统。  相似文献   

5.
基于组合神经网络的与文本无关的说话人识别   总被引:1,自引:1,他引:0  
提出了一种用于N个说话人识别的组合神经网络,由N个子网组成,每个子网完成两类模式区分,将这N个子网组合起来完成N类模式的区分.子网选用RBF神经网络,并给出了自组织选取中心的方法.实验显示,对6名说话人,识别率达到94%.对10名说话人,识别率达93.17%.  相似文献   

6.
基于HMM/MLFNN混合结构的说话人辨认研究   总被引:3,自引:0,他引:3  
将隐马尔可夫模型与人工神经网络相结合既利用HMM能够较好地描述动态时间序列又ANN静态分类能力强的特点,应用于说话人辨认。本文将一个多层前馈神经网络与HMM相结合构成混合模模型,与以往的方法不同。具有所需训练数据量小,推广性能良好的特点。  相似文献   

7.
两级决策的开集说话人辨认方法   总被引:10,自引:0,他引:10  
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。  相似文献   

8.
针对语音特征的自身特点,通过对Fisher判别技术的研究,提出采用核Fisher判别技术来解决说话人辨认.核Fisher判别技术在判别中使用所有训练样本,显著提高了系统的识别率.实验数据表明,该方法在不影响系统实时性的情况下,有效地提高了说话人辨认系统的识别率.  相似文献   

9.
说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。  相似文献   

10.
采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率.  相似文献   

11.
12.
基于组合神经网络和模糊聚类的话者分类   总被引:2,自引:0,他引:2  
基于话者分类的自适应语音识别是实现非限定人、大字表语音识别的一种很有前途的有效方法.本文设计了一种用于话者分类的主从式组合神经网络,以神经预测模型作为从网络,可以从短语音(一个音节,约0.3秒)中有效地提取、规正和压缩话者个人性信息;主网络采用具有很强聚类功能的自组织特征映射网络.针对话者个人性信息的模糊性,提出了模糊系统聚类算法和双类心聚类算法.实验验证了组合神经网络对于话者分类的有效性以及模糊聚类算法对不同文本的语音样本具有较好的适应性  相似文献   

13.
杨继峰 《科学技术与工程》2012,12(22):5619-5623
基于神经网络的非线性、大滞后系统辨识是当前研究的热点之一,介绍了神经网络辨识的基本原理,研究了BP与RBF神经网络两种典型网络的设计和算法,最后通过MATLAB进行了仿真分析与比较。仿真结果表明:一致性方面RBF优于BP神经网络,RBF神经网络收敛速度更快,辨识效果更好;泛化性能方面RBF网络较差,不如BP网络。由此得出两种网络各自的优缺点,在实际应用中可以此作为神经网络模型辨识的参考。  相似文献   

14.
人工神经网络是-个非线性动力学系统,具有自适应、自组织、自学习等功能。本文利用人工神经网络具有表达任意非线性映射的能力,对非线性系统进行系统辨识。仿真结果表明,该方法是可行的,计算精度高。  相似文献   

15.
提出了基于神经网络的负载识别方法,对供电系统管理有重要的现实意义.  相似文献   

16.
主要介绍利用多层神经网络进行非线性系统辨识的几种模型以及相应的算法,并分析和比较它们的辨识性能.为高度不确定性动态系统的综合设计提出了一种分析方法。  相似文献   

17.
基于PID神经网络的非线性系统辨识与控制   总被引:2,自引:0,他引:2  
针对工业控制领域中非线性系统采用传统的控制方法不能达到满意的控制效果,提出一种基于P ID神经网络的控制方案,以对其进行辨识和控制。将P ID神经网络引入控制系统中,既具有常规P ID控制结构简单、参数物理意义明确等优点,同时又具有神经网络的并行结构和学习记忆功能及非线性映射能力。仿真结果表明:该控制系统响应速度快、超调量小、稳态精度高,能够快速跟踪系统输出并进行有效控制,且具有一定的自适应性和鲁棒性,满足实时控制的要求。  相似文献   

18.
根据实际生产现场对控制的要求,提出了一种将PID控制与神经网络相结合,采用BP网络辨识未知的被控对象,使用单纯形算法寻找最优的PID控制参数,控制与学习并行的控制方案.并对二阶对象进行仿真研究,将其与单位阶跃响应进行了比较.  相似文献   

19.
基于模糊神经网络的水力机组模型辨识   总被引:5,自引:0,他引:5  
根据水力机组可分段线性化的特性,提出了水力机组简易模糊语言模型。在此基础上,将反馈控制思想引入系统辨识,同时结合神经网络的易学习特点给出了基于模糊神经网络的水力机组模型结构及其算法。最后将所建模型运用于灯泡贯流式机组的在线预测。试验结果表明,该模型在线修正工作量小,并能迅速地、较为准确地逼近实际系统的输出,可以作为贯流式机组自适应控制的实时预测模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号