首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
特征选择通过去除无关和冗余特征提高学习算法性能,本质是组合优化问题。黑寡妇算法是模拟黑寡妇蜘蛛生命周期的元启发式算法,在收敛速度、适应度值优化等方面具有诸多优势。针对黑寡妇算法不能进行特征选择的问题,设计五种优化策略:二进制策略“、或门”策略、种群限制策略、快速生殖策略以及适应度优先策略,提出黑寡妇特征选择算法(black widow optimization feature selection algorithm,BWOFS)和生殖调控黑寡妇特征选择算法(procreation controlled black widow optimization feature selection algorithm,PCBWOFS),从特征空间中搜索有效特征子集。在多个分类、回归公共数据集上验证新方法,实验结果表明,相较其他对比方法(全集、AMB、SFS、SFFS、FSFOA),BWOFS和PCBWOFS能找到预测精度更高的特征子集,可提供有竞争力、有前景的结果,而且与BWOFS相比,PCBWOFS计算量更小,性能更好。  相似文献   

2.
论文在语音信号分析的理论基础上,研究了基于模型补偿的识别算法,对比了语音识别最常用的两种算法:动态时间归整算法(DTW)和隐马尔可夫算法(HMM),并针对两种算法的不足进行了改进。基于改进后的算法在MATLAB环境下搭建了孤立词语音识别系统,提高了识别率,节省了运行时间。  相似文献   

3.
在对语音识别基本理论阐述的基础上,研究了DHMM、DTW和CHMM三种不同的语音识别算法,并通过在MATLAB环境下搭建孤立词数字语音识别系统得出三种不同语音识别算法的具体运行数据,验证了识别理论的正确性,对比三种不同语音识别算法优缺点,为硬件实现语音识别系统提供了重要参考。  相似文献   

4.
5.
针对智能家居系统中信息不能随时随地进行控制及其交流方式不流畅的问题,融合电话公用网和家庭网络设计了一个基于ARM9和语音识别技术的智能家居系统.该系统采用RASTA滤波方法去除语音信号中夹杂的卷积信道噪声,采用改进的动态时间规正(DTW)算法对语音命令进行识别.  相似文献   

6.
针对传统动态时间规正算法速度较慢的缺点,提出基于特殊点的动态时间规正在线手写签名认证算法.特殊点包含了丰富的签名信息,表现了签名者的基本生物特征.该算法缩短了身份认证的时间,提高了身份认证的效率.实验结果表明,该方法速度快、识别率高,进而证明在线手写签名在身份认证中具有很好的应用前景.  相似文献   

7.
动态时间规正(Dynamic Time Warping)是语音识别中的一种经典算法,算法简单有效,因此在实现孤立词识别系统中获得了广泛的应用。提出一种DTW的改进算法,采用两次在时间域上的规正,使计算程序简洁规范,计算量减少。经实验验证,改进DTW算法在不降低识别率的前提下,提高了识别速度,提高了系统的实用性。  相似文献   

8.
朱淑琴  赵瑛 《微计算机信息》2012,(5):150-151,163
研究动态时间规整(Dynamic Time Warping)语音识别算法问题,传统动态时间规整方法需要存储较大的矩阵,直接计算将会占据较大的空间,计算量也比较大,对系统硬件要求比较高。为了减小DTW算法的运算量,提高识别速度,对DTW语音识别算法进行优化改进。将局部路径约束和整体路径约束相结合,仅在一个规定的宽度内搜索动态规划路径,计算累积匹配距离。仿真实验结果表明该方法不仅可以降低运算负载,提高识别速度,而且能在一定程度上提高语音识别率。  相似文献   

9.
在说话人空间中,存在语音特征随句子和时间差异而变化的问题。这个变化主要是由语音数据中的语音信息和说话人信息的变化引起的。如果把这两种信息彼此分离就能实现鲁棒的说话人识别。在假设大的说话人变量的空间为“语音空间”和小的说话人变量的空间为“说话人空间”的情况下,通过子空间方法分离语音信息和说话人信息,提出了说话人辨认和说话人确认方法。结果显示:通过相对于传统方法的比较试验,能用小量训练数据建立鲁棒说话人模型。  相似文献   

10.
相对解码重建后的语音进行说话人识别,从VoIP的语音流中直接提取语音特征参数进行说话人识别方法具有便于实现的优点,针对G.729编码域数据,研究基于DTW算法的快速说话人识别方法。实验结果表明,在相关的说话人识别中,DTW算法相比GMM在识别正确率和效率上有了很大提高。  相似文献   

11.
语音识别特征参数选择方法研究   总被引:11,自引:0,他引:11  
语音识别系统的性能与识别器所用的特征参数密切相关,用正交实验设计进行特征参数选择,提出一种系统性的实用的特征参数选择方法.研究了特征参数排列顺序对识别系统最终识别率的影响,讨论了这种特征参数选择方法的可扩展性.与目前常用识别器相比,新方法的词错误率下降了37%.实验结果表明,正交实验设计用于特征参数选择是有效的,特征参数排列顺序对识别率的影响可以忽略.  相似文献   

12.
基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现.针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法.该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变.这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法.  相似文献   

13.
肖星星  冯瑞 《计算机工程》2012,38(24):171-174
现有说话人识别方法在短时语音条件下识别性能明显下降。为此,提出一种基于共性特征选择的短时说话人识别方法。利用说话人语音数据得到高斯混合模型,提取说话人之间的公共重叠部分,建立共性重叠模型和非重叠模型,根据这2个模型完成测试语音特征的选择,计算其在所有说话人非重叠模型中的相似度,并根据相似性最大化原则进行决策。实验结果表明,该方法具有较强的鲁棒性,且系统识别错误率较低。  相似文献   

14.
随着以隐马尔科夫模型为基础的语音合成技术的发展,冒认者很容易利用该技术生成具有目标说话人特性的合成语音,这对现有的声纹识别系统构成巨大威胁.针对此问题,文中从统计学的角度分析自然语音与合成语音在实倒谱上的区别,并提出对合成语音具有鲁棒性的声纹识别系统.实验结果初步表明,相比于传统的声纹识别系统,在对自然语音的等错误率不...  相似文献   

15.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

16.
针对说话人识别的性能易受到情感因素影响的问题,提出利用片段级别特征和帧级别特征联合学习的方法。利用长短时记忆网络进行说话人识别任务,提取时序输出作为片段级别的情感说话人特征,保留了语音帧特征原本信息的同时加强了情感信息的表达,再利用全连接网络进一步学习片段级别特征中每一个特征帧的说话人信息来增强帧级别特征的说话人信息表示能力,最后拼接片段级别特征和帧级别特征得到最终的说话人特征以增强特征的表征能力。在普通话情感语音语料库(MASC)上进行实验,验证所提出方法有效性的同时,探究了片段级别特征中包含语音帧数量和不同情感状态对情感说话人识别的影响。  相似文献   

17.
罗宪华  杨大利  徐明星  徐露 《计算机科学》2011,38(8):212-213,256
在语音情感识别中,如何选取有效的情感特征是识别过程的重要环节。迄今为止,一些常用的特征选择算法虽然能够帮助提高识别性能,但也存在理论性不强、随机性高、计算量大的缺点。因此提出了一种基于主成分分析(PCA)的特征选择方法,亦即对原始特征集合先进行PCA变换,再利用变换矩阵分析出原始特征进行变换时各自的权重,最后根据权重的大小对原始特征进行选择。实验结果表明,选择出的特征对识别率具有较大的贡献,属于重要特征。  相似文献   

18.
This paper explains a new hybrid method for Automatic Speaker Recognition using speech signals based on the Artificial Neural Network (ANN). ASR performance characteristics is regarded as the foremost challenge and necessitated to be improved. This research work mainly focusses on resolving the ASR problems as well as to improve the accuracy of the prediction of a speaker.. Mel Frequency Cepstral Coefficient (MFCC) is greatly exploited for signal feature extraction.The input samples are created using these extracted features and its dimensions have been reduced using Self Organizing Feature Map (SOFM). Finally, using the reduced input samples, recognition is performed using Multilayer Perceptron (MLP) with Bayesian Regularization.. The training of the network has been accomplished and verified by means of real speech datasets from the Multivariability speaker recognition database for 10 speakers. The proposed method is validated by performance estimation as well as classification accuracies in contradiction to other models.The proposed method gives better recognition rate and 93.33% accuracy is attained.  相似文献   

19.
The new model reduces the impact of local spectral and temporal variability by estimating a finite set of spectral and temporal warping factors which are applied to speech at the frame level. Optimum warping factors are obtained while decoding in a locally constrained search. The model involves augmenting the states of a standard hidden Markov model (HMM), providing an additional degree of freedom. It is argued in this paper that this represents an efficient and effective method for compensating local variability in speech which may have potential application to a broader array of speech transformations. The technique is presented in the context of existing methods for frequency warping-based speaker normalization for ASR. The new model is evaluated in clean and noisy task domains using subsets of the Aurora 2, the Spanish Speech-Dat-Car, and the TIDIGITS corpora. In addition, some experiments are performed on a Spanish language corpus collected from a population of speakers with a range of speech disorders. It has been found that, under clean or not severely degraded conditions, the new model provides improvements over the standard HMM baseline. It is argued that the framework of local warping is an effective general approach to providing more flexible models of speaker variability.  相似文献   

20.
本文提出一种基于词格信息的置信度计算方法,估计自适应语音识别结果的可靠性,将不可靠的语音从自适应训练集中去掉,从而减小无监督自适应与有监督自适应间的性能差异,提高无监督自适应的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号