共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
本文主要研究连续语音中单词音节的神经网络建模问题.采用了一种富有特色的特征提取方法,并依据高维空间点覆盖理论,对实际连续数字语音的各不同数字音节,以人工切自连续数字语音中的2640个单字音节,构建连续语音中各不同数字音节的特征空间覆盖区,并使用7308个自连续数字语音中切分出的单字音节,利用仿生模式识别原理,进行了建模正确性验证.验证结果正确率达到97%以上,对同样数量的少量建模样本,识别率优于SVM方法. 相似文献
5.
6.
重音是语音合成、语音识别、语音情感识别中表征韵律信息的一个重要参数,对提高语音合成系统的自然度、语音识别系统的准确率、语音情感识别系统的正确率等有着重要的作用.基于汉语双模情感语音数据库(ChineseDual-mode Emotional Speech Database,CDESD),采用改进的双门限判决法对连续语音进行音节分割,将音节的声学相关特征作为输入,数据库中人工标注的重音信息作为监督,建立了基于神经网络以及支持向量机(Support Vector Machine,SVM)的两种重音预测模型.实验表明,基于SVM的重音预测模型具有更好的分类效果,在CDESD能够获得82.89%的识别率. 相似文献
7.
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。 相似文献
8.
9.
用子波变换提取语音的谱包络参数 总被引:1,自引:0,他引:1
本文将子波变换应用于提取语音信号的谱包络参数。这种谱包络提取法模拟了人耳的频谱分辨特性,因而能很好地用于语音处理。与传统的LPC谱包络提取法相比,它能降低所用的阶数。本文先介绍子波的基本原理,然后在此基础上介绍子波变换语音谱包络提取法及实验结果。 相似文献
10.
基于经典隐马尔可夫模型的汉语连续语音识别系统 总被引:1,自引:0,他引:1
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。 相似文献
11.
12.
13.
14.
15.
基于谱稳定性特征的语音与笑声区分新方法 总被引:1,自引:0,他引:1
该文提出一种采用谱稳定性作为特征参数的区分语音与笑声的新方法.通过分析语音与笑声的谱稳定性参数的特性,发现前者明显小于后者,这表明谱稳定性可以作为区分语音与笑声的特征参数.比较了采用谱稳定性参数、Mel频率倒谱系数、感知线性预测和基音频率等特征参数在相同实验条件下区分语音与笑声的性能.实验结果表明:在特定人和非特定人情况下,采用谱稳定性作为特征参数区分语音与笑声的正确率分别为90.74%和73.63%,其区分能力优于其它特征参数. 相似文献
16.
17.
18.
19.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。 相似文献
20.