首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案.通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试验,识别结果表明,10名话者1070个句子的连续语音声调识别的平均识别率是95.1%.  相似文献   

2.
作为汉语语音识别的重要组成部分,声调识别具有关键的作用.提出了一种新的基于前后文相关的模型识别方法用以提高汉语连续语音中的识别率.首先介绍用于声调识别的基因轨迹的提取和处理,然后提出6种特征来描述基因轨迹的变化趋势并给出具体的计算公式,利用这些特征并考虑连续语音中前后音节的相关性对基因轨迹造成的变化而建立细分的声调模型...  相似文献   

3.
基于模糊粗神经网络的汉语声韵母切分   总被引:1,自引:1,他引:0  
针对汉语连续语音,提出一种声韵母切分方法.根据扩展的声韵母为识别基元.采用汉语音节的重叠音素分割策略,利用模糊粗神经网络进行声韵母自动切分.实验室实验证明了该方法进行音节分割的有效性和合理性.  相似文献   

4.
全音节连续汉语语音识别的研究   总被引:3,自引:0,他引:3  
在大词汇量连续汉语语音识别的研究中,我们根据汉语语音自身的特点,选用全音节作为识别单元,与音对文法相结合,以期达到实现大词汇量语音识别的目的.实现连续语音识别时,不需预先切分音节,而使用帧同步型网络搜索算法并在搜索中予以音长控制,用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估,获得了40.40%的音节识别率.  相似文献   

5.
汉语连续语音识别中不同基元声学模型的复合   总被引:1,自引:0,他引:1  
张辉  杜利民 《电子与信息学报》2006,28(11):2045-2049
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。  相似文献   

6.
汉语连续语音三字词声调由于受声道响应、音连、变调规律等的影响,情况较复杂,声调模式间交集大,模糊性强。提出了一种基于动态时间规整和改进神经网络的声调识别算法。实验表明,该算法可得到较好的识别效果,对探讨具有汉语特色的新的语音识别方法有重要意义。  相似文献   

7.
汉语语音识别研究面临的一些科学问题   总被引:12,自引:0,他引:12  
杜利民  侯自强 《电子学报》1995,23(10):110-116,61
本文简述汉语语音自动识别从实验室技术过渡到实际商用技术所必须解决的一些科学问题,列举了汉语语音编码的结构特点和规则,强调(1)在汉语音节的声母、韵母层面上的语言模型对语音的识别很有帮助,也会提供文字语言和讲话语言的有用知识;(2)使用区别性导引特征和描述性均匀特征有助于加速语音识别的搜索速度,减少失配和改善对音位变体的细分,本文还着重讨论了在语音信号的声学处理环节提高语音识别鲁棒性的重要问题和途径,文中还提出了标注性学习、提示性猜测的逐步过渡的训练和自适应方法,用于汉语大词汇连续语音识别。  相似文献   

8.
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。  相似文献   

9.
随着大词汇量连续语音识别技术的发展,越来越多的研究人员选取声韵母作为识别单元。在基于声韵母的汉语连续语音识别中,声韵母基元的准确分割是非常重要的一步。结合汉语发音声学特性,提出了基于声母分割方法和基于段间距离方法相结合的策略。实验结果表明:该方法达到了准确分割的目的。  相似文献   

10.
潘欣裕  赵鹤鸣 《信号处理》2011,27(10):1525-1530
声带准周期振动的缺失,使得汉语耳语音成为了一种特殊的发音模式,也使得耳语声调无法用基音周期表征。目前用于语音识别和声纹识别的常规语音特征,包含声调信息较少,所以在声调识别实验中很难获得良好的效果。本文提出一种新的特征参数来模拟正常语音的基频声调轨迹,即以人的听觉特性为出发点,研究人的声调敏感Bark频带,发现部分扩散Bark谱能量归一化比例拟合曲线,能够呈现出类似正常语音的基频轨迹,这说明在某些方面该轨迹或多或少包含了耳语音的声调信息。在以该轨迹和语音短时能量曲线为特征,以神经网络为模型的耳语声调识别实验中获得了较高的识别正确率,汉语四声的总体识别正确率高达78%,这也为对耳语音的进一步处理提供了很多有力依据。   相似文献   

11.
四声模糊识别方法   总被引:12,自引:0,他引:12  
徐士林 《电子学报》1996,24(1):119-121
本文给出一种快速模糊声调识别方法,用一电平削波、降低采样率和线性插值等形成快速基音提取,应用模糊集合旦论,构成隶属函数对四声进行模式分类。方法具有简便、可靠、快速实时性和容差性等特点。  相似文献   

12.
文章提出了一种基于神经网络的二级语音音调识别方法,采用常用的多层感知器结构BP反向传播算法.对非特定人的音调进行建模及识别。通过对网络输入矢量进行均值差处理,改善了非特定识别的效率,并且加速了网络训练的进程。根据BP网络得出的一级识别结果,再以音长超音段信息作为辅助条件进行二级识别,加速了网络学习进程.提高了识别率。  相似文献   

13.
To utilize the supra-segmental nature of Mandarin tones, this article proposes a feature extraction method for hidden markov model (HMM) based tone modeling. The method uses linear transforms to project F0 (fundamental frequency) features of neighboring syllables as compensations, and adds them to the original F0 features of the current syllable. The transforms are discriminatively trained by using an objective function termed as "minimum tone error", which is a smooth approximation of tone recognition accuracy. Experiments show that the new tonal features achieve 3.82% tone recognition rate improvement, compared with the baseline, using maximum likelihood trained HMM on the normal F0 features. Further experiments show that discriminative HMM training on the new features is 8.78% better than the baseline.  相似文献   

14.
随着现代科技和计算机以及平板电脑等的发展,语音交互将成为人机通信的主要方式,而汉语在语音合成中声调是不可或缺的一个重要组成部分。在声调提取过程中首先采用改进的短时自相关函数的方法进行基音检测,同时为了能较为精确地进行浊音的基音检测,利用变长分帧的方法提取基音周期序列,并通过Matlab仿真得到了汉语语音4种声调的调型曲线。仿真结果表明,该方法所得到的调型曲线与汉语普通话声调的典型曲线较为一致。  相似文献   

15.
A pattern recognition approach is proposed for tone detection. Three basic tone features are extracted from the signal in the form of power, mean frequency, and spectral concentration. These three features are calculated for each signal sample taken during the decision interval and are represented by points in a three dimensional space.The actual tone detection function is then performed by partitioning the feature space in two decision volumes corresponding to the two alternatives (tone present and absent respectively) and by identifying the presence of associated clusters. A reject option is available when the decision volumes are not complementary, and allows the system to be insensitive to very noisy samples (e.g. impulsive noise).A non-linear classification method is presented which provides adaptive and robust detection in presence of non gaussian noise. Moreover global performance may be optimized on-line for unknown or time varying environments.Hardware and Software simulation results are presented and show good performance in presence of impulsive and interference noise.  相似文献   

16.
傅里叶变换是建立信号时间域与频率域之间的一种变换关系。针对傅里叶变换的学习难点,分析了不同类型信号的傅里叶变换关系。结合工程应用,设计了电话拨号的双音多频音频信号按键识别综合实验,通过信号分段、滤波处理和快速傅里叶变换算法提取信号的特征频率,实现了双音多频音频信号的按键号码识别功能。  相似文献   

17.
一种新的电话拨号音自动识别方法   总被引:1,自引:0,他引:1  
电话拨号音识别属于多类分类问题。神经网络可直接对多类问题进行分类,但当类别数目较多时,网络结构也更复杂,所形成的判别边界可能不能较好地拟合有限的训练样本,导致识别能力下降。提出了一种新的多类分类方法,可将多类分类问题转变为两类问题,再利用神经网络的曲线拟合功能完成对待测样本的判别。该方法不仅解决了训练样本不足的问题,而且所产生的网络更简单实用。仿真实验表明,该方法具有良好的识别能力及稳定性。  相似文献   

18.
多媒体钢琴标准音发声器   总被引:1,自引:1,他引:0  
提出了一种利用多媒体计算机组成的钢琴标准音发生器,利用声卡可产生对应于钢琴1-88键基音的标准音,而显示器则显示相应的界面,通过鼠标或外接脚踏开关可对发生器进行控制和操作。该发生器可用于钢琴的音准调整。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号