首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
全音节连续汉语语音识别的研究   总被引:3,自引:0,他引:3  
在大词汇量连续汉语语音识别的研究中,我们根据汉语语音自身的特点,选用全音节作为识别单元,与音对文法相结合,以期达到实现大词汇量语音识别的目的.实现连续语音识别时,不需预先切分音节,而使用帧同步型网络搜索算法并在搜索中予以音长控制,用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估,获得了40.40%的音节识别率.  相似文献   

3.
4.
为连续语音识别用的单词音节神经网络建模的研究   总被引:3,自引:2,他引:1       下载免费PDF全文
王守觉  徐春燕  潘晓霞  安冬  陈旭  曹文明 《电子学报》2005,33(10):1883-1885
本文主要研究连续语音中单词音节的神经网络建模问题.采用了一种富有特色的特征提取方法,并依据高维空间点覆盖理论,对实际连续数字语音的各不同数字音节,以人工切自连续数字语音中的2640个单字音节,构建连续语音中各不同数字音节的特征空间覆盖区,并使用7308个自连续数字语音中切分出的单字音节,利用仿生模式识别原理,进行了建模正确性验证.验证结果正确率达到97%以上,对同样数量的少量建模样本,识别率优于SVM方法.  相似文献   

5.
一种基于多特征的带噪语音信号端点检测与音节分割算法   总被引:2,自引:0,他引:2  
语音信号的端点检测和音节分割直接决定语音识别率。在传统方法的基础上提取语音信号的多个特征参数,并综合利用各个参数的特性进行检测和分割,提高了端点检测和音节分割的准确度。  相似文献   

6.
重音是语音合成、语音识别、语音情感识别中表征韵律信息的一个重要参数,对提高语音合成系统的自然度、语音识别系统的准确率、语音情感识别系统的正确率等有着重要的作用.基于汉语双模情感语音数据库(ChineseDual-mode Emotional Speech Database,CDESD),采用改进的双门限判决法对连续语音进行音节分割,将音节的声学相关特征作为输入,数据库中人工标注的重音信息作为监督,建立了基于神经网络以及支持向量机(Support Vector Machine,SVM)的两种重音预测模型.实验表明,基于SVM的重音预测模型具有更好的分类效果,在CDESD能够获得82.89%的识别率.  相似文献   

7.
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。  相似文献   

8.
众所周知,传统算法在实现汉语语音的声韵母分割方面存在着很大的困难,这主要是因其处理方法从本质上讲属于一种线性映射,故在处理声韵母分割这一类非线性问题方面有其局限性.为此本文提出并实现了一种基于BP人工神经元网络的汉语语音声韵母分割算法。计算机模拟实验结果表明,该算法只需对极少数典型音节进行简单训练,便可实现汉语语音的声韵母分割且分割精度远大于传统算法所能获得的精度。  相似文献   

9.
用子波变换提取语音的谱包络参数   总被引:1,自引:0,他引:1  
本文将子波变换应用于提取语音信号的谱包络参数。这种谱包络提取法模拟了人耳的频谱分辨特性,因而能很好地用于语音处理。与传统的LPC谱包络提取法相比,它能降低所用的阶数。本文先介绍子波的基本原理,然后在此基础上介绍子波变换语音谱包络提取法及实验结果。  相似文献   

10.
基于经典隐马尔可夫模型的汉语连续语音识别系统   总被引:1,自引:0,他引:1  
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。  相似文献   

11.
12.
基于3维空间Viterbi算法的汉语连续语音识别方法   总被引:1,自引:0,他引:1       下载免费PDF全文
赵力  邹采荣  吴镇扬 《电子学报》2000,28(7):67-69,58
本文提出了基于3维空间Viterbi算法的汉语连续语音识别方法。本方法采用60个音素单位的隐马尔可大模型(HMM)和8个声调单位的HMM作为识别用基元模型。音素基元模型和声调基元模型的识别结果的统合,采用音素单位的HMM状态,声调单位的HMM状态和时间的3维空间Viterbi算法来实现。  相似文献   

13.
基于短时分形维数的汉语语音自动分段技术研究   总被引:1,自引:0,他引:1  
本文根据汉语语音的构成特点,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数,然后在统计、分析汉语男女声21种声母和38种韵母语间信号的分形特性基础上,利用中心偏离限定算法来实现汉语语音信号的自动分段。仿真实验表明,该方法不但能正确实现不同语速条件下的语音自动分段,而且具有噪声鲁棒性,是一种有效的汉语语音自动分段技  相似文献   

14.
本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案.通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试验,识别结果表明,10名话者1070个句子的连续语音声调识别的平均识别率是95.1%.  相似文献   

15.
基于谱稳定性特征的语音与笑声区分新方法   总被引:1,自引:0,他引:1  
该文提出一种采用谱稳定性作为特征参数的区分语音与笑声的新方法.通过分析语音与笑声的谱稳定性参数的特性,发现前者明显小于后者,这表明谱稳定性可以作为区分语音与笑声的特征参数.比较了采用谱稳定性参数、Mel频率倒谱系数、感知线性预测和基音频率等特征参数在相同实验条件下区分语音与笑声的性能.实验结果表明:在特定人和非特定人情况下,采用谱稳定性作为特征参数区分语音与笑声的正确率分别为90.74%和73.63%,其区分能力优于其它特征参数.  相似文献   

16.
刘刚  陈伟  郭军 《中国通信》2010,7(2):132-138
 在汉语语音识别中,由于汉语构词的特点,使得基于词的汉语语音识别结果评价不准确。论文对于传统连续语音识别结果评价算法进行了改进,提出了一种基于字词混合的汉语连续语音识别结果评价算法,可以有效完成基于词的识别结果评价,同时也将识别结果评价由四种情况(正确、替代、插入、删除)扩展到六种情况(增加了插入式替代和删除式替代),可以为语音识别的后处理提供更多有用的信息。实验表明,本文所提算法可以有效降低传统评价算法带来的虚假错  相似文献   

17.
分组语音通信中分组丢失对汉语语音清晰度的影响   总被引:1,自引:0,他引:1  
  相似文献   

18.
19.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号