首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 120 毫秒
1.
基于段长分布的HMM语音识别模型   总被引:23,自引:0,他引:23       下载免费PDF全文
王作英  肖熙 《电子学报》2004,32(1):46-49
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型,证明了这种模型的状态转移概率表示与状态段长表示的等效性,并在此基础上提出了基于段长分布的HMM模型(DDBHMM).非特定人连续语音实验结果表明,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高(误识率降低了17.8%),展示了DDBHMM的良好的性能,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间.  相似文献   

2.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

3.
基于状态码本的准连续隐马尔可夫模型   总被引:1,自引:0,他引:1  
本文针对经典HMM模型对训练数据要求多且算法复杂的问题,提出了一种改进的模型一基于状态码本的准连续HMM模型(SCBHMM),该模型在有限训练数据的条件下能更加有效地描述语音信号的声学特征.通过将状态转移概率与动态谱变化量相关联,使得SCBHMM能有效地将语音信号的静态特征和动态特征相结合.通过在标准语音数据库USTC94上的大量实验表明了SCBHMM在汉语音节识别中的有效性,它缓减了模型对训练数据的要求,并大大降低了训练、识别的计算量,但同样取得了相当高的识别率.  相似文献   

4.
马振  张雄伟  杨吉斌 《信号处理》2013,29(4):513-519
本文在深入研究语音个人特征信息有效表示的基础上,从信息分离角度,提出一种新的利用个人特征信息分离和替换实现语音转换的方法。该方法主要利用语音的稀疏性和K -均值奇异值分解(K-SVD)来实现。由于这种基于K-SVD的字典训练方法可以较好地保存语音信号中的个人特征信息,因此可以利用K-SVD的字典训练方法把语音个人特征信息进行分离并替换,再和语言内容等信息重构出目标语音。相对于传统方法,本方法能够更好地利用语音的稀疏性保存语音个人特征信息,从而可以克服参数映射带来的转换后语音个人特征相似度不高和语音质量下降的问题。实验仿真及主观评价结果表明,与基于高斯混合模型、人工神经网络的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度以及抗噪性。   相似文献   

5.
语音识别HMM中引入帧间相关信息的一种参数化模型   总被引:4,自引:1,他引:3  
杨浩荣  王作英  陆大 《电子学报》1998,26(10):50-54,8
虽然隐马尔可夫模型(HMM)是当前最为流行的语音识别模型,但由于一般都采用了状态输出独立假设,因此存在着不能描述语音现象中时间相关性的固有缺陷,本文提出的新模型对语音状态输出特征矢量序列的静态和动态特性信息分别进行参数化建模,然后将它们结合在一起,由此在基于段长分布的HMM(DDBHMM)中引入了帧间相关信息,这种上引入帧间相关信息的HMM能够更为精确地描述真实的语音现象。本文在给出新模型的框架后  相似文献   

6.
史媛媛  刘加  刘润生 《电子学报》2002,30(7):959-963
尽管汉语数码语音识别只涉及十个数字,但由于不同数字的发音存在相同或相似的声母或韵母,造成汉语数码语音之间的混淆性很大.采用通常的隐含马尔科夫模型(HMM)作为汉语数码语音识别模型难以得到很高的识别率.为了解决汉语数码之间的混淆问题,提高汉语数码语音识别性能,本文在隐含马尔科夫模型的状态层次上采用线性区分分析方法,将不同状态之间容易混淆的特征样本构成混淆模式类,针对混淆模式类进行线性区分分析.通过线性区分变换,在变换特征空间中仅保留那些能够有效区分该混淆类别的特征参数.这种基于状态的线性区分分析有效地提高了模型对混淆数码的区分能力.实验表明即使采用状态数很少的粗糙识别模型,也能很大幅度提高模型的识别性能;经过线性区分变换优化后的汉语数码识别模型,孤立汉语数码语音识别率可以达到99.32%.  相似文献   

7.
基于电矢量描述的大气偏振建模   总被引:3,自引:1,他引:2       下载免费PDF全文
张旭东  林金金  谢昭  纪松  吴克伟  高隽 《电子学报》2010,38(12):2745-2750
现有理想情况下大气偏振建模回避了对散射过程的描述,无法扩展到实际模型.本文采用电场强度矢量描述光波,建立天球坐标系与东北天坐标系研究光的多点单次散射过程.利用两坐标系之间的转换关系计算参数,将单次瑞利散射分析方法应用于全天域.计算散射光电场强度矢量并处理,得到偏振度和偏振方向矢量来表征大气偏振信息.仿真实验表明该方法能够准确描述理想情况下大气偏振模式,且所得电矢量可以作为实际建模的参考数据,方法具有一定的扩展性和应用价值.  相似文献   

8.
作为汉语语音识别的重要组成部分,声调识别具有关键的作用.提出了一种新的基于前后文相关的模型识别方法用以提高汉语连续语音中的识别率.首先介绍用于声调识别的基因轨迹的提取和处理,然后提出6种特征来描述基因轨迹的变化趋势并给出具体的计算公式,利用这些特征并考虑连续语音中前后音节的相关性对基因轨迹造成的变化而建立细分的声调模型...  相似文献   

9.
赵力  邹采荣  吴镇扬 《电子学报》2002,30(7):967-969
本文提出了一种新的语音识别方法,它综合了VQ、HMM和无教师说话人自适应算法的优点,在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立FVQ/HMM,同时采用基于模糊矢量量化的无教师自适应算法,来改变FVQ/HMM的各状态的码字,从而实现对未知说话人的码本适应.本文通过非特定人汉语数码(孤立和连续数码)语音识别实验,把该新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法的自适应和识别效果优于基于CHMM的方法.  相似文献   

10.
基于PCANN/HMM混合结构的语音识别方法   总被引:1,自引:0,他引:1  
赵力  邹采荣  吴镇扬 《信号处理》2001,17(5):473-476
本文提出了一种基于PCANN/HMM混合结构的语音识别方法,它采用相继几帧组成的特征参数矢量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息,同时为了改善多帧特征输入HMM的输出概率密度函数性能,在HMM的前端增加语音参数压缩的主分量分析神经网络(PCANN).通过对多讲者汉语连续语音识别实验,证实了本文提出方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号