排序方式: 共有92条查询结果,搜索用时 27 毫秒
51.
52.
53.
大词表连续语音识别系统由多个组件构成,识别错误受多种因素的影响。系统开发者需要分析错误发生的不同原因。根据语音识别的基本理论给出了对错误进行分类分析的原理,将识别错误按错误原因分为解码错误、声学模型错误、语言模型错误、声学和语言复合错误四大类,并对分类后的错误做了统计分析。实验证明,识别错误的分类分析为系统的改进提供了参考依据。 相似文献
54.
随着流媒体应用的蓬勃兴起,音频信号的自动分类开始成为工程与学术关注的热点之一。根据音乐信号对乐曲表现的情绪进行分类,由于涉及音乐信号的社会属性和自然属性的综合表征与模糊分类,因此处理方法相应需要在各种传统表征与分类方法的基础上进行机制筛选与架构优化。该文探讨了在AdaBoost算法,K-L变换和GMM模型的基础上构造弱分类器的方法,采用多层分类器结构,成功地实现了对音乐信号进行情绪分类。初步的实验对163首歌曲进行平静(Calm),悲伤(Sad),激动(Exciting)以及愉悦(Pleasant)4种类别的分类,训练集和测试集的分类准确率分别达到97.5%和93.9%,展示了这种方法的可行性和进一步发展的潜在价值。 相似文献
55.
56.
基于隐马尔可夫模型局部最优状态路径的数据重建算法 总被引:3,自引:1,他引:2
该文提出了基于隐马尔可夫模型局部最优状态路径的数据重建(LOPDI)算法。该算法假设语音特征矢量是一个L状态隐马尔可夫模型的输出序列,基于局部最优状态路径估计产生语音特征矢量的次最优状态序列,并按最大后验概率准则(MAP)重建出缺失矢量。实验表明,LOPDI算法能够显著提高语音识别系统对加性噪声的鲁棒性。 相似文献
57.
58.
<正>一百多年前,电话技术的创新发展和广泛应用实现了人类长久企盼的与远方说同一母语的朋友进行对话交流的憧憬,改善了交通阻隔和人际闭塞的活动方式。近几十年来,信息技术的发展加速了世界的快速变革,旅游、通信、商业和互联网的全球蔓延使人类的活动全球化,正在彻底改变人类的生活方式。人们在全球化活动中感到越来越不方便的是在这种变革中顽固存留下来的语言壁垒,它正在以难以置信的速度形成一张束缚社会平衡发展的无形的网。人类如何才能有效地跨越不同语种之间语音对话交流的障碍呢?科学技术将提供解决这个问题的一种重要途径。 相似文献
59.
60.