排序方式: 共有92条查询结果,搜索用时 15 毫秒
31.
实际的语音以及语音中掺杂的噪声一般都是非平稳的。本文详细分析了TVAR(时变自回归模型)语音系统模型,把利用TVAR模型增强语音分解成卡尔曼滤波和粒子滤波两步,以减小运算量。同时在粒子滤波中,为克服粒子退化效应,引入了粒子重采样技术提高粒子滤波精度。实验证明,这种增强语音方法无需对语音分帧处理,无需要求噪声是否平稳,能很好地跟踪语音信号的非平稳性,对系统初始值设置不敏感,增强后的语音信号信噪比得到明显改善。 相似文献
32.
汉语语音视觉合成研究数据库CVSS1.0 总被引:1,自引:0,他引:1
目前现有的双模态语音数据库多为外文,且绝大部分都是为语音识别或身份认证服务的。鉴于此,我们根据汉语语音的特点,建立了国内第一个较为完备的汉语语音视觉合成数据库CVSS1.0。它具有如下特点:包含136个单音节和265个连续发音语句的视频和音频数据,其语料规模超出目前同类数据库;语料是在汉语发音方式归类的基础上,依据汉字出现频度的高低选取,其中的独白语句涵盖了大部分的韵律结构,因此其反映的规律具有代表性;记录了脸部发音动作的三维运动信息;用绿点标出了部分MPEG4定义的脸部特征点,方便跟踪;可服务于多种视觉语音合成研究,有很高的通用性。 相似文献
33.
34.
语音合成技术的发展与展望 总被引:1,自引:0,他引:1
阐述了语音合成的内涵和框架,对语音合成技术的算法和韵律研究现状做了系统的总结,分析了该领域目前所面临的问题。并介绍了基于谐波噪声内核的合成系统的实现。最后对高质量语音合成系统的属性做了阐述,对未来的发展做了展望。 相似文献
35.
一种能够检测所有交叉歧义的汉语分词算法 总被引:11,自引:0,他引:11
本文给出了一种能够检测句子中所有交叉歧义的汉语分词算法.该算法基于"长词优先"的切分原则.它解决了切分路径数随句子长度的增长而呈几何级数增长的问题,并且提供了一种方法可将句子的覆盖歧义和交叉歧义分开处理.算法的运算复杂度为O(N),N为句子长度.它的输出使得进行下一步处理的运算量大大减少. 相似文献
36.
基于语音状态模型的语音增强算法是当前语音信号处理的研究热点。把通常的LPC语音模型修正后,将得到两个语音模型:时变AR模型、时变双AR模型。但是利用这些模型增强语音时,都没有考虑到语音的清音、浊音区别。为此本文引入了语音清浊音状态空间模型,这种模型在描述语音方面比时变AR模型、时变双AR模型要强,而且物理含义明显。同时在用含噪语音信号预测纯净语音信号时,引入遗忘因子和粒子滤波算法以降低计算复杂性,减小运算量。实验证明,增强后的语音信号信噪比有一定提高,且优于传统的LPC模型。 相似文献
37.
本文介绍了一种新的电话语音监控系统,该系统利用电话语音卡将通话双方的通话信号采集进计算机,再利用自动语音识别技术对双方的通话内容进行识别,以实现对通话的监控。本文首先分析了该系统的工作流程,并介绍了各主要功能模块的工作原理及其具体实现,最后对系统中各个工作线程之间同步的实现进行了分析。 相似文献
38.
APP方法可以准确检测语音信号中的非周期性、周期性和基频,是近年提出的一种先进检测新方法,对于语音基础研究和语音技术应用研究有重要作用。APP方法的最大优点是可以同时检测语音信号的基频周期、周期成分和非周期成分的能量比例,而最大缺点是计算代价巨大,运行时间为110倍实时,成为实际应用的最大障碍。该文在深入剖析APP方法的基础上,从原理架构和技术实现两个方面消除不合理的冗余处理,提出新的改进途径,发展成为改进的APP方法,即MAPP方法。MAPP方法不但加强了APP方法处理机制的合理性基础,改善基频检测的准确性和鲁棒性,而且提高计算效率约1个数量级,在CPU时钟频率为1.70GHz和内存为512MB的Pentium 计算机上的运行时间加快到12.3倍实时。 相似文献
39.
40.
提出了一种采用最小贝叶斯信息准则(Minimum Bayesian Information Criterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(Maximum Likeihood Criterion,MLC)相比,MBIC对声学模型参数和训练数据集的变化具有更好的适应能力。 相似文献