首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
报道了一个基于肌肉模型的人脸语音动画系统的设计过程,先用一组人脸的激光扫描数据建立起一个三维人脸模型作为原始模型,然后根据特定人脸照片数据对原始模型进行修改以得到特定的人脸模型,在此模型的基础上进行纹理映射,从而实现了人脸表情和语音同步动画。  相似文献   

2.
对人脸建模与动画的概念、基本技术与实现思路进行分类总结,分析各种技术的特点与缺点,对人脸动画的发展过程进行全面的认识,并描述一种人脸建模特定化的一般过程。  相似文献   

3.
为了解决可视语音合成中语音与口型多对多的对应关系,本文提出基于两层隐马尔可夫模型的可视语音合成,该模型有效结合了语音和口型的上下文相关性,解决了语音与口型多对多的对应问题,合成出了准确率高、连贯、自然的口型序列,该方法具有完全自动化的特点.  相似文献   

4.
为了在可视语音合成中获得更具有真实感的口型动画,提出了一种基于双重学习模型的合成方法.通过隐马尔可夫模型和遗传算法相结合的方法,可以更好地学习出语音特征与可视特征间的映射关系.该模型能去除传统语音识别领域在对大样本语音空间提取语音特征时的冗余信息,达到更好的可视语音预测效果.另外,在口型特征的表示上提出了一种基于面部动画参数特征点的几何特征表示,不仅对在不一致的光照条件下获得的训练样本有较好的鲁棒性,能更好地表征口型本身变化,而且与传统的主成分分析特征相比,具有较小的向量维数,提高了训练和合成速度.  相似文献   

5.
具有真实感的三维人脸动画是计算机图形学研究的一个重要分支,有着广泛的应用领域。如何在三维人脸模型上实时地模拟人脸的运动,产生具有真实感的人脸表情和动作,是其中的一个难点。该文在MPEG-4的三维人脸动画原理的基础上提出一种新的基于MPEG-4的、适宜于任意拓扑结构模型的三维人脸动画实现方法。该方法能够在FAP帧的驱动下实现真实感较强的三维人脸动画。  相似文献   

6.
介绍一种实时语音识别系统,对语音识别系统的硬件组成及软件技术进行了论述,所开发的系统具有较高的识别精度,有较为广阔的应用前景。  相似文献   

7.
利用语音合成芯片 TC8830 AF的 CPU控制方式下的 DMA功能 ,主控微机可共享语音数据存储器 SRAM资源 ,对语音数据直接操作 ,实现语音数据的快速处理 ,对语音合成库的建设机理进行了深入探讨 ,并提出了一种实用的汉语数码语音识别方法 .实践结果表明本系统适用于语音合成产品的开发  相似文献   

8.
提出一种基于线连通的区域聚合法,结合肤色处理和区域特征等方法对人脸进行定位.这种新的区域聚合法能快速有效地获取图像区域的几何特性,从而可以提取区域的各种特征,最终能根据人脸的基本特征对图像的人脸进行定位.实验证明,这种方法速度快、实现简单,能较好地克服人脸倾斜、大小、表情、姿态变化等不利因素的影响,达到很好的定位效果.  相似文献   

9.
16位单片机的语音信号处理技术的研究   总被引:1,自引:0,他引:1  
以凌阳科技公司的新一代16位单片机SPCE061A为例,介绍16位单片机的语音信号处理技术,并指明了如何以之方便地生成语音信号及如何采用SACM—S240音频编码算法进行语音播放。  相似文献   

10.
基于SCHMM/ANN噪声背景下的语音识别系统设计   总被引:2,自引:0,他引:2  
语音识别系统一般是将安静环境下训练得到的参数用于实际环境中, 当实际环境是安静的,语音识别系统的工作是令人满意的,然而,当实际环境中有噪声存在时,识别系统的性能就会下降.文中提出将自组织特征映射神经网络与半连续隐马尔可夫模型相结合,训练出适应噪声的隐马尔可夫模型的新方法.把该模型应用于小词汇量的孤立词语音识别系统.实验表明,该模型适合于对噪声背景下的语音进行识别.同传统的HMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12dB),识别率比传统HMM模型有明显提高.  相似文献   

11.
研究了双模型语音识别系统中前合成和后合成两种听觉视觉合成方法;同时在后合成方法中引入了考虑听觉和视觉同步异步特点的复合模型。仿真实验证明了在声学噪音环境下,后合成方法能够带来比较理想的识别效果;考虑听觉和视觉同步异步性的模型可以有效地提高识别率。  相似文献   

12.
一种基于MASM的口形轮廓特征提取方法及听视觉语音识别   总被引:1,自引:0,他引:1  
提出了一种用于听视觉语音识别的基于MASM的口形轮廓提取方法,这种方法只需要少量的训练数据就可以实现对大量口形轮廓的准确提取。还引入了一种口形轮廓的平滑修正方法,该方法利用口形连续变化的特点,对错误轮廓进行修正。实验证明,利用该方法提取轮廓的准确率比常规ASM模型高出20个百分点;将该口形轮廓特征引入到听视觉语音识别中,可以有效地提高噪音环境下的识别率。  相似文献   

13.
本文提出一种新的矢量量化方法压缩语音特征用于孤立字语音识别.新方法借鉴了隐马尔柯夫模型(HMM)中状态的概念来规划模板;用动态规划(Dyna-mic Progamming)的技术优化矢量量化产生的初始码字.新方法使得识别所需的模板库的尺寸明显减小,识别响应时问缩短,而且由于模板的优化,使得系统的正确识别率显著提高.  相似文献   

14.
针对非特定人大词汇量连续语音识别,在均值方差归一化的基础上,提出了基于动态阈值的特征调整方法。动态阈值的选取方式包含阈值的动态范围确定和确定阈值的系数。动态阈值范围的确定依据如下两个数值,一个是样本特征点的均值,另一个是使得样本特征点等分的数值。然后再根据对特征点在样本特征点均值上下的比例关系得到系数,最后根据这个系数来确定一个具体的阈值,并基于此阈值对连续语音特征曲线进行调整。  相似文献   

15.
为了实时合成真实感的可视语音,提出了一种融合口型、表情等多种运动元素的三维人脸动画合成方法.以MPEG-4人脸动画标准为基础,建立了汉语音节口型库和人脸基本表情库,通过在人脸动画参数上对共同影响面部运动的多种元素进行加权融合,合成出最终的动画序列.实验结果表明,该方法有效融合了面部运动的多种元素,同时具有真实感和实时性的优点.  相似文献   

16.
说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号