首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文通过对汉语语音的特性分析,及各类音素的DFT谱特性,特别是清/浊音的DFT谱差异的研究,概括出了可用于连续语音音节分割的两个相对最佳的动态特征;同时,提出了动态特征曲线极小值区域分布情况的一种定量描述方法——凹谷函数描述法。在这些研究的基础上,本文给出了一个具体的分段算法。实验验证表明,本文的分段方法对连续汉语语音的音节分割是有效的。最后,本文将这种方法应用到语图分析中,并首次实现了连续语音动态语图按音节的自动分割。  相似文献   

2.
李皓  陈艳艳  唐朝京 《信号处理》2012,28(3):322-328
针对汉语是基于音节的语言,发音过程具有“枣核型”的特点,提出一种描述汉语动态视位的模型,模型分别对音节自身和音节之间的唇部运动进行建模。对音节利用基于声韵母的唇部子运动模型描述,先提取声母和韵母发音时的唇部特征参数,并按参数对口型归类,得到化简的音节视位模型,再计算唇部子运动与音节发音过程在口型上的相似性。在音节间采用元音影响分级的权重函数模拟协同发音影响,先分析各元音与其后接辅音的口型影响,再通过权重函数控制实际发音口型。实验结果表明,相对于单音子或三音子模型表征汉语动态视位,方法提高了动画效率,使得汉语音唇动画更为合理,自然。   相似文献   

3.
在介绍和评述了当今各种语音合成方式优缺点的基础上,作者认为用参数合成方式实现音节型语音合成系统是汉语合成较优越方式,设计了一个用有限音节合成无限词汇的汉语语音合成系统模型,试验证明其可行性,并指出进一步提高合成汉语语音自然度的途径。  相似文献   

4.
在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元--"词片"(word fragment),研究了最佳词片选择算法.汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,音节正确率有所提高,并取得了更好的语音检索性能.  相似文献   

5.
用1/3音节作匹配基元研究汉语单字音识别[Ⅰ]   总被引:1,自引:0,他引:1  
本文通过对汉语语音特点的分析,结合数字信号处理的有关理论,提出了用1/3音节作匹配基元进行汉语单字音识别的方法。它是按汉语音节结构将单字音分成三个匹配基元进行识别的,然后再把结果相拼组成单字音。这种方法介于音素识别和音节识别之间。小字库(104个音节)实验表明:该方法基本上保持了音素识别法的运算量,存贮量低的优点:同时也保持了音节识别法的识别率较高的优势,是一种值得探索的方法。本文主要介绍该方法的原理及韵母识别部分的实验结果。  相似文献   

6.
许利群  陈永彬 《通信学报》1989,10(3):56-60,51
基于超音段信息在语音感知中的显著作用。本文提出了一种新颖的汉语双音节词(二字词)识别方案。首先将输入语音调型进行时、频归一化处理,并将其和参考调型匹配;再对由此得到的候选集进行精确的谱匹配。在这步处理中结合了动态能量信息,并采用了修正的动态规划算法。实验结果表明,这种方案对于高混淆性汉语二字词识别十分有效。  相似文献   

7.
基于分段光谱特征值提取法和小波变换算法等多个数据预处理方法,分别针对分段基线差异及光谱噪声等严重影响激光诱导击穿光谱(LIBS)信号质量的主要影响因素,开展光谱信号预处理研究.基于实验室LIBS实验装置,通过实验验证,基于多通道光谱仪不同波段光谱特征值提取,提出了一种简单易行的多组数据中特征值点连接的方法,有效地提高了LIBS光谱信号的基线平直度,并得出以小波变换算法进行LIBS谱线信号去噪的最佳算法参数.在上述工作的基础上,使用基于误差反向传播的人工神经网络方法,实现了纯铜和不锈钢等物质种类的有效识别,研究结果表明,综合利用多数据处理方法进行LIBS技术中光谱信号处理可以有效提高谱线分析和识别的质量.  相似文献   

8.
基于短时分形维数的汉语语音自动分段技术研究   总被引:1,自引:0,他引:1  
本文根据汉语语音的构成特点,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数,然后在统计、分析汉语男女声21种声母和38种韵母语间信号的分形特性基础上,利用中心偏离限定算法来实现汉语语音信号的自动分段。仿真实验表明,该方法不但能正确实现不同语速条件下的语音自动分段,而且具有噪声鲁棒性,是一种有效的汉语语音自动分段技  相似文献   

9.
用1/3音节作匹配基元研究汉语单字音识别[Ⅱ]   总被引:1,自引:0,他引:1  
本文根据文献[1]提出的1/3音节作匹配基元识别汉语单字音的方法,进行了声母加音征部分的识别工作,并完成了1/3音节识别法的综合实验。结果表明:以声母加音征作匹配基元来识别汉语辅音有独特的优点,基本克服了辅音分割及无合适的发音模型的困难。我们发现1/3音节识别法基本保持了音素识别法运算量小和音节识别法识别率高的特点。其匹配运算量仅为音节识别法的5%,而识别率则同音节识别法相近,即对小字库可达93.6%。我们认为对1/3音节识别法继续进行研究是有价值的。  相似文献   

10.
基于模糊粗神经网络的汉语声韵母切分   总被引:1,自引:1,他引:0  
针对汉语连续语音,提出一种声韵母切分方法.根据扩展的声韵母为识别基元.采用汉语音节的重叠音素分割策略,利用模糊粗神经网络进行声韵母自动切分.实验室实验证明了该方法进行音节分割的有效性和合理性.  相似文献   

11.
针对线性啁啾光栅存在的反射谱顶部有震荡、中心 谱两侧出现旁瓣、群时延线性度差和色散曲线不 够平稳等问题,在特性分析的基础上,提出分段变迹优化方法,探寻了有效的变迹函数和最 佳分段比例。 对光栅的时延和反射谱特性进行综合表征,从综合指标出发进行光栅重构,提出一种基于自 适应遗传算法(IGA)的重构方法,并在算子和算法方面进行深入探索。结果表明,分段变迹后群时延线 性区域增大, 色散曲线更平稳,同时有效降低了变迹造成的带宽压缩程度。此重构方法十分有效,重构后 的光栅长度、 调制深度和啁啾系数误差分别为0.04%、0.532 %和0.31%。重构的反射谱、时延曲线均与实际结果基本吻合。还可以 根据不同实际应用的要求进行重构,因此实用性更好。  相似文献   

12.
基于线性网络的孤立词识别系统识别时间与词表规模成正比,识别性能严重受限于词表的规模.根据汉语孤立词特点,提出了一种基于连续识别的大词表孤立词识别系统.该系统围绕嵌入式识别所关注的速度和内存消耗性能,采用先实现应用多级搜索、定点化策略的连续识别,再对连续识别的识别结果进行音字转换处理的方法,将连续语音识别应用于大词表孤立...  相似文献   

13.
汉语中,协同发音主要取决于相邻前一音节末尾的元音,以及相邻后一音节首的辅音。主要考察在汉语普通话双音节中,第一音节元音韵母和不同第二音节声母组合时对第一个音节元音共振峰轨迹的影响。元音韵母选用元音三角形的3个顶点的元音,总结了轨迹变化的规律。  相似文献   

14.
重音是语音合成、语音识别、语音情感识别中表征韵律信息的一个重要参数,对提高语音合成系统的自然度、语音识别系统的准确率、语音情感识别系统的正确率等有着重要的作用.基于汉语双模情感语音数据库(ChineseDual-mode Emotional Speech Database,CDESD),采用改进的双门限判决法对连续语音进行音节分割,将音节的声学相关特征作为输入,数据库中人工标注的重音信息作为监督,建立了基于神经网络以及支持向量机(Support Vector Machine,SVM)的两种重音预测模型.实验表明,基于SVM的重音预测模型具有更好的分类效果,在CDESD能够获得82.89%的识别率.  相似文献   

15.
汉语规则合成系统中,连续语流基频曲线(F0曲线)的生成并不是各个合成单元F0曲线的简单拼接,而是语音学功能单元的综合作用。该文提出了汉语韵律块基频曲线优化的正演思想,使韵律块内的基频曲线融入重音强度、形状失真度以及发音速度等语境和发音的个体信息,提高合成语音的自然度。基于这种优化思想,该文针对聚类后的单音节、二音节和三音节韵律块的基频曲线,利用最小均方误差准则通过反演提取了各个单元的优化相关参数(高音线、低音线、平滑因子、形状失真度、重音强度)。对音节在韵律块中的位置因素和声调因素对优化相关参数的影响的统计分析表明了参数提取结果的可靠性和基频曲线优化的合理性,得到了优化控制参数在规则合成系统中具体的应用规则。实际的听测实验表明,韵律块基频曲线进行优化前后,合成系统的清晰度分别为3.25和3.35,自然度分别为2.9和3.31。  相似文献   

16.
在多方面实际应用目标推动下,受国家自然科学基金资助,开展了语音合成研究.我们的目标是开发一个高质量的汉语文语转换系统.为此建立了以微机为基础的语音分析合成系统,并组成了文语转换系统,进行了初步试验.这个系统充分利用汉语语音系统的特点,选择以无调音节和声调模式为基本合成单元.相应的语音参数从自然语流中提取,并赋予每个音节若干语音特征属性,为利用语音规则控制音节的声学参数提供了可能性.建立了供合成用的语音库和基本合成规则,利用语言学知识调整合成语言的韵律特征,使合成语言具有高可懂度和较好的自然度.语音合成利用硬件实现,文语转换可以实时进行.合成语音的发音速度可以在较大的范围内改变。  相似文献   

17.
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。  相似文献   

18.
邓宇珊  庄一嵘  陈戈  张军 《电信科学》2015,31(9):124-129
摘要:针对命中率随存储的流媒体片段流行度变化的特征,提出了一种新的基于最佳分段点估计的流媒体非均匀分段方法,根据不同存储大小下的流媒体外部分界流行度对其内部最佳分段点进行估计,进而把每个视频分成高流行度段和低流行度段两个片段。实验结果表明,与均分分段相比,该方法能减少流媒体的片段数,提高缓存命中率。  相似文献   

19.
一种污染谱干扰的识别技术研究   总被引:1,自引:0,他引:1  
污染谱(SMSP)干扰是一种具有较高能量利用率、较好干扰效果的新型干扰,对现代新体制相参雷达具有很大的威胁。文中根据SMSP干扰调频斜率的分段特性以及与目标回波信号调频斜率的差异,提出了一种SMSP干扰的识别算法。首先,该算法基于离散匹配傅里叶变换实现了对干扰信号调频斜率的估计。其次,基于距离维的离散匹配傅里叶变换,采用先粗搜索再细搜索的两级步进搜索方法,快速精确地检测出SMSP干扰与真实回波信号脉冲前沿的位置。最后,将受到SMSP干扰的雷达回波信号作为仿真数据,仿真结果表明该方法可准确识别SMSP干扰。  相似文献   

20.
对流媒体内部、外部流行度的特点以及流媒体外部流行度与缓存替换次数的关系进行了分析,并在此基础上,针对流媒体的缓存替换通常集中在某一小段流行度范围的特点,提出了一种基于外部流行度分类的流媒体分段方法,令替换频繁的视频采用较小的分段,而其他替换不频繁的视频采用较大的分段,从而提高缓存空间的利用率.实验结果表明,与均匀分段相比,提出的流媒体分段方法可以用更少的分段数目达到相同的命中率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号