首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
王坤赤  蒋华 《现代电子技术》2007,30(21):168-170
共振峰声码器因其在理论上具有最低码率而一直是参数语音编码算法研究的重点。共振峰编码器的关键算法是基频和共振峰等语音参数的提取。在高分辨率语谱图基础上,利用语音信号的频域特性设计了一种简单有效的基频和共振峰提取算法。通过评价重建语音信号的音质,证明了参数提取算法的准确性。根据语音实验确定编码参数包含基频和前4个共振峰,并在保证语音质量的前提下制定各参数的量化指标。应用实际语音信号对算法的性能进行测试,试验结果证明算法在码率为1 400 b/s时具有良好的语音质量。  相似文献   

2.
刘加  钱亚生 《通信学报》1991,12(4):57-63,69
本文描述了一种新型语音编码模型,这种模型是一种改进的正弦模型。该模型使用正弦幅度、频率和相位作为模型参数。模型的频率参数提取是用基频和共振峰频率结合的新提取算法,正弦幅度参数采用不同误差准则以及时额标加权函数的优化方法。采用这种新型正弦模型能够用较少的参数合成出高质量的合成语音。 结合模型算法,本文还提出新的时域关键点加权函数,以及频域的基频提取算法。该模型可用于中低速比特率语音编码,以及用于语音的时标,频标的压扩处理。  相似文献   

3.
龙华  苏树盟 《通信学报》2022,(6):235-245
为解决线性预测(LP)共振峰检测误差较大的问题,针对高阶LP提取共振峰中伪根难以去除及极点交互带来的频谱混叠,提出一种基于高阶最优LP系数根值筛选的共振峰估计算法。考虑提高LP的阶次,获取含有更高线性峰值拟合精度的线性系统根值。采用语音数字共振模型约束共振峰的根幅值范围,滤除非共振峰频率值对应的伪根。结合功率加权来预加重信号的主要频谱成分,提高频谱峰值频率区分度。实验结果表明,所提算法消除了高阶邻近极点间的相互干扰,去除了非共振峰谐波对应的高阶伪根,与其他算法相比,所提算法定位语音信号共振峰频率的误差更低,更能稳定精确地检测共振峰。  相似文献   

4.
LPC方法提防语音信号共振峰的分析   总被引:3,自引:1,他引:2  
通过对LPC(线性预测编码)方法提取语音信号共振峰进行的研究表明,采用相一频特性与对数幅-频特性同样能提取语音信号共振峰。与对数据-频特性的二次导数相比,相-频特性的三导数有更高的频率分辨率,能更有效地解决共振峰合并的问题,撮更精确的共振峰参数。  相似文献   

5.
录制湖南科技学院30名无喉病、无上呼吸道感染的声乐专业青年大学生专业训练歌声信号,利用语音分析技术提取歌声声学参数第一共振峰、第三共振峰、基频、音域、基频微扰、第一共振峰微扰、第三共振峰微扰、平均能量,使用BP神经网络方法客观评价歌声质量,并与资深声乐专业教师的主观评价进行比较,误差在3.4%之内。结果表明BP神经网络方法利用评价参数能正确客观评价歌声质量,有助于科学地指导选拔和训练艺术嗓音人才。  相似文献   

6.
康永国  陶建华  徐波 《信号处理》2005,21(Z1):220-222
提出了一种按频域子带对语音信号进行幅度调制和频率调制联合分解的分析方法.该方法首先使用动态规划的算法将语音的频谱划分为多个互不重叠的频域子带,每个子带内只含有一个共振峰即是单成分信号,然后在各频带内使用能量分离算法做调幅-调频分解,解决了以往方法中用于多成分分离的带通滤波器参数的经验选择问题.并将此方法用于共振峰估计实验,实验结果表明不仅准确地估计出了共振峰频率,而且避免了复杂的共振峰轨迹跟踪过程.  相似文献   

7.
赵毅  尹雪飞  陈克安 《信号处理》2012,28(3):352-360
共振峰是语音信号的一个重要特征,对提高耳聋患者的语言识别率具有重要意义。然而,目前数字助听器领域常用的响度补偿算法(多通道响度补偿和宽动态压缩)均对共振峰结构具有一定的破坏性,对患者听懂语音十分不利。本文结合共振峰检测,提出一种基于共振峰提取的多通道响度补偿算法,在原有多通道响度补偿的基础上,通过对滤波器组的重新设计并加入共振峰提取模块对共振峰予以保护。仿真结果证明,该算法对4类常见患耳均能达到满意的补偿效果,同时,与多通道响度补偿和宽动态压缩两种方法比较,该算法在保护共振峰结构完整性方面性能更优。   相似文献   

8.
黄秀轩  季飞  韦岗 《信号处理》2004,20(5):490-493
混叠语音的基频分离提取问题是听觉场景分析系统的重要一环。以往的分频带自相关函数的混叠语音基频分离提取方法都是基于频带只受混叠信号之一支配的假设,而事实上,频带常常同时受两个信号影响,为此,本文提出了一种混叠语音基频分离提取新算法,算法在寻找可能的频带组时采用了闭环自适应频带选取模块,根据频带组的基频及其周期度确定两个潜在基频,提高了搜索潜在基频的鲁棒性;利用两个潜在基频重新判断频带的归属来分离信号提取基频,提高了提取基频的精度。实验结果证明新算法具有较高的有效基频提取精度。  相似文献   

9.
赵越  林玮 《电声技术》2016,40(11):48-52
耳语音的声学特征是研究其语音识别和说话人识别的重要组成部分.介绍了耳语音的特点并讨论了其声学特征.由于耳语音没有基频,所以共振峰与音长特性可以作为重要的声学参数用于识别.对汉语6个耳语音元音进行了分析研究,证明共振峰频率和音长可以作为耳语音识别的特征参数.  相似文献   

10.
语音信号中的情感特征分析和识别的研究   总被引:11,自引:0,他引:11  
本文分析了含有欢快、愤怒、惊奇、悲伤等4种情感语音信号的时间构造、振幅构造、基频构造和共振峰构造的特征。通过和不带情感的平静语音信号的比较,总结了不同情感语音信号的情感特征的分布规律。根据这些分析,提取了9个情感特征进行了情感识别的实验,获得了基本上接近于人的正常表现的识别结果。  相似文献   

11.
An efficient solution to the fundamental problem of estimating the time-varying amplitude envelope and instantaneous frequency of a real-valued signal that has both an AM and FM structure is provided. Nonlinear combinations of instantaneous signal outputs from the energy operator are used to separate its output energy product into its AM and FM components. The theoretical analysis is done first for continuous-time signals. Then several efficient algorithms are developed and compared for estimating the amplitude envelope and instantaneous frequency of discrete-time AM-FM signals. These energy separation algorithms are used to search for modulations in speech resonances, which are modeled using AM-FM signals to account for time-varying amplitude envelopes and instantaneous frequencies. The experimental results provide evidence that bandpass-filtered speech signals around speech formants contain amplitude and frequency modulations within a pitch period  相似文献   

12.
赵红  李双田 《信号处理》2014,30(6):674-682
在一个封闭的空间内,距离声源较远时接收到的语音信号通常会被混响所污染,其中晚期混响会在很大程度上降低语音可懂度。一般的去噪方法只能去除常见的加性噪声如白噪声,并不能去除房间冲激响应与干净语音卷积而成的混响,因此需要专门的去混响算法来去除晚期混响带来的影响。本文提出了一种新算法,在多级线性预测单通道去混响算法的基础上,修正了其预白化过程,改进后的算法可以提升语音前两个共振峰。实验结果证明,新算法在去除大部分混响的同时能够保留更多的有用语音的低频成分,因而提高了语音可懂度。   相似文献   

13.
语音的基频(也称音高、基音周期或F0)及其变化规律是语音信号的一个重要特征,在语音情绪识别、声纹识别中有重要的应用。而语音基频的提取一直是语音信号处理中的难点,这也是语音基频特征未能广泛应用于语音识别等应用的重要原因,因此准确高效的提取音高在语音信号处理中能够有重要的意义。本文基于归一化自相关函数,结合倒频谱方法,提取了一种改进的基于归一化自相关的语音基频提取算法,实验证明该方法在基频提取中取得了较好的结果。  相似文献   

14.
潘晋  杨卫英 《电声技术》2009,33(5):62-65
快速、高效地实现语音驱动下的唇形自动合成,以及优化语音与唇动的同步是语音驱动人脸动画的重点。提出了一种基于共振峰分析的语音驱动人脸动画的方法。对语音信号进行加窗分帧,DFT变换,再对短时音频信号的频谱进行第一、第二共振峰分析,将分析结果映射为一组控制序列,并对控制序列进行去奇异点等后处理。设定三维人脸模型的动态基本口形,以定时方式将控制序列导入模型,完成人脸动画驱动。实验结果表明,该方法简单快速,有效实现了语音和唇形的同步,动画效果连贯自然,可广泛用于各类虚拟角色的配音,缩短虚拟人物的制作周期。  相似文献   

15.
In the speech synthesis model presented in this paper, voiced speech is synthesized as the sum of sinusoidally modulated two FM sinusoids corresponding to the first and second formants. Each FM signal is generated such that its amplitude is equal to the formant amplitude, its carrier frequency to the formant frequency or its linear combination, its modulation frequency to the pitch, and its modulation index to one fifth of the carrier to modulation frequency ratio. Unvoiced speech is generated by shifting the center frequency of a low-pass noise with a bandwidth of 1 KHz, to the frequency where the energy of the unvoiced speech is concentrated. The drawbacks of this scheme are that the pitch and the formant frequencies of the FM signals may deviate up to 40% and 9%, respectively, and spurious formants may occur. A hardware implementation can be accomplished by driving a linear analog circuitry which can simply be integrated on a single chip, by a digital computer which supplies voltages at every T = 5 ms corresponding to seven parameter values. Examples of the signals and spectrograms of synthesized speech obtained by both synthesis by analysis and synthesis by rule are given along with a set of rules for text-to-speech synthesis of Turkish. It is observed that the speech synthesized by analysis loses the speaker's identity but it is highly intelligible, while understanding the speech synthesized by rules requires a training period.  相似文献   

16.
为了进一步压缩比特率,在线性预测(LP)语音编码中使用了可变阶数方法。即根据当前语音帧的性质决定相应LP滤波器的阶数。但是,如果预测阶数太小,由于语音频谱的动态范围大,可能使LP分析不能够正确地匹配较高的共振峰。讨论了一个用于语音编码的频域技术,用以在浊音语音共振峰模型方面改善低阶数线性预测(LP)的性能。  相似文献   

17.
TETRA语音编码中基音预处理算法的优化   总被引:6,自引:0,他引:6  
本文在TETRA语音编码的预处理部分引入了数值滤波算法。该算法能够有效去除声道的共振峰结构对基音检测的影响,进一步试验采用去均值。低通滤波和数值滤波等算法来替代原有的预处理,可以得到更好的优化效果。我们设计了普通语音、基音有抖动的语音和带有噪声干扰的语音未检验优化算法的性能。在这两种优化算法中都可以发现处理后的语音信号在时域上表现出明显的周期性特征,同时在频域上原始语音的共振峰影响被消除或得到有效抑制。  相似文献   

18.
针对传统谱减语音增强算法增强后的语音信号会残留明显的"音乐噪声"的问题,采用多频带谱减算法对其进行改进。改进算法的原理是将带噪的语音信号按照频率划分成不同的频带,并使这些频带之间互不交叠,根据频带内带有噪声的语音信号和噪声信号信噪比,利用自适应算法求得该频带的过减因子。仿真结果表明:改进多频带谱减算法的语音增强效果优于传统谱减法。  相似文献   

19.
汉语语音正弦模型特征分析和听觉辨识   总被引:1,自引:0,他引:1  
张毅楠  肖熙 《电声技术》2011,35(8):38-41
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主...  相似文献   

20.
该文研究了一种新的电力系统频率测量的新算法,利用正弦信号的频率特性,对含有谐波、噪声、直流干扰下的电力系统频率信号进行多重自相关运算,得到原始信号的自相关函数,对自相关函数求导,根据极值解析运算原理测量基波信号频率。分析了各个因素对该文算法精度的影响,给出了仿真结果,理论和实验结果表明该文算法有效地提取电力信号的基波频率,对谐波、噪声及直流电平干扰具有很强的抑制能力。算法简单,物理意义明确,具有一定的实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号