共查询到20条相似文献,搜索用时 437 毫秒
1.
共振峰声码器因其在理论上具有最低码率而一直是参数语音编码算法研究的重点。共振峰编码器的关键算法是基频和共振峰等语音参数的提取。在高分辨率语谱图基础上,利用语音信号的频域特性设计了一种简单有效的基频和共振峰提取算法。通过评价重建语音信号的音质,证明了参数提取算法的准确性。根据语音实验确定编码参数包含基频和前4个共振峰,并在保证语音质量的前提下制定各参数的量化指标。应用实际语音信号对算法的性能进行测试,试验结果证明算法在码率为1 400 b/s时具有良好的语音质量。 相似文献
2.
本文描述了一种新型语音编码模型,这种模型是一种改进的正弦模型。该模型使用正弦幅度、频率和相位作为模型参数。模型的频率参数提取是用基频和共振峰频率结合的新提取算法,正弦幅度参数采用不同误差准则以及时额标加权函数的优化方法。采用这种新型正弦模型能够用较少的参数合成出高质量的合成语音。 结合模型算法,本文还提出新的时域关键点加权函数,以及频域的基频提取算法。该模型可用于中低速比特率语音编码,以及用于语音的时标,频标的压扩处理。 相似文献
3.
为解决线性预测(LP)共振峰检测误差较大的问题,针对高阶LP提取共振峰中伪根难以去除及极点交互带来的频谱混叠,提出一种基于高阶最优LP系数根值筛选的共振峰估计算法。考虑提高LP的阶次,获取含有更高线性峰值拟合精度的线性系统根值。采用语音数字共振模型约束共振峰的根幅值范围,滤除非共振峰频率值对应的伪根。结合功率加权来预加重信号的主要频谱成分,提高频谱峰值频率区分度。实验结果表明,所提算法消除了高阶邻近极点间的相互干扰,去除了非共振峰谐波对应的高阶伪根,与其他算法相比,所提算法定位语音信号共振峰频率的误差更低,更能稳定精确地检测共振峰。 相似文献
4.
LPC方法提防语音信号共振峰的分析 总被引:3,自引:1,他引:2
通过对LPC(线性预测编码)方法提取语音信号共振峰进行的研究表明,采用相一频特性与对数幅-频特性同样能提取语音信号共振峰。与对数据-频特性的二次导数相比,相-频特性的三导数有更高的频率分辨率,能更有效地解决共振峰合并的问题,撮更精确的共振峰参数。 相似文献
5.
录制湖南科技学院30名无喉病、无上呼吸道感染的声乐专业青年大学生专业训练歌声信号,利用语音分析技术提取歌声声学参数第一共振峰、第三共振峰、基频、音域、基频微扰、第一共振峰微扰、第三共振峰微扰、平均能量,使用BP神经网络方法客观评价歌声质量,并与资深声乐专业教师的主观评价进行比较,误差在3.4%之内。结果表明BP神经网络方法利用评价参数能正确客观评价歌声质量,有助于科学地指导选拔和训练艺术嗓音人才。 相似文献
6.
7.
共振峰是语音信号的一个重要特征,对提高耳聋患者的语言识别率具有重要意义。然而,目前数字助听器领域常用的响度补偿算法(多通道响度补偿和宽动态压缩)均对共振峰结构具有一定的破坏性,对患者听懂语音十分不利。本文结合共振峰检测,提出一种基于共振峰提取的多通道响度补偿算法,在原有多通道响度补偿的基础上,通过对滤波器组的重新设计并加入共振峰提取模块对共振峰予以保护。仿真结果证明,该算法对4类常见患耳均能达到满意的补偿效果,同时,与多通道响度补偿和宽动态压缩两种方法比较,该算法在保护共振峰结构完整性方面性能更优。 相似文献
8.
混叠语音的基频分离提取问题是听觉场景分析系统的重要一环。以往的分频带自相关函数的混叠语音基频分离提取方法都是基于频带只受混叠信号之一支配的假设,而事实上,频带常常同时受两个信号影响,为此,本文提出了一种混叠语音基频分离提取新算法,算法在寻找可能的频带组时采用了闭环自适应频带选取模块,根据频带组的基频及其周期度确定两个潜在基频,提高了搜索潜在基频的鲁棒性;利用两个潜在基频重新判断频带的归属来分离信号提取基频,提高了提取基频的精度。实验结果证明新算法具有较高的有效基频提取精度。 相似文献
9.
耳语音的声学特征是研究其语音识别和说话人识别的重要组成部分.介绍了耳语音的特点并讨论了其声学特征.由于耳语音没有基频,所以共振峰与音长特性可以作为重要的声学参数用于识别.对汉语6个耳语音元音进行了分析研究,证明共振峰频率和音长可以作为耳语音识别的特征参数. 相似文献
10.
11.
An efficient solution to the fundamental problem of estimating the time-varying amplitude envelope and instantaneous frequency of a real-valued signal that has both an AM and FM structure is provided. Nonlinear combinations of instantaneous signal outputs from the energy operator are used to separate its output energy product into its AM and FM components. The theoretical analysis is done first for continuous-time signals. Then several efficient algorithms are developed and compared for estimating the amplitude envelope and instantaneous frequency of discrete-time AM-FM signals. These energy separation algorithms are used to search for modulations in speech resonances, which are modeled using AM-FM signals to account for time-varying amplitude envelopes and instantaneous frequencies. The experimental results provide evidence that bandpass-filtered speech signals around speech formants contain amplitude and frequency modulations within a pitch period 相似文献
12.
在一个封闭的空间内,距离声源较远时接收到的语音信号通常会被混响所污染,其中晚期混响会在很大程度上降低语音可懂度。一般的去噪方法只能去除常见的加性噪声如白噪声,并不能去除房间冲激响应与干净语音卷积而成的混响,因此需要专门的去混响算法来去除晚期混响带来的影响。本文提出了一种新算法,在多级线性预测单通道去混响算法的基础上,修正了其预白化过程,改进后的算法可以提升语音前两个共振峰。实验结果证明,新算法在去除大部分混响的同时能够保留更多的有用语音的低频成分,因而提高了语音可懂度。 相似文献
13.
语音的基频(也称音高、基音周期或F0)及其变化规律是语音信号的一个重要特征,在语音情绪识别、声纹识别中有重要的应用。而语音基频的提取一直是语音信号处理中的难点,这也是语音基频特征未能广泛应用于语音识别等应用的重要原因,因此准确高效的提取音高在语音信号处理中能够有重要的意义。本文基于归一化自相关函数,结合倒频谱方法,提取了一种改进的基于归一化自相关的语音基频提取算法,实验证明该方法在基频提取中取得了较好的结果。 相似文献
14.
快速、高效地实现语音驱动下的唇形自动合成,以及优化语音与唇动的同步是语音驱动人脸动画的重点。提出了一种基于共振峰分析的语音驱动人脸动画的方法。对语音信号进行加窗分帧,DFT变换,再对短时音频信号的频谱进行第一、第二共振峰分析,将分析结果映射为一组控制序列,并对控制序列进行去奇异点等后处理。设定三维人脸模型的动态基本口形,以定时方式将控制序列导入模型,完成人脸动画驱动。实验结果表明,该方法简单快速,有效实现了语音和唇形的同步,动画效果连贯自然,可广泛用于各类虚拟角色的配音,缩短虚拟人物的制作周期。 相似文献
15.
In the speech synthesis model presented in this paper, voiced speech is synthesized as the sum of sinusoidally modulated two FM sinusoids corresponding to the first and second formants. Each FM signal is generated such that its amplitude is equal to the formant amplitude, its carrier frequency to the formant frequency or its linear combination, its modulation frequency to the pitch, and its modulation index to one fifth of the carrier to modulation frequency ratio. Unvoiced speech is generated by shifting the center frequency of a low-pass noise with a bandwidth of 1 KHz, to the frequency where the energy of the unvoiced speech is concentrated. The drawbacks of this scheme are that the pitch and the formant frequencies of the FM signals may deviate up to 40% and 9%, respectively, and spurious formants may occur. A hardware implementation can be accomplished by driving a linear analog circuitry which can simply be integrated on a single chip, by a digital computer which supplies voltages at every T = 5 ms corresponding to seven parameter values. Examples of the signals and spectrograms of synthesized speech obtained by both synthesis by analysis and synthesis by rule are given along with a set of rules for text-to-speech synthesis of Turkish. It is observed that the speech synthesized by analysis loses the speaker's identity but it is highly intelligible, while understanding the speech synthesized by rules requires a training period. 相似文献
16.
为了进一步压缩比特率,在线性预测(LP)语音编码中使用了可变阶数方法。即根据当前语音帧的性质决定相应LP滤波器的阶数。但是,如果预测阶数太小,由于语音频谱的动态范围大,可能使LP分析不能够正确地匹配较高的共振峰。讨论了一个用于语音编码的频域技术,用以在浊音语音共振峰模型方面改善低阶数线性预测(LP)的性能。 相似文献
17.
18.
针对传统谱减语音增强算法增强后的语音信号会残留明显的"音乐噪声"的问题,采用多频带谱减算法对其进行改进。改进算法的原理是将带噪的语音信号按照频率划分成不同的频带,并使这些频带之间互不交叠,根据频带内带有噪声的语音信号和噪声信号信噪比,利用自适应算法求得该频带的过减因子。仿真结果表明:改进多频带谱减算法的语音增强效果优于传统谱减法。 相似文献
19.
汉语语音正弦模型特征分析和听觉辨识 总被引:1,自引:0,他引:1
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主... 相似文献