首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
声码器是实现语音信号数字化存储和传输的关键部件,降低编码速率和提高话音质量是声码器研究的目标。目前,16kbit/s以上速率的声码器质量已达到长话质量,当前声码器的研究重点是8kbit/s以下高质量、低速率、短时延的多速率声码器,以满足多种应用场合的需要。一种采用CS-ACELP、ACELP、CELP、MELP、IMBE等多种先进的语音编码技术,集1.2、2.4、4.8、5.3、6.3、8kbit/s等速率于一体,符合G.729/G.729A/G.729B、G.723.1、美国FIPS等语音编码标准的多速率、多功能、高质量声码器最近由解放军理工大学通信工程学院研制成功。该声码器…  相似文献   

2.
一种基于混合MELP/CELP的4 kbit/s声码器   总被引:1,自引:0,他引:1  
利用混合激励线性预测 (mixed excitation linear prediction,MELP)算法和码激励线性预测(code excitation linear prediction,CELP)算法的优点,提出了一种混合MELP/CELP语音编码模型.编码端对强浊音帧采用MELP编码,对弱浊音帧和清音帧进行CELP编码.MELP编码器采用相位对齐技术提取强浊音帧的相位参数,解决了合成语音与原始语音在时间上不同步的问题.对实现的4 kbit/s混合MELP/CELP声码器进行客观MOS(mean opinion score)值和主观DRT(diagnostic rhythm test)清晰度测试,结果表明,该声码器的合成语音具有较高的可懂度和清晰度.  相似文献   

3.
在低速率语音编码算法中,如何对特征参数进行有效的量化表示是影响声码器合成语音质量的关键因素。该文提出一种能量参数解码端恢复算法,它利用线谱频率(linespectral frequency,LSF)和清浊音判决参数(unvoiced/voiced decision,U/V)估计能量参数的变化轨迹。该算法利用特征参数之间的相关性,采用隐Markov模型(hiddenMarkov model,HMM)描述LSF、U/V和能量参数之间的统计特性,通过对能量进行解码端恢复,省去量化所需的比特数,从而提高特征参数的整体量化性能。测试结果表明:能量参数解码端恢复算法能够将150b/s混合激励线性预测编码算法(mixed excitation linear prediction,MELP)的合成语音平均意见得分(mean opinion score,MOS)提高0.042。该算法应用于超低速率声码器参数量化是可行的。  相似文献   

4.
为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性.  相似文献   

5.
MELP(多带混合激励线性预测)是一种高效实用的语音编解码器.在2.4Kb/s速率上,语音质量基本达到4.8Kb/s FS-1016 CELP声码器质量,在抗噪性能方面甚至比CELP还高,接近16Kb/sSVSD编码器.对2.4Kb/sMELP编码器帧处理方面做一些改进,将过渡帧划分为2个子帧,分别进行编码和合成,使MELP编码器得到更高的语音质量.  相似文献   

6.
一种改进的基于子带谱熵的语音激活检测方法   总被引:2,自引:2,他引:0  
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题.  相似文献   

7.
陈华  关宇东  王健 《应用科技》2007,34(8):9-13
介绍了一种应用在短波通信中的码率为1.5Kbps低速率语音编码算法,此算法基于MELP(mixed excitation linearp rediction)混合激励线性预测语音编码算法的声码器模型,并对算法进行改进,降低复杂度和速率,在DSP芯片的硬件系统中实时运行了该算法,最后给出了算法测试仿真结果。  相似文献   

8.
考察了特征波形内插(CWI)算法对于宽带语音编码的扩展能力.分析宽带特征波序列的性质表明,直接使用传统的特征波形内插算法并不适于增强宽带语音的编码效率及对计算复杂度的兼顾,可引入频带扩展(BWE)技术单独处理高频段.宽带语音的高、低频分别由特征波形内插编码和频带扩展算法恢复,由此形成了5.15 kbit/s的低速率宽带语音编码器,增强了语音真实感、辅音的辨析度及对话者的识别度,宽带语音编码质量接近AMR-WB的6.6 kbit/s结果.  相似文献   

9.
主要介绍了Q4401可变速率声码器的工作原理和各种功能,PCM接口和CPU接口、初始化过程及命令格式等,并设计了一种典型的应用实例。实验证明该声码器将语音信号压缩至4-9.6kbit/s范围时,可达到普通电话的通话效果。  相似文献   

10.
目的 研究恶劣传输环境下8.0kbit/s代数码激励线性预测(ACELP)声码器的译码算法的改进及其在GSM典型信道上的传输性能。方法 在集成软件仿真平台中引入稳健信道编码模块,以消除衰落噪声和高斯噪声的影响,并完成ACELP声码器到GSM全速率语音业务信道(TCH/FS)的速率适配任务;在ACELP译码器中引入错误帧隐藏单元(ECU),以提高恶劣信道环境下的合成语音质量。结果与结论 错误帧隐藏单元与相应的高效稳健的信道编码相结合,基本上消除了恶劣的传输环境带来的大量尖峰噪声,明显改善了合成语音的听觉效果。  相似文献   

11.
12.
为了增强多带激励(MBE)声码器基音估计性能的鲁棒性,提出了一种可适用于低信噪比语音信号的改进双路径基音跟踪算法.采用全新构造的差值不等式作为约束方程,其差值门限的取值在基音跟踪过程中能够根据基音周期长短的统计特征自动更新.实验结果显示:在SNR为-5dB的高斯白噪声干扰的情况下,基音估计的严重错误概率的性能改善平均达到70%.与传统算法相比,该算法对不同讲话者和不同程度高斯白噪声干扰均具有较强的适应能力,尤其在噪声严重的情况下该算法对基音估计的准确性得到明显改善,从而使合成语音具有较好的可懂度和自然度.  相似文献   

13.
给出了一种改进的2.4kb/s多带激励线性预测(IMBELP)语音编码算法。与传统的MBELP算法相比,该算法在基音提取和清/浊音判决上采取了一些改进措施,使得合成语音质量有一定的提高。  相似文献   

14.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。  相似文献   

15.
提出了一种能够提高ITU-TG.729算法性能的静音检测技术,该技术的引入不仅可以降低G.729的语音通讯平均传输出特率,而且可以大量节省G.729压缩和解压过程的实际运算量,通过在不同的噪声背景下的性能分析,该静音检测技术的引入不会对G.729算法的合成语音质量产生明显的影响。  相似文献   

16.
为了有效地减少语音编码的比特数、降低量化误差以及提高解码语音质量,提出了一种二级矢量量化的LPC声码器算法.该算法在模糊聚类与LBG级联的VQ算法的基础上,进一步采用二级矢量量化算法对特征参数矢量进行量化.特征参数为语音的两个特征值:基音周期与增益.第一级码本为矢量码本;第二级码本为误差码本.将该算法应用于LPC声码器中进行仿真实验,结果表明:该算法能有效地降低量化比特数并且减少了量化误差,从而使解码语音质量得到改善.  相似文献   

17.
针对现有语音活动检测特征易受各种环境噪声影响而导致检测性能恶化的问题, 提出基于相位调制特征的语音活动检测算法。相位调制特征能充分表征语音动态特性, 与静态特征相比, 更能体现语音和噪声间的差异, 从而保证良好检测性能。与传统美尔频率倒谱系数特征的检测对比实验结果表明, 相位调制特征明显优于美尔频率倒谱系数。  相似文献   

18.
张开生  赵小芬  王泽  宋帆 《科学技术与工程》2020,20(35):14536-14542
针对复杂环境下语音端点检测准确率低下且检测耗时过长的问题,研究一种基于EEMD和OS-DL联合去噪的语音端点检测算法。首先利用EEMD(总体平均经验模态分解)算法对输入语音进行分解得到IMF(本征模式分量),然后使用OS-DL(一步式字典)算法分别对纯净语音信号与噪声信号进行训练,得到纯净语音信号和噪声信号的幅度谱字典,进而对幅度谱进行稀疏表示,利用得到的系数矩阵重新构建出语音信号频谱,将重构出的语音信号频谱经过傅里叶逆变换得到降噪后的语音信号,最后对降噪后的语音信号利用均匀子带频带方差法进行端点检测。实验结果表明:该算法在复杂环境信噪比低于-10dB情况下检测准确率仍可达到85%以上,且平均检测时间缩短至传统端点检测算法的1/3。  相似文献   

19.
在混合激励线性预测 (mixed excitation linear prediction, MELP) 模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model, GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。  相似文献   

20.
用于周期分解语音活动检测的基频提取方法研究   总被引:1,自引:0,他引:1  
介绍了基于语音信号周期分解的语音活动检测算法.传统语音活动检测算法在动态低信噪比背景噪声环境下的效果很不理想,这主要是因为传统方法中提取的能量与过零率等检测特征针对的是平稳噪声,对信噪比的变化很敏感.而本文介绍的周期分解语音活动检测方法能较好地解决这个问题,因为语音信号中浊音段的周期性是区别一般噪声信号的重要特征,并且该特征受背景噪声类型和信噪比变化的影响小.在周期分解语音活动检测方法中,基频提取的准确性对最终检测性能有很大影响.针对此情况,提出了自相关、循环均值幅度差分和YIN三种基频提取算法相融合的方法.实验结果表明,在背景噪声为白噪声、汽车噪声、嘈杂人声以及信噪比0dB,5dB,10dB的情况下,该方法相对单一基频提取算法,可以有效提升基频提取与周期分解语音活动检测的准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号