首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 171 毫秒
1.
浊音语音可以看作是慢变化的基音周期波形的连接。文中介绍的原波形内插算法利用了浊音语音的周期性,每隔20-30ms提取一单个的基音周期波形,然后在更新点处进行内插重建语音信号。用此方法进行语音编码可大大降低编码率。  相似文献   

2.
一种用于WI语音编码的相位预测式矢量量化方法   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《电子与信息学报》2007,29(11):2672-2675
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。  相似文献   

3.
基于非负矩阵分解的2kb/s波形内插语音编码算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张鹏  鲍长春  郭莉莉 《电子学报》2008,36(4):632-638
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative Matrix Factorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器.  相似文献   

4.
语音特征波形的分解与量化   总被引:1,自引:0,他引:1  
王贵平  鲍长春  李靓 《电声技术》2005,(1):50-54,58
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视。基于波形内插(WI)语音编码算法,全面总结和分析了现存的特征波形分解和量化的方法,这将为该领域的研究人员提供重要的参考。  相似文献   

5.
基于离散余弦变换的波形内插语音编码算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘靖宇  鲍长春  李如玮 《电子学报》2009,37(7):1599-1605
 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果.  相似文献   

6.
基于DCT分带谱熵与信号分解的高精度基音检测算法   总被引:2,自引:0,他引:2       下载免费PDF全文
本文就低速率WI语音编码中的基音检测技术进行研究,针对基音检测在不同噪声与信噪比下容易发生清浊误判的问题,在基音检测前端引入基于DCT分带谱熵的语音检测算法划分语音段与非语音段;为了向基音检测算法提供更能准确反映基音周期实际变化的输入语音,基于谐波-噪声模型提出了一种改进的DCT域语音分解算法.然后,根据变形的MCAMDF(Modified Circular Average Magnitude Difference Function)与NCCF(Normalized Cross-Correlation Function)的峰值共性,结合上述两项基音检测前端处理技术,提出了MCAMDF-NCCF基音检测组合算法.为了满足不同环境下WI编码器对基音检测高精度的要求,在合成端更准确地恢复相位轨迹,本文又基于MCAMDF-NCCF算法提出了高精度MCAMDF-NCCF-FRAC基音检测算法以计算分数基音.将算法应用与2kb/s WI编码器,主观A/B听力测试结果表明,本文提出的基音检测算法在低信噪比下明显抑制了基音加倍减半及清浊误判现象的发生,得到了优异的基音检测结果,合成语音质量完全满足低速率WI编码器对基音检测技术的要求.  相似文献   

7.
低速率WI编码器中4~6bit基音量化算法研究   总被引:1,自引:0,他引:1  
基音在语音编码中通常采用7bit无失真均匀量化。由于浊音段语音的基音普遍具有缓慢渐变的特点,为了更有效地去除前后帧基音之间存在的相关性,该文基于Eriksson和Kang提出的4bit基音量化算法,针对汉语语音进行研究,实现了一套4~6bit基音量化算法。该算法计算简单,无需码书存储。将此基音量化方案应用于WI模型和WI编码器,主观A/B听力测试结果表明,该方案在高效量化基音的同时保证了合成语音质量几乎没有损失,完全满足低速率WI编码器对量化基音的要求。  相似文献   

8.
本文将基音周期波形(PCW)在时间方向上逐个相位对齐,提出了一种新的线性预测残差(LPR)域典型波形(PW)提取和块内插方法。该方法可以避免内插后的PCW分界处的不连续而引起的听觉上的失真,同时也使得PW分界的选择不至于太严格。借助于这种PW提取和块内插方法,本文实现了一种2.4 kb/s线性预测编码方案,计算机模拟结果表明,该方案得到的重建语音与4.8 kb/s码激励线性预测算法接近。  相似文献   

9.
针对低速率语音编码问题,该文提出基于G.723.1编码标准的信息隐藏算法。在基音预测编码过程中,通过控制闭环基音周期(自适应码本)的搜索范围,该文结合随机位置选择方法(RPS)和矩阵编码方法(MCM),实现秘密信息的嵌入,在语音编码过程中实现了信息的隐藏。RPS方法的采用降低了载体码字之间的关联性,MCM方法的采用降低了载体的改变率。实验结果证明,该文算法下PESQ恶化率平均值最大为1.63%,隐蔽性良好。  相似文献   

10.
基于扩展谱相减的RCAF基音周期检测算法   总被引:1,自引:0,他引:1  
针对传统基音检测算法在信噪比低的情况下提取的基音周期错误率较高,该文提出了一种基于RCAF (Reverse CAMDF Autocorrelation Function)搜索试探平滑的基音轨迹提取方法。采用自适应判决准则的扩展谱相减进行语音增强,在语音段实现了对噪声信号的估计。应用RCAF算法提取基音周期,通过搜索试探平滑算法对提取出的基音周期进行平滑处理。该算法降低了误判率,提高了提取精度。仿真结果表明,该算法在-10dB信噪比情况下,其性能优于传统的CAMDF和AWAC等方法。  相似文献   

11.
基于小波变换的2.4kbit/s波形内插语音编码算法   总被引:1,自引:0,他引:1  
王晶  匡镜明  谢湘 《通信学报》2007,28(5):43-48
基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信号的压缩特性,仅传输对人耳感知起主要贡献的最后一级特征波幅度谱;解码端对各尺度空间采用单独重建的方法,相位信息在重构的末级与幅度谱结合,并由浊音度标志选择固定或随机相位。此外,根据语音信号的时变特性,由基于子帧的浊音度标志选择需要传输的幅度谱及量化模式。主观R-A/B测试表明,这种基于小波变换的2.4kbit/s编码算法的合成语音质量明显优于标准的2.4kbit/s的MELP编码器及FS1016的4.8kbit/sCELP编码器,亦优于3.8kbit/s的传统CWI编码框架下的合成语音效果。  相似文献   

12.
基于奇异值分解的低速率波形内插语音编码算法   总被引:8,自引:7,他引:1       下载免费PDF全文
王贵平  鲍长春  张鹏 《电子学报》2006,34(1):135-140
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器.  相似文献   

13.
In this paper, we present a median-rate speech coder, the controlled adaptive prediction delta modulation coder (CAPDM), which operates at 16 kb/s with good speech quality and low algorithm complexity. The coder is dedicated to personal communication network (PCN) applications and transmits speech samples on the basis of packets. It combines the features of a one-step looking forward decision, syllabic companding, instantaneous companding, and adaptive prediction. In addition to the use of a short-term prediction filter, CAPDM also exploits the pitch property to predict speech waveform explicitly. With the aid of a pitch prediction filter, the performance of a CAPDM codec improves about 3 dB in segmental signal-to-noise ratio (SEGSNR). The average SEGSNR of CAPDM.FF is about 21 dB, which is 7 dB over traditional CVSD at 16 kb/s. We also utilize an adaptive postfilter (APF) to enhance the perceptual quality of the decoded speech. The mean opinion score (MOS) listening test of CAPDM.FF with APF shows that its average score achieves 4.19, which is as good as G.728 16-kb/s LD-CELP and is comparable with CCITT G.721 32-kb/s ADPCM. The complexity of CAPDM.FF is evaluated to be 8 MIPS, which is much lower than that of LD-CELP and could be further reduced by adopting a smaller correlation window for pitch detection. To solve the problem of packet loss, we developed a packet-based waveform substitution method by reinitializing the codec parameters at the beginning of each packet. The simulation results show that CAPDM.FF could tolerate 5% of packet loss and still keep an SEGSNR at 10 dB and an MOS at about 3.0  相似文献   

14.
A new phase coding algorithm working in the pitch-cycle waveform domain is introduced. It provides accurate phase coding at low bit cost, thus being suitable for low bit rate sinusoidal coders. Its performance is analysed inside a multiband excitation (MBE) coder with improved onset representation. In this context, the introduction of original phase information by means of the proposed coding algorithm provides noticeable quality improvement without significantly increasing the complexity and total bit rate of the coder  相似文献   

15.
该文基于代数码激励线性预测(ACELP)语音编码算法提出了非均匀和部分搜索域代数码书。非均匀代数码书由代数码书的脉冲非均匀统计特性确定,部分搜索域代数码书则由代数码书矢量的周期性确定,该方法有效地弥补了低比特率情况下代数码书中脉冲数不足的缺点。在使用上述两项技术时,为保持基音的连续性,该编码器对语音段和非语音段采用了不同的基音估计方法。主观和客观的听力测试表明,当该技术应用于4kb/s 散布脉冲码激励线性预测(DP-CELP)语音编码器时,重建语音的质量得到明显改善,尤其是对女性讲话者。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号