首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
语音DCT变换的一种小波编码方法   总被引:4,自引:3,他引:4  
语音信号离散余弦变换的小波变换编码方法是根据DCT变换和小波变换特点,并结合语音信号的特征而提出的一种高效简便的语音编码方法,在编码中,对不同层次小波系数分配不同的量化位,可灵活、方便地控制重构话音的质量,以汉语语音音节为例的实验表明,在16kbps的编码数据率时,重构(或再生)的话音质量与原始话音质量基本相同。  相似文献   

2.
语音参数编码中,相位信息占有重要的地位.本文根据语音信号中相位信息所遵循的统计分布规律,找到了一种新的相位编码方法,从而使相位编码的比特数得到了极大的压缩.将此法用于语音压缩中,由计算机模拟结果证明该方法是成功的,其合成语音品质获得了很好的可懂度和自然度.  相似文献   

3.
以时域基音同步叠加(TD-PSOLA)技术和一个全汉语单音节库为全成单元进行汉语语音合成,合成的语音清晰度和自然度很高,但是这样的系统语音库太大,不利在于小型设备中实现,影响了语音合成的进一步应用,本文针对此问题,在研究A很压缩的基础上,采用自适应量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,使压缩后的语音库减小了约一半,大大减小了所需的存储空间,并且利用压缩后的语音库合成语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用。  相似文献   

4.
基于UDP协议的语音传输系统设计及实现   总被引:3,自引:0,他引:3  
文中讨论了基于UDP协议的语音传输系统的设计及实现。比较详细的阐述了语音信息的录制和播放、发送接收、压缩和解压缩以及语音传输过程的缓冲机制。由于采用了压缩技术,减小了语音信息对网络带宽的要求,故较好的实现了语音信息实时录制、传输和播放。  相似文献   

5.
设计了一种新型的中速率混合语音压缩编码系统。该系统把语音分割成基带(03~1kHz)和高频部分(1~34kHz)。对于重要的基带信号,采用高质量的4bit/样点的ADPCM技术;对于相对次要的高频信号,采用高效的VQ(矢量量化)技术,以压缩码率。对于矢量量化,还提出了一种新的快速算法,通过某种预处理使得搜索码本的速度提高10倍以上,且质量等效于全搜索方法。本系统具有实现简单、时延短的特点,且主观质量好,基本上听不出噪声。  相似文献   

6.
基于编程语言及仿真软件SystemView分析了ZigBee语音通信系统中G.726音频压缩算法和O-QPSK调制方式的实现。首先对输入的语音数据进行音频压缩编码,利用了G.726音频压缩算法,该算法简单,语音质量高,能够在低比特率上达到网络等级的话音质量,从而在语音存储和语音传输领域得到广泛应用。对处理后的数据进行O-QPSK调制,通过SystemView对其进行仿真,从而进一步证明ZigBee技术在语音通信中的可实现性。  相似文献   

7.
在对最新的MPEG4中的音频编码中码激励线性预测CELP(code excited linear predicive)编码器分析和研究的基础上,根据其窄带语音编码器的参数模式,建立和实现了一个基于CELP的语音编码实验系统,将高效的CELP编码技术应用于文语转换TTS(text-to-speech)系统中语音数据库的压缩,效果是满意的。  相似文献   

8.
9.
语音压缩编码的新进展   总被引:2,自引:0,他引:2  
本文简要介绍了语音压缩编码的新进展,并且着重介绍低码率语音编码在新近几年所取得的进展。  相似文献   

10.
为实现收发节点相对运动下的语音信息交互,提出一种基于Speex和深度编码的移动水声语音通信算法。针对水下信道带宽有限、语音传输低效及数据丢失问题,采用Speex算法,对语音信息进行压缩,提升语音信息传输效率和质量。针对水声信道中时变多途干扰和相位跳变问题,采用深度编码策略,在比特级,采用低复杂度的卷积编码,对信息比特进行编码以获得冗余编码比特,用以对抗时变多途干扰;在符号级,采用基于相位差的编码,令两个相邻符号的相位差作为传输符号,从而消除相位跳跃的影响。Speex算法实现了8.53倍的压缩率,有效节省了信道带宽;深度编码有效解决了多途干扰和相位跳变问题,在相同信噪比下使误码率大大降低。在胶州湾使用水声通信机(Seatrix Modem)对本文算法在通信距离为5.5 km、收发器之间相对运动速度为0.5 m/s、通信带宽为4 kHz条件下进行验证,结果表明了本文算法的有效性。  相似文献   

11.
4kbit/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法。在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率。在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量。对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量。对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度。经非正式听音测试,4kbit/sFS-ACELP的合成语音质量超过了北美8kbit/sVSELP,接近G.7298kbit/sCS-ACELP,MOS分约为3.9。  相似文献   

12.
在混合激励线性预测 (mixed excitation linear prediction, MELP) 模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model, GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。  相似文献   

13.
A kind of Web voice browser based on improved synchronous linear predictive coding (ISLPC) and Text-toSpeech (TTS) algorithm and Internet application was proposed. The paper analyzes the features of TTS system with ISLPC speech synthesis and discusses the design and implementation of ISLPC TTS-based Web voice browser. The browser integrates Web technology, Chinese information processing, artificial intelligence and the key technology of Chinese ISLPC speech synthesis. It's a visual and audible web browser that can improve information precision for network users. The evaluation results show that ISLPC-based TTS model has a better performance than other browsers in voice quality and capability of identifying Chinese characters.  相似文献   

14.
基于Haar小波提升的2.4kbit/s CWI语音编码算法   总被引:1,自引:0,他引:1  
提出一种基于Haar小波提升的2.4 kbit/s特征波形内插(CWI)语音编码算法.将特征波离散时间傅里叶级数(DTFS)得到的幅度谱转化为离散余弦变换(DCT)系数,用Haar小波提升实现特征波的多级分解与重建.利用相位谱间距的均值和基音周期增益联合判断浊音度标志,用于进行相位选择和离散余弦变换系数的选择性量化.主观A-B听音实验表明,该语音编码算法音质优于传统的3.8 kbit/s CWI编码器,在较低码率上获得较为满意的合成音质,且Haar小波提升特征波形分解与重建方法解决了传统小波变换CWI算法延时较大的问题.  相似文献   

15.
8kbit/s短延时语音编码算法LD-ACELP,采用了代数码本激励线性预测(ACELP)的编码方法,利用语音的帧间相关性对线谱对参数采用了分裂式矢量量化技术,并采用高效的码本结构、码本搜索技术和增益矢量量化技术来获得较高的语音合成质量和较短的算法延时。LD-ACELP的帧长为10ms,算法延时为15ms。通过信噪比及人耳主观听觉实验等性能测试表明,该算法具有与国际电联16kb/s短延时语音编码算法LD-CELP(G.728)相当的语音合成质量。  相似文献   

16.
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性  相似文献   

17.
胡剑凌  徐盛 《上海交通大学学报》2002,36(12):1774-1777,1784
设计了一种多带线性预测编码(MBLPC)语音压缩算法,该算法结合正弦编码和线性预测编码的优点,对语音信号的包络谱用线性预测编码方法进行估计.而对激励谱用多带方式进行处理.改进了特征参数的提取和量化方法,包括基于谐振结构的基音检测算法、基于谐振结构的线性预测分析以及包络谱参数的线性预测多层分裂码本矢量量化.非正式主观测试表明,在1.8kb/s编码速率下,由MBLPC算法所重建语音的平均意见分为3.0,而清晰度指标约为91%.  相似文献   

18.
基于对语音信号的分析,借鉴频率分带技术和码激励线性预测编码中传输残差信号可提高合成语音鲁棒性的思想,建立了双带激励模型,同时对基音检测、矢量量化、语音合成等环节加以改进,提出了最高码率为2400bit/s,最低码率为80bit/s的变码率增强型双带激励LPC(Linear Predictive Coding)低速语音编码算法。仿真结果表明:该算法在有效降低平均码率的前提下能保证较高的合成语音质量。  相似文献   

19.
语音信号处理是实现人机交互和话音通信技术的基础,语音信号处理教学实验课程在国外著名大学的电子工程系中普遍开设。语音信号处理实验课是为适应当前人才培养需求,配合语音信号处理课程课堂教学而开设的。通过语音信号处理实验可以让学生深入掌握数字信号处理的基本方法、属于准平稳随机过程的语音信号的特点、语音通信中编码方法、话音质量评价方法、语言信息处理的基本方法、统计模式识别的基本原理等基础知识和应用方法,并增加对实际建模方法和算法编程能力及基本理论的应用能力。在培养学生的动手和分析解决问题能力的同时激发学生对相关领域的研究兴趣。本实验课对深入学习语音信号处理课程深入以及培养语音领域高层次人才具有重要意义。  相似文献   

20.
针对数字化通信网及多媒体应用中低速率数字语音编码问题,以多带激励(MBE)声码器为模型,采用了一些新算法去降低编码速率和改善音质。利用动态规划算法对基音周期进行平滑,去除了声码器中常有的音调噪声。利用LPC全极点模型谱逼近MBE谱包络,并采用共振峰增强技术来补偿模型误差,有效地降低了编码速率。为了能够实时实现这个编码系统,采用了分裂矢量量化,多级矢量量化和前向多层人工神经网络等技术进行优化和改善,使之在2.4kbit/s,1.2kbit/s及800bit/s等速率上实时实现了较高质量的语音压缩编码。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号