首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 291 毫秒
1.
IP语音包的自适应编码和封装算法的研究   总被引:1,自引:0,他引:1  
黄永峰  李星 《电子与信息学报》2002,24(12):1829-1834
IP电话与传统电话相比语音质量较差,其中最主要的原因是因特网的带宽变化较大,导致丢包率较大。该文根据因特网带宽变化的特点提出了1种应用在IP电话网关中的语音自适应编码与封装策略,采用该策略的编码器能根据网络的带宽变化动态调节语音编码速率和语音包封装大小。据此,本文提出了4种算法:一种基于RTP协议语音包丢失率的计算算法、变速率编码算法,不同长度IP语音包的封装算法和根据丢包率来调整编码速率和封装的自适应算法。  相似文献   

2.
在基于IP网络下进行语音通信的过程中,不可避免地会遇到数据包丢失现象,极大地影响了传输服务的质量。对此问题展开讨论,讲述了丢包的原因,对当前普遍采用的几种丢包恢复技术进行了介绍,通过比较提出了自己的观点。  相似文献   

3.
NGN网络是基于IP的网络。语音业务承载IP上势必存在语音质量的问题。如何保证VOIP的语音质量是运营商和广大用户关注的重点。文章介绍了目前VOIP语音质量的主要评价模型MOS、PSQM、PESQ。分析了这几种评价模型的各自特点。结合目前IP电信网络的现状讨论语音压缩编码方式、回声抑制、JitterBuffer及网络的丢包、时延、抖动等因素对VOIP语音质量的影响。并探讨了一些提高NGN网络中VOIP语音质量的主要方法和途径。  相似文献   

4.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法。将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决。实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性。应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率。  相似文献   

5.
基于电话用户交换机的语音识别系统研究   总被引:3,自引:0,他引:3  
本论文对电话用户交换机研制了一个声控语音命令交换系统,该系统能够实现与特定人无关中小词汇量连续命令语音自动识别,研究中统计了用和命令语句,生成相应识别文法网络,识别系统的训练采用由子词模型构成的复合模型进行强化训练,识别采用令牌传递式改进Viterbi算法,提高系统的识别性能,论文比较了不同语音特征参数以及隐含马尔可夫模型状态数对电话语音识别精度的影响,研究中还开发识别系统拒识系统,在无拒识情况下  相似文献   

6.
苟先太  金炜东 《信号处理》2006,22(3):417-421
当网络中存在突发大时延时,就会出现极大丢包率或极大端到端时延的情况,从而难以获得好的语音质量。对于这个问题,提出针对突发大时延存在下的自适应语音缓冲算法。算法通过控制语音包在语音缓冲队列中的位置来控制语音包的播放时间,从而可以尽量减小语音裂缝(Gap)的出现。算法将突发大时延存在下的最大丢包率可以扩大到20%,而一般的预测算法只能容忍5-10%的最大丢包率。通过基于听觉模型的客观音质评价(PESQ)仿真计算,以及实际应用表明本文的算法对有突发大时延存在的网络中的语音通信质量有一定的改善作用。  相似文献   

7.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

8.
杨永铭  王喆 《电信科学》2008,24(2):56-59
基于IP技术的语音分组传输(VoIP)电话目前被广泛使用,Skype与GTalk是VoIP应用的两个典型代表.在可控网络环境下,通过调整信道容量、时延、丢包、抖动等网络参数,利用PESQ MOS方法评测了Skype与GTalk的语音质量,并且讨论了在可变网络环境下的动态适应性策略.  相似文献   

9.
贾龙涛  鲍长春 《通信学报》2006,27(6):121-125
目前,几乎所有的语音电话系统(VoIP)都采用固定速率传输,这使得网络丢包,特别是连续丢包无法避免,因此导致了严重的语音质量下降.针对这一问题,给出了一种新的抗分组丢失的网络语音通信系统,并用网络仿真软件NS(network simulator)对该系统进行了性能分析,仿真实验证明,所提出的网络语音通信系统在网络丢包、平均延迟和主观听觉方面明显优于传统的IP语音电话系统.  相似文献   

10.
《无线电通信技术》2019,(5):546-549
针对语音分组在网络传输中的延时抖动和丢包问题,提出了基于RTP时间信息的数据动态缓冲技术。详细论述了动态缓冲区大小的调整算法,该方法可以根据网络传输状况自适应地调整缓存区的大小,通过在合适的时机调整缓冲延时,自动适应当前的网络传输状态。通过算法仿真和实际平台测试,验证了该方法可以有效去除语音分组的丢失和抖动问题,较好地平衡了语音的传输质量和实时性能,提升了用户体验,对网络情况下的语音分组传输有着重要的参考意义。  相似文献   

11.
李智  刘源  闫斌 《通信技术》2015,48(4):441-446
在自组织网络语音通信中,针对音频传输中存在的延时、丢包等主要问题,在ZigBee网络路由的基础上建立层次分析法评价模型,设计了一种音频传输路由算法AHP-RP。通过分析路径链路质量、音频负载值、路径存活时间和路径长度等因素对音频质量的影响,构建以网络的4个因素为因子的比较矩阵,选择最优传输路径。仿真及实际通信平台验证表明,该算法能有效地适应网络状态,明显改善了语音通话质量。  相似文献   

12.
为提高语音识别系统在复杂声学场景下的识别率,出现了以单通道语音增强(Monaural Speech Enhancement)技术作为前端处理的鲁棒语音识别系统.尽管现有的单通道语音增强技术能够提高混响干扰下的识别率,却未能显著提升宽带非平稳噪声干扰下的系统识别率.为此,本文提出基于听觉掩蔽生成对抗网络的单通道增强方法,通过听觉掩蔽增强模型和判别器构成的对抗过程,来使增强后的语音特征满足目标语音的概率分布.实验结果表明,就语音识别率而言,所提出的听觉掩蔽生成对抗网络超越了现有的增强方法,能够相对减少19.50%的词错误率,显著提升语音识别系统的噪声鲁棒性.  相似文献   

13.
VoLTE是在4G网络全IP条件下的端到端语音解决方案,能提供更短的接入时延和更好的语音质量。在建立语音质差模型和分析空口丢包原理的基础上,梳理无线侧VoLTE语音感知的优化流程,对无线侧影响VoLTE语音感知的6个维度进行专项优化整治,实施效果较好,为今后VoLTE用户语音感知优化提供参考和指导。  相似文献   

14.
王涛  全海燕 《信号处理》2020,36(6):1013-1019
基于深度神经网络的语音分离方法大都在频域上进行训练,并且在训练过程中往往只关注目标语音特征,不考虑干扰语音特征。为此,提出了一种基于生成对抗网络联合训练的语音分离方法。该方法以时域波形作为网络输入,保留了信号时延导致的相位信息。同时,利用对抗机制,使生成模型和判别模型分别训练目标语音和干扰语音的特征,提高了语音分离的有效性。实验中,采用Aishell数据集进行对比测试。结果表明,本文所提方法在三种信噪比条件下都有良好的分离效果,能更好地恢复出目标语音中的高频频段信息。   相似文献   

15.
为了提高视频会议中音视频码流在丢包网络上的传输性能,文中将Tornado抗丢包编码技术应用于视频会议的音视频传输中,从而提高了数据传输的可靠性.同时,为了适应网络状态的变化,文中还提出了一种基于RTP/RTCP的端到端反馈拥塞控制策略,该策略既可有效地利用带宽,又可降低因丢包带来的影响.  相似文献   

16.
短波地空话音组网是短波话音通信发展的必然趋势,组网后VoIP技术的引入会为短波语音通信带来很大的便利,但同时语音质量会受到影响,其中VoIP编码技术是影响语音质量的主要因素之一。通过Matlab对采用不同编码技术重构后的语音,经过基于Watterson模型的短波信道传输后到达接收端的质量进行了PESQ评估,并仿真分析了丢包率对不同编码语音质量的影响,得出了不同编码的优劣性。  相似文献   

17.
史媛媛  刘加  刘润生 《电子学报》2002,30(7):959-963
尽管汉语数码语音识别只涉及十个数字,但由于不同数字的发音存在相同或相似的声母或韵母,造成汉语数码语音之间的混淆性很大.采用通常的隐含马尔科夫模型(HMM)作为汉语数码语音识别模型难以得到很高的识别率.为了解决汉语数码之间的混淆问题,提高汉语数码语音识别性能,本文在隐含马尔科夫模型的状态层次上采用线性区分分析方法,将不同状态之间容易混淆的特征样本构成混淆模式类,针对混淆模式类进行线性区分分析.通过线性区分变换,在变换特征空间中仅保留那些能够有效区分该混淆类别的特征参数.这种基于状态的线性区分分析有效地提高了模型对混淆数码的区分能力.实验表明即使采用状态数很少的粗糙识别模型,也能很大幅度提高模型的识别性能;经过线性区分变换优化后的汉语数码识别模型,孤立汉语数码语音识别率可以达到99.32%.  相似文献   

18.
VoIP技术的发展和广泛应用对网络信息内容监管提出了新的挑战。针对网络VoIP监管所存在的数据流量大、编解码速度慢等问题,提出一种分布式VoIP监管模型,该模型采用快速截包、自适应语音编码和语音会话同步等关键技术.实现了一个快速实时语音监管系统。对系统的监管效率和语音延时状况也进行了详细测试,结果表明.该监管模型在保证较好语音回放质量的基础上,实现了实时在线监听语音会话功能。  相似文献   

19.
何莹男  陈喆  殷福亮 《信号处理》2020,36(6):894-901
在语音通信网络中,为获得良好的语音通信质量,抗丢包技术不可或缺。为此,本文基于 ITU G.722.1 语音编码器,提出一种分布式语音编码方法。该方法在 G.722.1 编码器的基础上,构建一个互补编码器;然后在编码端,对同一帧语音分别用 G.722.1 编码器和其互补编码器进行语音编码,并发送编码结果;在解码端,在接收到其中任一语音码流时,用 G.722.1 解码器进行解码,其语音质量不低于 G.722.1 编码器的解码结果,而在接收到两个语音码流时,用 G.722.1 解码器先分别对两个语音码流进行解码,然后对解码结果进行联合处理,其最终的语音质量有明显提升,即有一定编码增益。仿真实验结果表明,本文分布式语音编码方法的抗丢包效果明显,相对于原始编解码器其语音质量进一步提升。   相似文献   

20.
分组语音技术简述1引言在当今的网络计算领域中出现了多种很有吸引力的方案,可以替代传统公共电话和租用线路方案。其中最有意思的是基于新一代语音传输技术-分组语音的网络技术。分组语音是网络中传输的一种“数据”,因此它可以在通常用于发送数据的网络中传输。分组...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号