首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 24 毫秒
1.
矢量量化(VQ)是语音识别中广泛应用的一种数据压缩和编码方法。在矢量量化的码本设计过程中,经典的LBG算法收敛速度快,但极易陷入局部最优,且初始码本的生成对最佳码本的设计影响很大。考虑到遗传算法(GA)是一种具有全局优化搜索能力的算法,提出了GA和LBG算法相结合的GA L算法来优化码本,改善了码本质量,并将其应用于非特定人汉语连续数字语音识别中。实验结果表明,GA L算法优于传统的LBG算法。  相似文献   

2.
提出了一种新的适用于离散HMM说话人辨认系统的VQ码本训练方法,码本的训练准则是使码本中各码字的利用率趋于均等.将新方法训练的码本与用LBG算法训练的码本进行了比较,实验表明,在基于离散HMM的说话人辨认系统中,用新方法训练的码本性能优于用LBG算法训练的码本,特别是在与文本无关的情况下,使系统的正确辨认率显著提高.  相似文献   

3.
基于改进禁止搜索算法的矢量量化码书设计   总被引:9,自引:0,他引:9       下载免费PDF全文
本文提出了基于改进禁止搜索(TS)算法的矢量量化(VQ)码书设计方法.禁止搜索算法的关键是如何定义一个解以及如何在当前解的基础上生成邻域解.由于码书设计的两个优化准则是最邻近条件和聚类质心条件,本文提出了两种禁止搜索算法的解描述方案,其相应算法分别叫基于码书的禁止搜索(CB-TS)算法和基于聚类划分的禁止搜索(PB-TS)算法.为了提高禁止搜索算法的性能,文中在禁止搜索算法中融入了模拟退火(SA)机制.为了进一步提高码书性能,文中还将码书设计的传统LBG算法融入禁止搜索算法中.结果表明,基于禁止搜索的两种码书设计方案所生成的码书性能都比LBG算法有明显提高.  相似文献   

4.
本文提出了一种基于遗传算法的矢量化方法。矢量量化码书设计本质是搜索训练矢量的最佳分类。遗传算法有卓越的全局优化搜索能力,易搜索到全局最优的矢量分类,形成高度优化的码书,可克服传统方法局部优化的缺陷。该算法不依赖初始条件、鲁棒性好、结构规则、并行性高。  相似文献   

5.
A comparison of several vector quantization codebook generationapproaches   总被引:1,自引:0,他引:1  
A review and a performance comparison of several often-used vector quantization (VQ) codebook generation algorithms are presented. The codebook generation algorithms discussed include the Linde-Buzo-Gray (LBG) binary-splitting algorithm, the pairwise nearest-neighbor algorithm, the simulated annealing algorithm, and the fuzzy c-means clustering analysis algorithm. A new directed-search binary-splitting method which reduces the complexity of the LBG algorithm, is presented. Also, a new initial codebook selection method which can obtain a good initial codebook is presented. By using this initial codebook selection algorithm, the overall LBG codebook generation time can be reduced by a factor of 1.5-2.  相似文献   

6.
粒子对算法在图像矢量量化中的应用   总被引:8,自引:0,他引:8       下载免费PDF全文
纪震  廖惠连  许文焕  姜来 《电子学报》2007,35(10):1916-1920
本文给出了一种新的图像矢量量化码书的优化设计方法——粒子对算法.在传统粒子群优化(Particle Swarm Optimization,PSO)算法的基础上,用两个粒子构成了群体规模较小的粒子对,在码书空间中搜索最佳码书.在每次迭代运算中,粒子对按先后顺序执行PSO算法中的速度更新、位置更新操作和标准LBG算法,并用误差较大的训练矢量代替越界的码字.此算法避免粒子陷入局部最优码书,较准确地记录和估计每个码字的最佳移动方向和历史路径,在训练矢量密集区域和稀疏区域合理地分配码字,从而使整体码书向全局最优解靠近.实验结果表明,本算法始终稳定地取得显著优于FKM、FRLVQ、FRLVQ-FVQ算法的性能,较好地解决了矢量量化中初始码书影响优化结果的问题,且在计算时间和收敛速度方面有相当的优势.  相似文献   

7.
高效的模糊聚类初始码书生成算法   总被引:2,自引:0,他引:2  
码书设计在矢量量化中至关重要,而多数码书设计算法都是基于初始码书的.从经典的LBG算法的缺陷出发,提出一种基于模糊聚类的高效初始码书生成算法,通过将初始码书的码矢在输入矢量空间中很好地散开,并尽可能占据输入概率密度较大的区域,从而使之后的LBG算法避免陷入局部最优,设计出的码书性能更好,更加接近全局最优,同时加快了收敛速度,减少了迭代次数.将该算法应用于图像编码的实验中,结果表明:该算法能够从效率和质量两方面有效地提高矢量量化的性能.  相似文献   

8.
基于遗传算法的最优码本设计   总被引:2,自引:0,他引:2  
矢量量化是一种极其重要的信号压缩方法,广泛应用于图像信号压缩、语音信号压缩等领域,它的主要问题是码本设计问题,传统的LBG算法及其改进算法只能获得局部最优的码本。本文详细讨论了如何利用遗传算法来获得全局最优的码本,目的应用于说话人识别。本文具体给出了基于遗传算法的最优码本设计算法的实现方法和实验结果。实验表明,本文实现的算法有效。  相似文献   

9.
The Linde-Buzo-Gray (LBG) algorithm is usually used to design a codebook for encoding images in vector quantization. In each iteration of this algorithm, one must search the full codebook in order to assign the training vectors to their corresponding codewords. Therefore, the LBG algorithm needs a large computation effort to obtain a good codebook from the training set. The authors propose a finite-state LBG (FSLBG) algorithm for reducing the computation time. Instead of searching the entire codebook, they search only those codewords that are close to the codeword for a training vector in the previous iteration. In general, the number of these possible codewords can be made very small without sacrificing performance. By only searching a small part of the codebook, the computation time is reduced. In experiments, the performance of the FSLBG algorithm in terms of signal-to-noise ratio is very close to that of the LBG algorithm. However, the computation time of the FSLBG algorithm is about 10% of the time required by the LBG algorithm  相似文献   

10.
本文讨论了自组织特征映射人工神经网络在语音矢量量化中应用时所涉及的两个重要问题,即码本训练和码本搜索的问题。根据语音反射系数的特点,提出了训练中初始码本的选择原则和实用训练算法。利用特征映射网络的聚类特性和语音相邻帧间的相关性,提出了码本搜索的两种快速算法——子域搜索法和邻域搜索法。大量实验结果表明,这两种快速搜索方法相结合,搜索时间减少为常用的LBG全搜索算法的1/4或1/10,同时保持精度不下降。本文提出的方法已在一种极低数据率的声码器中得到成功应用。  相似文献   

11.
矢量量化(VQ)是一种极其重要的信号压缩方法,广泛地应用于图像信号压缩、语音信号压缩领域。它I的主要问题是码本设计,在码本设计过程中,有许多算法被提出。本文提出了PSO和LBG算法相结合的1PSO—LBG算法采设计码本,改善了码本质量,提高了收敛速度。  相似文献   

12.
图像矢量量化(VQ)是图像压缩算法中的重要环节,而在VQ中起决定性因素的又是能否构造出性能优异的码书,本文在比较LBG,SOFM和改进的SOFM优缺点的基础上,采用具有结构自适应特性的自组织神经网络(SASONN)来构造码书,克服了SOFM算法的网络映射欠准确、神经元过利用等弊端,并将结果应用在图像压缩编码算法(VQ+DPCM+DCT)中,实验结果表明,主客观效果良好。  相似文献   

13.
针对在LBG算法中存在初始码书的选择极易影响码书训练的收敛速度和最终码书性能的缺陷,提出了一种基于微粒群的矢量量化码书设计算法.首先产生具有一定全局性特点的初始码书,然后再应用LBG算法进行优化得到同时具有局部特性的码书.实验结果验证了该算法的合理性.  相似文献   

14.
Vector quantization (VQ) is an efficient technique for data compression and has been successfully used in various applications. The methods most commonly used to generate a codebook are the Linde, Buzo, Gray (LBG) algorithm, fuzzy vector quantization (FVQ) algorithm, Kekre‘s Fast Codebook Generation (KFCG) algorithm, discrete cosine transform based (DCT-based) codebook generation method, and k-principle component analysis (K-PCA) algorithm. However, if the separation boundaries in codebook generation are nonlinear, their performance can degrade fast. In this paper, we present a kernel fuzzy learning (KFL) algorithm, which takes advantages of the distance kernel trick and the gradient-based fuzzy clustering method, to create a codebook automatically. Experiments with real data show that the proposed algorithm is more efficient in its performance compared to that of the LBG, FVQ, KFCG, and DCT-based method, and to the K-PCA algorithm.  相似文献   

15.
应用神经网络的图像分类矢量量化编码   总被引:3,自引:0,他引:3  
矢量量化作为一种有效的图像数据压缩技术,越来越受到人们的重视。设计矢量量化器的经典算法LBG算法,由于运算复杂,从而限制了矢量量化的实用性。本文讨论了应用神经网络实现的基于边缘特征分类的矢量量化技术。它是根据人的视觉系统对图象的边缘的敏感性,应用模式识别技术,在对图像编码前,以边缘为特征对图像内容分类,然后再对每类进行矢量量化。除特征提取是采用离散余弦变换外,图像的分类和矢量量化都是由神经网络完成  相似文献   

16.
文中将频率敏感算法引入到基本的蚁群算法中,提出了一种改进的蚁群聚类码书设计算法。在提出的码书设计算法中采用LBG码书优化准则,引入了频率敏感算法。仿真实验表明,提出的算法避免了停滞现象发生,有效地提高了其全局搜索能力。  相似文献   

17.
在粒子群优化(Particle Swarm Optimization, PSO)和混合蛙跳算法(Shuffled Frog-Leaping Algorithm, SFLA)的基础上,该文提出了一种新的混合粒子对优化(Shuffled Particle-Pair Optimizer, SPPO)算法,应用于矢量量化的说话人识别。该算法将全局信息交换和局部深度搜索相结合寻求最佳的说话人码本。群体按适应值分为3个粒子对,每个粒子对由两个粒子构成,按先后顺序执行PSO算法中的速度位置更新和LBG算法以实现局部细致搜索,间隔一定的迭代次数通过SFLA混合策略实现粒子对间的信息交换,从而使群体向全局最优解靠近。实验结果表明,本算法始终稳定地取得显著优于LBG,FCM,FRLVQ-FVQ和PSO算法的说话人识别性能,较好地解决了初始码本影响的识别性能的问题,且在计算时间和收敛速度方面有相当的优势。  相似文献   

18.
罗雪晖  李霞  张基宏 《通信学报》2005,26(9):135-139
提出了一种基于混合蚁群算法的矢量量化码书设计算法。该算法首先通过自适应地调整截取转移概率的参数,加大蚁群算法的搜索最优解的力度;然后以蚁群算法搜索的结果作为初始解,利用改进的LBG算法作进一步的搜索,从而加快算法的收敛速度。实验结果表明,该算法不但大大提高码书性能,而且也缩短了运行时间,解码恢复图像能获得较高的主、客观质量。  相似文献   

19.
LBG算法中空包腔的优化处理   总被引:5,自引:0,他引:5  
矢量量化(VQ)技术在说话人识别方面得到广泛的应用。VQ码本的产生通常采用LBG算法,LBG算法不可忽视的问题之一是空包腔的处理,它对码本的质量和算法的效率都产生影响。为此提出一种优化的空包腔处理方法:对得分最大的包腔的分解是基于聚类机会均等和码字最有代表性原则下进行的,避免了再一次产生空包腔的可能性。同时该方法还是基于不损失矢量的原则,对保持矢量空间分布的完备性具有意义。该方法得到了实验的验证。  相似文献   

20.
LSF(线谱频率)码书的性能对合成语音质量有着重要影响.经典的LBG算法容易陷入局部最优,而目前的一些码书进化算法搜索空间较大、搜索效率不明显.本文提出了一种新型的基于对LSF矢量空间进行拉伸变化的混合进化码书优化算法.该算法编码空间与矢量同维,相对较小,便于优化操作.算法中引入EP中的变异操作对PSO位置、速度矢量进行控制,以提高优化搜索算法的效率.实验结果表明,本文算法有效地改善了码书性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号