首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
提出了一种信道自适应加权矢量量化(CAWVQ)算法。采用对处于两种不同状态的典型码书进行加权的算法,获得与信道状态相匹配的码书,并且只使用较少的存储空间。将该算法应用于噪声信道中,能够有效的提高矢量量化器的性能。仿真实验表明该算法能够比其他算法得到更高的信噪比。  相似文献   

2.
基于矢量量化的数字图像水印技术研究   总被引:2,自引:2,他引:0  
基于矢量量化的数字水印是数字水印技术一个新的研究领域.主要研究基于矢量量化的数字图像水印技术的原理和性能.在简要介绍水印技术和矢量量化技术后阐述了基于矢量量化的数字水印算法的基本原理.通过分析几种典型的矢量量化水印算法,总结出基于矢量量化水印算法的特点是其在嵌入容量和算法易行性方面有绝对优势,并且对于VQ压缩攻击有很好的鲁棒性,但水印图像的质量对于版权保护来说还有待提高.指出进一步研究的方向是结合DCT、DWT、HVS来改善.  相似文献   

3.
基于矢量量化的数字水印是数字水印技术一个新的研究领域。主要研究基于矢量量化的数字图像水印技术的原理和性能。在简要介绍水印技术和矢量量化技术后阐述了基于矢量量化的数字水印算法的基本原理。通过分析几种典型的矢量量化水印算法,总结出基于矢量量化水印算法的特点是其在嵌入容量和算法易行性方面有绝对优势,并且对于VQ压缩攻击有很好的鲁棒性,但水印图像的质量对于版权保护来说还有待提高。指出进一步研究的方向是结合DCT、DWT、HVS来改善。  相似文献   

4.
模糊C-均值聚类新算法在说话人辨认中的应用   总被引:2,自引:0,他引:2  
该文提出了一种将模糊C-均值聚类法的各种改进算法与矢量量化法相结合的说话人辨认的新方法。首先从语音信号中提取MFCC特征矢量,其次利用矢量量化来设计码书,最后用改进算法对待识语音进行辨认。新算法的辨认率达到95%以上,抗噪性能也优于矢量量化法。  相似文献   

5.
在矢量量化中,码书起决定性的作用,它决定了量化的性能;一般采用LBG算法生成码书,其中一个关键的技术就是初始码书的选取,通常认为分裂法效果显著。该文引入贪婪树生长算法来设计初始码书,得到了两个优于分裂法的初始码书设计算法,减少了整个码书训练的运算时间,提高了码书的性能。  相似文献   

6.
徐军  叶澄清 《计算机科学》2000,27(12):95-96
1 引言 Linde、Buzo和Gray在1980年提出的LBG算法一直是设计矢量量化器的经典算法。码书设计是基于矢量量化图像编码的关键技术。矢量量化的研究主要围绕着降低码率,减小失真和降低复杂度(空间、时间)这三者之间来展开的。码率、失真和复杂度是矢量量化的三个关键要素。自从LBG算法被提出以来,许多学者对矢量量化用于图像压缩提出了大量改进算  相似文献   

7.
经典LBG算法的局部极小值问题是制约其性能的重要因素.根据渐进最优矢量量化理论的思想提出了一种改进型LBG算法,它采用码字转移的方法使各个类的畸变趋于平衡,从而近一步减小平均畸变以获得性能更优的量化器.文中介绍了若干实验,对多种分布的样本以及2维图像进行了经典算法和改进型算法的比较.从实验结果看出,后者的算法性能大大优于前者.  相似文献   

8.
本文对照经典的矢量量化算法的不足,讨论了基于竞争机制的连续Hopfield神经网络矢量量化算法的设计与实现。详细描述了网络映射过程、网络能量函数的刻画和神经元状态转换方程。实验结果表明,与经典的LBG算法相比,本文所提算法具有更好的性能和强大的并行处理能力以及更优良的全局优化能力。  相似文献   

9.
作为一种有损图像编码技术,块截短编码算法(BTC)的计算量较少,速度快,有较好的信道容错力,重建图像质量较高。然而,标准BTC算法的主要缺点是其压缩比特率比其他基于块图像编码的算法(如变换编码和矢量量化)高。为了降低比特率,提出了几种有效的BTC算法,还提出了一种简单的查表算法对每块的BTC量化数据编码,另外还引入了矢量量化技术以减少对位平面编码的比特数。为了减少由改进算法引入的额外失真,在每种提出的算法中,采用最优阈值而不用平均值作为量化阈值。  相似文献   

10.
金聪 《计算机工程》2005,31(13):159-161
提出了基于改进进化规划和LBG算法的一种新的矢量量化算法。由于进化规划中十进制编码方案的收敛速度比二进制编码方案快,因此在进化规划中采用十进制编码方案。同时,根据图像压缩的特点,为了提高算法性能,该文采用一种自适应的多位变异操作。之后将改进的进化规划引入到图像压缩的矢量量化问题中。实验表明,新算法在提高恢复图像质量方面比传统方法优越。  相似文献   

11.
采用遗传算法的文本无关说话人识别   总被引:1,自引:0,他引:1  
为解决在说话人识别方法的矢量量化(Vector Quantization,VQ)系统中,K-均值法的码本设计很容易陷入局部最优,而且初始码本的选取对最佳码本设计影响很大的问题,将遗传算法(Genetic Algorithm,GA)与基于非参数模型的VQ相结合,得到1种VQ码本设计的GA-K算法.该算法利用GA的全局优化能力得到最优的VQ码本,避免LBG算法极易收敛于局部最优点的问题;通过GA自身参数,结合K-均值法收敛速度快的优点,搜索出训练矢量空间中全局最优的码本.实验结果表明,GA-K算法优于LBG算法,可以很好地协调收敛性和识别率之间的关系.  相似文献   

12.
许允喜  俞一彪 《计算机应用》2008,28(2):339-341,
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一,它的主要问题是码本设计问题。语音特征参数是高维数据,样本分布复杂,因此码本设计的难度也很大,传统的LBG算法只能获得局部最优的码本。提出一种VQ码本设计的新方法,将小生境技术与K-均值算法融入到免疫算法训练过程中,形成混合免疫算法,采用针对高维数据聚类的改进变异算子,降低了随机变异的盲目性,增强群体的全局及局部搜索能力,同时通过接种疫苗提高算法的收敛速度。说话人识别实验表明,与传统LBG和基于混合遗传算法的VQ码本设计方法相比,该方法可以得到更优的模型参数,使得系统的识别率进一步提高。  相似文献   

13.
结合声纹特征和VQ(Vector Quantization)识别算法的特点,在对整数同态加密算法进行改进的基础上,提出基于同态加密(homomorphic encryption scheme)的声纹模板保护方法。将实数形式的码本和认证声纹特征转化为整数,采用改进的整数同态加密算法对数据加密并计算密文的欧氏距离分量差,运算结果经解密后用于计算平均最小量化误差最终进行决策输出。该方法克服了实数同态加密算法密文泄漏明文的大小关系、小数和正负数信息等缺陷,并能抵抗已知明文攻击。实验结果表明,加密后系统的身份认证性能可基本保持,验证了方法的有效性。  相似文献   

14.
高会贤  马全福  郑晓势 《计算机应用》2010,30(10):2712-2714
为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率,基于矢量量化识别算法,对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC)的提取相结合,并将改进后的特征与谱质心特征进行了组合,建立了一种美尔频率小波变换系数+谱质心(MFWTC+SC)的新的组合特征参数。经实验表明,该组合特征可以有效地提高说话人识别系统的性能。  相似文献   

15.
基于方差归一化失真测度的改进的LBG算法   总被引:3,自引:1,他引:2  
矢量量化(VQ)技术在话者识别系统中得到了广泛的应用。 VQ码本的产生通常采用 LBG算法,失真测度则为对矢量的各分量等权重的欧氏距离。在话者识别系统中特征矢量的各个分量的分布是有差别的,且对于不同的话者,这种差别的程度又是不一样的。由于不同分布的各维参数对话者识别的有效性各不相同,因此,文章提出了一种能反映这种有效性差别的失真测度,即:方差归一化失真测度。以该失真测度为基础,并结合时序相关的初始码本设计方法及有效的零胞腔处理技术,文章提出了改进的LBG算法,同时利用该算法训练出改进的VQ话者模型,并进行了话者识别实验。  相似文献   

16.
A self-organizing map (SOM) approach for vector quantization (VQ) over wireless channels is presented. We introduce a soft decoding SOM-based robust VQ (RVQ) approach with performance comparable to that of the conventional channel optimized VQ (COVQ) approach. In particular, our SOM approach avoids the time-consuming index assignment process in traditional RVQs and does not require a reliable feedback channel for COVQ-like training. Simulation results show that our approach can offer potential performance gain over the conventional COVQ approach. For data sources with Gaussian distribution, the gain of our approach is demonstrated to be in the range of 1–4 dB. For image data, our approach gives a performance comparable to a sufficiently trained COVQ, and is superior with a similar number of training epoches. To further improve the performance, a SOM–based COVQ approach is also discussed.  相似文献   

17.
《Parallel Computing》2002,28(7-8):1079-1093
Vector quantization (VQ) is a widely used algorithm in speech and image data compression. One of the problems of the VQ methodology is that it requires large computation time especially for large codebook size. This paper addresses two issues. The first deals with the parallel construction of the VQ codebook which can drastically reduce the training time. A master/worker parallel implementation of a VQ algorithm is proposed. The algorithm is executed on the DM-MIMD Alex AVX-2 machine using a pipeline architecture. The second issue deals with the ability of accurately predicting the machine performance. Using communication and computation models, a comparison between expected and real performance is carried out. Results show that the two models can accurately predict the performance of the machine for image data compression. Analysis of metrics normally used in parallel realization is conducted.  相似文献   

18.
The variations in speech production due to stress have an adverse affect on the performances of speech and speaker recognition algorithms. In this work, different speech features, such as Sinusoidal Frequency Features (SFF), Sinusoidal Amplitude Features (SAF), Cepstral Coefficients (CC) and Mel Frequency Cepstral Coefficients (MFCC), are evaluated to find out their relative effectiveness to represent the stressed speech. Different statistical feature evaluation techniques, such as Probability density characteristics, F-ratio test, Kolmogorov-Smirnov test (KS test) and Vector Quantization (VQ) classifier are used to assess the performances of the speech features. Four different stressed conditions, Neutral, Compassionate, Anger and Happy are tested. The stressed speech database used in this work consists of 600 stressed speech files which are recorded from 30 speakers. SAF shows maximum recognition result followed by SFF, MFCC and CC respectively with the VQ classifier. The relative classification results and the relative magnitudes of F-ratio values for SFF, MFCC and CC features are obtained with the same order. SFF and MFCC feature show consistent relative performance for all the three tests, F-ratio, K-S test and VQ classifier.  相似文献   

19.
随着微电子技术的高速发展,基于片上系统SOC的关键词识别系统的研究已成为当前语音处理领域的研究热点和难点。运用Xilinx公司ViterxII Pro开发板作为硬件平台,结合ISE10.1集成开发环境,完成了语音帧输出、MFCC、VQ和HMM等子模块的设计;提出了一种语音帧压缩模块架构,有效实现了语音帧信息到VQ标号序列的压缩,实现了由语音帧压缩模块和HMM模块构建的FPGA关键词识别系统。仿真实验结果表明,该系统具有较高的识别率和实时性,为关键词识别系统的FPGA硬件电路的实现研究提供了实例。  相似文献   

20.
杨洁  李松斌  邓浩江 《计算机应用》2018,38(7):1967-1973
压缩语音量化索引调制(QIM)信息隐藏方法中,最近邻投影点QIM(NPP-QIM)方法具有较高的嵌入效率和隐蔽性。针对现有的隐写分析方法对NPP-QIM方法检测准确率不高的问题,提出了一种基于贝叶斯推理的检测方法以提高检测准确率。首先,利用矢量量化(VQ)码字(VQ1、VQ2、VQ3)构建了码字时空转移网络(CSTN);接着,以码字转移指数对CSTN进行化简得到隐写敏感码字时空转移网络(SS-CSTN);然后,基于SS-CSTN进一步构建了码字贝叶斯网络(CBN);最后,使用Dirichlet分布作为先验分布学习网络参数,实现对QIM信息隐藏的检测。实验结果表明,在嵌入率为100%、时长为10 s时,与索引分布特征(IDC)方法和梅尔频率倒频系数(DMFCC)方法相比,提出CBN方法的检测准确率分别提高了25个百分点和 37个百分点;在时间性能方法,检测一段10 s的语音时间约为21 ms,能够实时检测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号