首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
本文提出了一种二维OCT快速算法的FPGA实现结构,采用行列快速算法将二维DCT分解成两个一维DCT实现,其中一维DCT借鉴Loeffler DCT算法,采用并行的流水线结构,提高电路的数据吞吐率和运算速度,通过系数矩阵的简化和蝶形运算结构的等价减少乘法器的消耗,一维DCT核消耗16个乘法器.转置RAM采用8片双口RAM,一个时钟可以完成 8个数据读写.实验结果验证了二维DCT核设计的正确性,该电路结构消耗资源少,布线简单,功耗小,适合图像的实时处理.  相似文献   

2.
提出了一种二维DCT快速算法的FPGA实现结构,采用快速算法将二维DCT分解成一维DCT的两次运算,其中一维DCT采用并行的流水线结构,提高电路的数据吞吐率和运算速度,通过系数矩阵的简化和蝶形运算结构的等价减少乘法器的消耗。提出了一种高效的矩阵转置实现方法,一个时钟可以完成8个数据读写。实验结果验证了二维DCT核设计功能和时序的正确性,最高可工作在110MHz,可用于基于DCT压缩的实时图像处理。  相似文献   

3.
DCT快速算法是H.264编码的关键问题之一。该文根据H.264中44块残差系数的分布特征及DCT系数的能量分布特性,提出一种基于DCT系数子带划分的子带DCT快速算法。该算法在DCT和量化前预判出为零的DCT系数,节省了这些系数的DCT和量化计算开销,提高编码效率。该文提出了划分DCT系数子带的判断标准,预判出子带中量化后为零的DCT系数后,仅计算非零的DCT系数,相应地也减少量化(Q),反DCT(IDCT),反量化(IQ)的计算。实验结果表明,该文算法在保持图像质量和码率的同时,极大地节省了DCT, Q,IQ,IDCT的计算量,提高了H.264的编码效率。  相似文献   

4.
为提高编码效率,通过分析残差系数在空域和DCT域均符合拉普拉斯分布后,提出一种快速DCT算法.该算法能够在DCT之前对每个量化DCT系数进行零值预判而节省DCT计算.通过头肩序列的实验表明新算法在不降低图像质量的条件下,其整体运算复杂度优于常规算法.  相似文献   

5.
H.264整数DCT变换算法有助于减少计算复杂度,提高编码速度,进一步提高视频或图像的压缩效率。分析H.264整数DCT变换的快速算法及其实现原理,并提出一种用来具体实现一个4×4块的DCT变换的结构;同时给出用VHDL语言实现4×4块DCT变换的内部模块的源代码和仿真波形。仿真结果表明用该算法可快速实现一个4×4块的整数DCT变换。提出一种切实可行的用于H.264整数DCT变换的结构,该结构可完全用硬件电路快速实现;对于用FPGA实现H.264整数DCT变换做了一次实践性的尝试,对深入理解H.264整数DCT变换及其算法的具体实现具有一定的实践意义。  相似文献   

6.
何业军  刘鹏  雷海军  提干  李先义 《电视技术》2011,35(15):68-70,83
提出了一种基于5级流水线的高精度向量乘法器的二维DCT VLSI结构.采用一维DCT行处理,转置RAM存储器,一维DCT列处理的流水线结构代替复用一维DCT算法以提高速度,并且在一维DCT算法模块中,对于系数乘法,采用并行乘法的结构,可以进一步提高运算速度.在高精度方面,采用移位的方案,精度精确到小数点后5位,满足高精...  相似文献   

7.
离散余弦变换的改进的算术傅立叶变换算法   总被引:9,自引:2,他引:7       下载免费PDF全文
离散余弦变换(DCT)是数字图像处理等许多领域的重要数学工具.本文通过一种新的傅立叶分析技术——算术傅立叶变换(AFT)来计算DCT.本文对偶函数的AFT进行了改进.改进的AFT算法不但把AFT所需样本点数减少了一半,从而使所需加法计算量减少了一半,更重要的是它建立起AFT和DCT的直接联系,因而提供了适合用于计算DCT的AFT算法.本文推导了用改进的AFT计算DCT的算法并对算法进行了简要的分析.这种算法的乘法量仅为O(N),并且具有公式一致,结构简单,易于并行,适合VLSI设计等特点,为DCT的快速计算开辟了新的途径.  相似文献   

8.
文中提出了一种在VLIW架构DSP上计算AVS视频标准中DCT的方法。在对DCT变换矩阵进行分解的基础上,利用复数乘法实现矩阵乘法计算,并通过合理组织数据,实现了变换矩阵打包系数的复用,减少了寄存器占用,使得算法更适于进行循环展开和软件流水,从而实现更高的并行度,执行速度得到有效提升。在计算效率上,文中提出的计算方法比AVS标准中的快速算法提高了4.28倍,并且比现有方法的计算耗时减少了31.1%。  相似文献   

9.
基于DA算法的二维DCT的FPGA实现   总被引:2,自引:0,他引:2  
李莉  宁帆  魏巨升 《现代电子技术》2006,29(10):44-46,49
研究了一种采用现场可编程门阵列(FPGA)实现超高性能二维离散余弦变换(DCT)的方法。在DCT算法结构上利用了变换的可分离性和行列的可分解性采用行列分解的方法将二维DCT转换为2个串行的一维DCT实现,同时采用了基于分布算法(Distributed Arithmetic)的乘法累加结构,从而极大地减少了硬件资源需求,提高了运算速度,使图像处理的实时性得到了大幅提高。最后还给出了FPGA的实现和仿真结果。  相似文献   

10.
刘昊  吴君钦 《电视技术》2013,37(7):33-35,153
在分析"类整数DCT"变换基生成规则及其优越综合性能的基础上,设计了一种基于硬件流水线的"类整数DCT"变换快速并行算法的硬件结构,用加法和移位操作实现整数乘法。该设计结构简单、运算速度高、易于与微处理器系统接口,类整数DCT变换及其快速硬件流水算法的获得,为进一步降低视频编解码器的复杂度,提供了一个有价值的参考方案。  相似文献   

11.
该文基于Clenshaw递归公式以及离散余弦自身的对称性提出任意长离散余弦变换(DCT)的一种并行递归快速算法,给出了该算法的滤波器实现结构;与现有的其它递归算法以及基于算术傅里叶变换的余弦变换算法进行了计算复杂度的比较分析,结果表明该文算法运算量大大减少。该递归计算的滤波器结构使算法非常适合大规模集成电路(VLSI)实现。  相似文献   

12.
研究了压缩域运动补偿的快速算法,着重从数学表达方式上研究了当进行宏块预测时,充分利用参考帧中公共块的计算方法,与DCT矩阵分解的快速算法相比,在不影响图像质量的同时。其计算效率提高了26.5%。  相似文献   

13.
The authors present an efficient algorithm for the computation of the 4×4 discrete cosine transform (DCT). The algorithm is based on the decomposition of the 4×4 DCT into four 4-point 1-D DCTs. Thus, only 1-D transformations and some additions are required. It is shown that the proposed algorithm requires only 16 multiplications, which is half the number needed for the conventional row-column method. Since the 2m×2m DCT can be computed using the 4×4 DCT recursively for any m, the proposed algorithm leads to a fast algorithm for the computation of the 2-D DCT  相似文献   

14.
本文介绍了二维离散余弦变换(DCT)的一种新的快速算法。对于NN DCT(N=2m),只需用N个一维DCT和若干加法运算。与常规的行-列法相比,所需的乘法运算量减少了一半,也比其它的快速算法的乘法运算量要少,而加法运算量基本上是相同的。  相似文献   

15.
一种简便快速的DCT算法及其硬件实现   总被引:1,自引:1,他引:1  
传统的DCT算法是直接采用DCT的定义进行变换,由于大量采用浮点运算,运算量大且精度差。针对DCT运算的复杂性,介绍了一种离散余弦变换(DCT)的快速算法,他采用基于尺度提升结构的矩阵分解法,将原先复杂的浮点运算转变为精度更高的整数运算,同时又将复杂的乘法计算分解为简单的移位和加法计算。因此在近乎无损地表示信息的同时,大幅度的降低了运算量。该方法非常适合于应用在实时性要求严格的场合,如视频压缩和目标跟踪,以及硬件的实时实现。最后用Verilog HDL语言给出了采用此算法的DCT核心计算模块的程序。  相似文献   

16.
An algorithm to decompose the prime-factor DCT into skew-circular/circular correlation (SCC/CC) by coset decomposition is proposed. The simplest case is when the two factors are odd and relatively prime. In this case, the DCT output components are split into six subgroups. Each subgroup contains three short-length CC or SCC matrix-vector products, and the three products can further be merged into only one short-length SCC or CC matrix-vector product. The six subgroups are independent, thus parallel computing is feasible. By fast computation of the short-length SCC and CC, this algorithm reaches the same or less number of multiplications compared to other efficient prime-factor algorithms  相似文献   

17.
Mixed-radix discrete cosine transform   总被引:1,自引:0,他引:1  
Presents two new fast discrete cosine transform computation algorithms: a radix-3 and a radix-6 algorithm. These two new algorithms are superior to the conventional radix-3 algorithm as they (i) require less computational complexity in terms of the number of multiplications per point, (ii) provide a wider choice of the sequence length for which the DCT can be realized and, (iii) support the prime factor-decomposed computation algorithm to realize the 2m3n-point DCT. Furthermore, a mixed-radix algorithm is also proposed such that an optimal performance can be achieved by applying the proposed radix-3 and radix-6 and the well-developed radix-2 decomposition techniques in a proper sequence  相似文献   

18.
Hsu  C.-X. Wu  J.-L. 《Electronics letters》1988,24(6):315-316
An efficient algorithm is proposed which computes the coefficients of the higher order discrete Hartley transform (DHT) directly from the coefficients of lower-order DHTs. With this new development, the two-stage Walsh-Hadamard transform/discrete Hartley transform (WHT/DHT) is comparable to the existing fast algorithms. The same approach can also be used for the computation of DCT coefficients  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号