共查询到16条相似文献,搜索用时 109 毫秒
1.
Cholesky分解是一种矩阵运算方法。相比传统的矩阵求逆算法,它能够大大简化矩阵求逆的运算量,提高实时性。因此,介绍Cholesky分解原理及方法,并根据这一特性,在FPGA中实现基于Cholesky分解的快速矩阵求逆算法。FPGA具有流水线设计的特点,能够进一步提高接收抗干扰处理的实时性。用Matlab对FPGA实现的各种矩阵规模数据进行仿真,根据仿真结果和FPGA实际资源选取最优的FPGA实现方案。 相似文献
2.
矩阵运算广泛应用于实时性要求的各类电路中,其中矩阵求逆运算最难以实现。基于现场可编程门阵列(FPGA)实现矩阵求逆能够充分发挥硬件的速度与并行性优势,加速求逆运算过程。基于改进的脉动阵列的计算架构,采用一种约化因子求逆的优化算法,将任意一个n×n阶上三角矩阵转换成对角线为1的上三角矩阵,使得除法运算与乘加运算分离开来,大大简化矩阵求逆运算过程。以一个4×4阶上三角矩阵求逆为例,在Xilinx ISE平台下,采用Virtex5 FPGA完成算法实现与功能验证,在14个周期内,使用了2个除法器,3个乘法器与4个加法器实现整个矩阵求逆运算。相比于经典的脉动阵列架构,仅占用近一半资源的同时,性能提升了26.43%;相比于集成更多处理单元(PE)的脉动阵列实现方式,在性能近乎不变的情况下,耗费的资源缩减到1/4,大幅度提升了资源利用率。 相似文献
3.
设计的双精度浮点矩阵运算处理器,主要用于满足导航接收机中RTK与Kalman滤波带来的大量、快速矩阵运算需求,也可用于其他适于高精度运算的图像处理等领域。该协处理器支持3~128维矩阵乘法、矩阵分解与矩阵求逆运算,其中矩阵乘法支持AB、ABA^(τ)、A^(τ)BA等运算;矩阵分解支持正定矩阵的LDL分解;矩阵求逆支持基于LDL^(τ)分解的矩阵求逆运算与基于初等变换的矩阵求逆运算。 相似文献
4.
5.
矩阵求逆是工程计算中的基本问题,在大规模MIMO系统、阵列信号处理以及图像信号处理等应用中,大规模矩阵求逆的处理速度对系统性能至关重要,但传统矩阵求逆方法运算复杂度高、并行性低且消耗大量存储空间,不利于硬件加速。针对大规模矩阵求逆硬件加速问题,文中研究了基于LDL分解的矩阵求逆算法,并提出了一种基于该算法的大规模矩阵求逆加速架构。利用LDL分解后三角矩阵对角线元素全为1的特点,对矩阵进行分块迭代设计,减少了求逆运算的计算量,提高了计算速度。文中基于Xilinx Virtex7 FPGA设计实现了该加速器,实验结果表明,在128阶矩阵下,吞吐量达105.2 Inv·s-1,最高时钟频率达200 MHz。与现有矩阵求逆加速方案相比,该设计占用的硬件资源更少,且具有更高的性能。 相似文献
6.
矩阵求逆广泛应用于数字通信领域,利用现场可编程门阵列(FPGA)实现能充分发挥硬件的速度优势,实现高速通信。目前,已有文献对上下三角矩阵求逆的硬件算法进行阐述,而对任意满秩矩阵求逆的硬件算法尚未深入的研究。提出了基于下上三角矩阵分解(LU分解)对任意满秩矩阵求逆的理论算法及超高速集成电路硬件描述语言(VHDL)硬件描述,并分别用软件仿真和硬件仿真进行验证。通过对比,硬件设计仿真的结果与预期结果吻合。 相似文献
7.
8.
9.
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA (Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比. 相似文献
10.
11.
12.
JiangSen SunHong LiPing 《电子科学学刊(英文版)》2005,22(2):118-124
A Jointly Gaussian (JG) equalizer is derived for turbo equalization based on an augmented real matrix representation of channel model and a Gaussian approximation of the received symbol sequence. Using matrix inversion lemma and Cholesky decomposition, a lowcomplexity implementation of JG equalizer is also presented. The simulation results and complexity comparison confirm that turbo equalization with JG equalizer has a better performance and a lower complexity than the existing turbo equalization with linear minimum mean squared error equalizer. 相似文献
13.
论文先对R矩阵采用一种新颖的Cholesky分解方法,再根据定点DSP的特点对其递归公式进行相应的改进,然后与传统的Cholesky分解方法相比较。仿真表明,改进的Cholesky分解方法具有良好的数据精度和可行性。 相似文献
14.
该文针对粒子滤波计算量大,难以在工程中应用的问题,用拟蒙特卡罗采样(QMC)代替蒙特卡罗采样(MC),减少了运算量。分析并给出了拟蒙特卡罗-高斯粒子滤波(QMC-GPF)算法的并行结构。在该并行结构的基础上,研究了基于FPGA的QMC-GPF的设计与实现。在实现过程中选取2作基数来产生Faure序列,将乘法运算、求模运算简化为便于在FPGA中实现的按位异或运算;采用查找表实现指数函数等复杂函数的计算,充分利用了FPGA中大量的Block RAM资源;给出了Cholesky分解矩阵各元素的并行计算结构。以红外图像弱小目标跟踪实验为例,验证了本设计的有效性和实时性。 相似文献
15.
16.
A simple proof of the Gohberg-Semencul decomposition of the inverse of the correlation matrix of an autoregressive (AR) process is given. The proof is based on the Cholesky decomposition and the centrosymmetric property of symmetric Toeplitz matrices. The Gohberg-Semencul relation is derived in a simple way by doubling the size, but not the order, of the AR process 相似文献