共查询到20条相似文献,搜索用时 265 毫秒
1.
为实现电磁计算的安全可靠和自主可控,该文基于“天河二号”国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方程离散生成的矩阵具有对角占优特性,提出一种新型LU分解算法,即对角块矩阵选主元LU分解(BDPLU)算法,该算法减少了panel列分解的计算量,更重要的是,完全消除了选主元过程的MPI通信开销。利用BDPLU算法,并行矩量法突破了6×105 CPU核并行规模,这是目前在国产超级计算平台上实现的最大规模的并行矩量法计算,其矩阵求解并行效率可达51.95%。数值结果表明,并行矩量法可准确高效地在国产超级计算平台上解决大规模电磁问题。 相似文献
2.
3.
4.
以多核数字信号处理器(Digital Signal Processor, DSP)作为计算节点的多核DSP集群系统成为一大发展趋势。当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟。基于C66x内核丰富的指令集架构以及运算指令编排原则,结合编译器提供的汇编信息,设计并优化了QR分解算法,在充分挖掘DSP单核性能极致的同时减少了矩阵分解的计算时间。根据掌握的优化技术,设计并实现基于多核DSP集群系统的大规模并行QR分解模型,并在分布式计算框架上完成了分解任务。分析结果表明,优化后的QR分解计算效率以及C66x单核硬件资源使用率均提升了二十余倍,随着待分解矩阵规模的成倍增加,多核DSP集群相比于单核的计算性能提升也愈加明显。 相似文献
5.
6.
PC集群MPI并行矩量法分析复杂平台多天线特性 总被引:4,自引:0,他引:4
为分析安装于诸如飞机、舰艇等复杂目标上多天线的电磁兼容性,本文引入了Costa基函数对多天线线面连接结构进行建模.针对计算量过大、耗时太长这一主要障碍,结合RWG基函数特点,设计了一种高效的适用于共轭梯度方法求解的棋盘状并行矩阵填充算法,避免了RWG基相互作用的重复计算,然后详细地讨论了并行共轭梯度算法求解矩量法矩阵方程的并行实现过程.本文进一步开发并在PC集群中实测了MPI并行矩量法程序性能,作为应用计算了安装于某飞机头部的多天线辐射特性. 相似文献
7.
集群系统中基于MPI的并行GMRES(m)计算通信的研究及应用 总被引:1,自引:1,他引:0
针对求解大型稠密线性方程组的GMRES(m)算法的内在并行性,应用可移植消息传递标准MPI的集群通信机制在分布式存储并行系统上,设计了一种粗粒度、低通信开销的并行算法,并且应用于边界元求解的大型弹性问题的计算中.通过与串行算法进行比较,设计的并行算法具有较高的计算精度和计算效率. 相似文献
8.
《电子技术与软件工程》2016,(3)
并行渲染技术是构建大规模三维虚拟场景的有效途径。本文从时间序列的并行渲染技术入手,提出了新的集群控制渲染算法,并在此基础上构建了一个时序集群渲染系统。实验结果表明,该并行渲染系统相对于单机系统具有较高的加速比,针对大规模复杂三维场景的渲染,该系统的渲染速度提升明显。 相似文献
9.
针对国产超级计算机平台上大规模电磁仿真软件相对匮乏,本文将并行高阶矩量法程序移植到国产超级计算机平台上,并以机载线天线阵列的辐射特性计算为例对其并行性能进行了测试和评估。实现了并行高阶矩量法单一任务突破10 万CPU 核规模,这是目前在国产超级计算机平台上实现的最大规模并行矩量法计算。以1440 核为基准,使用CPU 核数达到102400,并行规模扩大约70 倍时,并行矩量法矩阵方程求解并行效率仍在50%以上。这一研究工作,使利用纯国产超级计算机对复杂电大电磁系统进行精确高效仿真成为可能。 相似文献
10.
以IBM BladeCenter高性能集群系统性能测试为背景,研究大规模集群的性能测试与优化方法.通过对基于区域分解大规模线性方程组中并行求解算法在4个测试方案下的测试和分析,得到了其加速性能随计算节点数的变化曲线.结果表明,该高性能计算机集群具有很好的加速性能、稳定性,达到了预期的测试目标,为基于该并行平台的进一步并行开发研究奠定了基础. 相似文献
11.
随着大数据技术的发展,GPU集群作为一种高效的并行系统被应用到大规模数据实时计算中.能量是实时计算时重要的资源,GPU集群的能耗优化及实时消减成为一个具有挑战性的问题.从集群全局角度引入模型预测控制策略,并建立闭环反馈机制的多输入多输出控制器.通过调整计算频率和改变活跃流多处理器来改变能耗状态,利用反馈和滚动优化机制完成对未来的控制预判,实现消减冗余能耗的目标.实验表明:控制模型的精度和节能效果优于基准模型,而且具有较好的稳定性,适合应用到大规模数据实时计算中. 相似文献
12.
13.
14.
常规的指挥调度或应急通信对讲通信应用,一般在同一制式或系统网络下的一个群组终端才能进行通信联络.现在越来越多地在一些大型活动或抗击各类灾害通信保障的实际应用中,为跨部门的通信.通过应急指挥车设立现场指挥调度和通信系统,但少量配置的终端,个性化的集群系统,基站的孤站使用使现场指挥网覆盖范围极为有限,同时各行各业各级系统部门所拥有指挥调度终端类型制式五花八门,使现场指挥车无法实现统一、高效、便捷的指挥通信联络.本文通过对各集群对讲系统设施的研究,形成多制式终端混合语音网关,进而实现数字集群McWill终端与数字集群TETRA终端及与普通对讲机的互通.以此谋求实现各种制式集群系统的终端互通的应用手段,提高不同场景下语音指挥调度和现场通信联系的保障能力. 相似文献
15.
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA (Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比. 相似文献
16.
基于求解校验序列的(n,1,m)卷积码盲识别 总被引:6,自引:0,他引:6
伴随信息对抗和智能通信的快速发展,信道编码识别已成为信息恢复领域一个重要的课题。针对(n,1,m)卷积码盲识别问题,该文提出一种新的识别方法,该方法首先提出了校验序列的概念,通过改进后的矩阵模型求解出校验序列,进而由校验序列构造方程求解出生成多项式矩阵,完成识别。最后,通过实例仿真验证了该方法能够在参数n和码字起始位置都未知情况下有效识别出(n,1,m)卷积码。 相似文献
17.
18.
《电子技术与软件工程》2015,(16)
本文通过对采样数据矩阵进行QR分解,将求解加权矢量问题转换为求解三角线性方程组,通过避免对自相关矩阵的估计和求逆来提高数值鲁棒性;接着提出一种改进方案:对采样数据矩阵进行SVD分解完成波束形成,此方案利用奇异值和奇异值矢量计算加权矢量,并且通过改变对较小的奇异值赋零的多少,在复杂度与性能之间进行折衷。仿真结果显示,提出的改进方案和QR分解算法的性能接近,都能正确实现波束形成。 相似文献
19.
高阶矩量法在计算电磁学中的应用越来越广泛, 为了进一步提高其计算规模, 引入并行的自适应交叉近似压缩算法(Adaptive Cross Approximation algorithm, ACA).该算法首先采用非均匀有理B样条建模(Non-Uniform Rational B-Splines, NURBS)的方法进行面片分组; 然后利用矩量法中远区阻抗矩阵的低秩特性进行ACA压缩; 最后采用稀疏近似逆预条件(Sparse Pattern Approximate Inverse preconditioning, SPAI)的共轭梯度法(Conjugate Gradient method, CG)快速求解矩阵方程.该算法中的ACA压缩过程和迭代求解过程都特别适合并行计算.数值实验表明, 对于电大尺寸问题, ACA压缩后的矩阵占用的内存远远低于原矩阵, 而预条件的共轭梯度法可以很快收敛.此外该算法在大规模并行时的效率较高. 相似文献
20.
智简语义通信是一种模型驱动的语义通信新范式,融合了人工智能与通信技术,实现通信对象间高效的语义交互。提出了智简语义通信系统的链路结构和关键技术,从链路结构、语义模型增强、模型传输3个角度,实现语义通信系统的整体性能增强。提出了4种智简语义通信的关键技术,为未来6G赋能多种垂直行业和新场景应用提供了参考:语义知识图谱增强的智简通信技术通过增加语义知识这一信息维度,提升了语义知识恢复准确度和传输效率;语义知识图谱的云-边-端协同预缓存技术可以实现语义知识图谱的高效获取,辅助语义恢复性能;模型传输与部署技术可以实现模型、网络资源与终端能力的有效适配;语义模型传输与恢复级联过程的部署成功率为大规模语义模型传输及资源部署提供理论依据。 相似文献