首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 593 毫秒
1.
针对基于MPI的传统FDTD并行算法存在的缺点,提出了优化的FDTD两级化并行算法。结合MPI和OpenMP编程模型的特点,实现了基于SMP集群系统平台的MPI-OpenMP混合编程模型的两种并行FDTD算法。在实验室搭建的SMP集群系统平台上,通过对一金属长方体的散射问题分析,把混合编程算法同基于MPI的FDTD并行算法进行了比较。结果表明,混合并行算法具有更好的加速比和带宽利用率。  相似文献   

2.
并行计算为时域有限差分(FDTD)方法仿真电大尺寸和复杂结构提供了强大的计算能力和内存资源。文章针对多核PC集群系统,提出了一种高性能并行FDTD算法,它采用Windows Socket(WinSock)实现高效的进程间通信,同时采用多线程技术充分利用多核处理器资源。在集群系统上的实际测试表明:以10个处理器(30个核)为例,该算法获得的加速比为16.0,并行效率为53.3%,优于单独使用消息传递接口(MPI)以及MPI结合OpenMP的传统FDTD并行算法,后两者在相同测试条件下仅分别获得13.7,12.2的加速比和45.8%,40.7%的并行效率。  相似文献   

3.
梁宇宏  陈星  孙凤林 《微波学报》2010,26(Z1):64-66
目前,时域有限差分方法(Finite Difference Time Domain,FDTD)在电磁数值计算中已获得了广泛应用。对许多复杂电磁问题,FDTD 算法需要耗费巨大的计算机计算时间和存储空间,这成为FDTD 方法亟待解决的难题。本文提出了应用基于消息传递(Message Passing)方式实现FDTD 的并行算法。并对基于MPI 不同通信方式的并行FDTD 进行了效 率比较。采用MPI2.0 单边通信方式中的put 操作和主动对象同步(PSCW)方式,在一套16 个节点的Beowulf 型网络并行计算机系统上,实现了三维FDTD 并行程序,获得了较高的加速比和并行效率。  相似文献   

4.
为了加速并行时域有限差分仿真,提出了基于单指令多数据流式扩展(SSE)的一种新的加速方法,在Intel T2300的PC机上实现了对并行时域有限差分仿真的加速,给出了基于消息传递接口(MPI)、OpenMP和SSE指令集的三级数据并行算法。为了验证该算法的加速效率,计算了自由空间中电磁波的辐射问题,得到的加速比为2.62。实验结果表明:这种加速技术无需任何额外的硬件投资就能在很大程度上提高计算效率。  相似文献   

5.
电各向异性介质FDTD并行算法的研究   总被引:2,自引:2,他引:0  
基于消息传递模式的网络并行计算系统和区域分割技术成功地实现了电各向异性介质FDTD并行算法,并用此程序代码计算了电大目标的RCS.经测试,该程序代码并行效率达到87%.根据电各向异性介质FDTD迭代式,电场某一节点的计算,需牵涉到其周围28个节点的电磁场值,详细分析了该情况下并行算法中的数据通讯规律,并实现了局域网内各节点机的协同并行计算.数值结果表明了该算法和程序的正确性及优越性.  相似文献   

6.
为简化并行FDTD算法实现,提出一种新的基于映射文件技术的解决方法.对于并行FDTD算法的两个关键环节:场值数组定义和子域间通信在该方法中借助操作系统的映射与重定向功能来实现,由于屏蔽了子域间显式的通信操作,将大幅度降低并行FDTD算法实现的复杂度.数值模拟实例和相关的性能比较验证了新方法的可行性与便利性,所得加速比、并行效率等性能指标参数与通常的MPI消息传递方法基本相当.  相似文献   

7.
用MPI实现FDTD网络并行电磁散射运算   总被引:2,自引:0,他引:2       下载免费PDF全文
提出了在由微机互连构成的机群(COW)并行计算系统上应用基于消息传递(M essage Passing)的方式实现二维FDTD并行算法。通过区域分割,各个子区域在边界处与其相邻的子区域进行场值的数据传递,从而实现FDTD并行计算。文中还仔细分析了与FDTD相关的外围边界的并行化处理。文中以二维金属方柱算例验证了算法的正确性和有效性,并将本文实现的加速比以及并行效率与其它文献进行了比较,从而为运用FDTD方法进行电大尺寸复杂电磁问题数值模拟计算提供了一条有效途径。  相似文献   

8.
遥感图像PCA融合的并行算法研究与实现   总被引:2,自引:0,他引:2  
文章针对已有的遥感图像PCA融合串行算法,提出了一种基于数据并行的新的PCA融合并行算法PPCA.并对该并行算法进行了通信优化,在机群系统上进行了实现。针对IKONOS图像进行实验的结果表明该算法可获得良好的并行加速比.并行效率较高,为遥感图像的实际应用提供了有益的指导和借鉴。  相似文献   

9.
基于OpenMP的电磁场FDTD并行程序性能分析   总被引:1,自引:0,他引:1  
OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其并行程序执行效率的几个因素。结果表明,采取不同的并行方式,设定不同的调度策略,设置并行区线程数的大小均会影响并行程序的性能。因此,在使用OpenMP编写电磁场并行程序时,需要综合考虑各种因素的影响才能设计出高效的程序。  相似文献   

10.
FDTD并行算法实现及其数据通信优化   总被引:1,自引:0,他引:1  
应用计算机局域网,采用基于消息传递(MPI)方式和区域分割技术,实现了FDTD的并行计算。以无限长线电流源在自由空间辐射为算例,对并行FDTD算法进行了验证。结果表明并行算法和串行算法计算结果一致,并有效提高了计算效率。最后通过减少通信数据量、优化数据交换方式及通信和计算重叠的方法,使并行算法的数据通信得到优化,并行计算效率明显提高。  相似文献   

11.
针对人工蜂群算法在处理高维度问题时收敛速度慢的问题,利用OpenMP多线程技术和规约机制,并根据已改进的观察蜂来选择雇佣蜂的方式,提出了基于OpenMP的并行人工蜂群算法(PCABC)。仿真实验分别在问题维度为100和200下进行来评估算法性能,在4个逻辑处理器环境下,基于静态调度的并行人工蜂群算法的加速比最高可以达到3.95,效率可达98.65%。实验结果表明,PCABC并行人工蜂群算法在处理高维度复杂函数时,收敛速度和算法运行时间都有较大的提升。  相似文献   

12.
利用基于图形处理器(Graphics Processing Unit, GPU)的并行时域有限差分(Finite Difference Time Domain, FDTD)法计算一维粗糙海面及其上方二维漂浮目标的复合电磁散射.采用各向异性完全匹配层(Uniaxial Perfectly Matched Layer, UPML)吸收边界作为截断边界, 为了便于并行程序的设计, 在整个计算区域使用UPML吸收边界差分公式进行迭代.利用异步通信技术来隐藏主机和设备之间的通信时间, 同时使用片上的共享存储器提高读取速度, 进一步对程序进行优化, 得到很好的加速比, 证明了该方法的计算高效性.通过与串行FDTD法以及串行矩量法获得的数值结果进行比较, 验证了该并行方法的正确性, 进而研究了海面上方类似舰船漂浮目标的电磁散射特性, 讨论了入射角、海面风速以及目标吃水深度对双站散射系数的影响.  相似文献   

13.
利用显卡(Graphics Processing Unit, GPU)加速时域有限差分(Finite-Difference Time Domain, FDTD)法计算二维粗糙面的双站散射系数, 介绍了FDTD的理论公式以及计算模型.采用各向异性完全匹配层(Uniaxial Perfectly Matched Layer, UPML)截断FDTD计算区域.重点讨论了基于GPU的并行FDTD计算粗糙面双站散射系数的并行设计方案计算流程.在NVIDIA GeForce GTX 570显卡上获得了50.7×的加速比.结果表明:通过对FDTD计算粗糙面散射问题的加速, 极大地提高了计算效率.  相似文献   

14.
This paper introduces a novel parallel shift operator finite‐difference time‐domain (SO‐FDTD) method for plasma in the dispersive media. We calculate the interaction between the electromagnetic wave of various frequencies and non‐magnetized plasma by using the parallel SO‐FDTD method. Then, we compare the results, which are calculated with serial and parallel SO‐FDTD executions to obtain the speedup ratio and validate the parallel execution. We conclude that the parallel SO method has almost the same precision as the serial SO method, while the parallel approach expands the scope of memory and reduces the CPU time.  相似文献   

15.
为了加快颗粒全息图的重建速度,提出了一种基于多线程编译框架(OpenMP)和统一计算设备架构(CUDA)并行技术的二级并行架构颗粒全息图快速重建方法。第1级并行针对重建截面,第2级并行针对像素,同时在这两个维度进行并行重建,利用OpenMP实现图片级并行,利用CUDA实现像素级并行。以煤粉颗粒全息图为测试对象,同时采用单线程重建程序和二级并行重建程序进行全息重建,比较了两种计算方式的重建结果和计算耗时。结果表明,二级并行重建结果与单线程重建结果是一致的,且可大大缩短重建耗时; 对于分辨率为5000×5000的全息图,在重建截面数为40时,可实现48.3倍的加速比。此计算架构在数字全息的颗粒场实时在线诊断中具有很好的应用前景。  相似文献   

16.
基于SMP机群的层次化并行编程技术的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
祝永志  张丹丹  曹宝香  禹继国 《电子学报》2012,40(11):2206-2210
 针对多核SMP机群的体系结构特点,讨论了MPI+OpenMP混合并行程序设计技术.提出了一种多层次化混合设计新方法.设计了N-body问题的多层次化并行算法,并在曙光5000A机群上与传统的混合算法作了性能方面的比较.结果表明,该层次化混合并行算法具有更好的扩展性和加速比.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号