共查询到16条相似文献,搜索用时 593 毫秒
1.
2.
并行计算为时域有限差分(FDTD)方法仿真电大尺寸和复杂结构提供了强大的计算能力和内存资源。文章针对多核PC集群系统,提出了一种高性能并行FDTD算法,它采用Windows Socket(WinSock)实现高效的进程间通信,同时采用多线程技术充分利用多核处理器资源。在集群系统上的实际测试表明:以10个处理器(30个核)为例,该算法获得的加速比为16.0,并行效率为53.3%,优于单独使用消息传递接口(MPI)以及MPI结合OpenMP的传统FDTD并行算法,后两者在相同测试条件下仅分别获得13.7,12.2的加速比和45.8%,40.7%的并行效率。 相似文献
3.
目前,时域有限差分方法(Finite Difference Time Domain,FDTD)在电磁数值计算中已获得了广泛应用。对许多复杂电磁问题,FDTD 算法需要耗费巨大的计算机计算时间和存储空间,这成为FDTD 方法亟待解决的难题。本文提出了应用基于消息传递(Message Passing)方式实现FDTD 的并行算法。并对基于MPI 不同通信方式的并行FDTD 进行了效
率比较。采用MPI2.0 单边通信方式中的put 操作和主动对象同步(PSCW)方式,在一套16 个节点的Beowulf 型网络并行计算机系统上,实现了三维FDTD 并行程序,获得了较高的加速比和并行效率。 相似文献
4.
5.
6.
7.
提出了在由微机互连构成的机群(COW)并行计算系统上应用基于消息传递(M essage Passing)的方式实现二维FDTD并行算法。通过区域分割,各个子区域在边界处与其相邻的子区域进行场值的数据传递,从而实现FDTD并行计算。文中还仔细分析了与FDTD相关的外围边界的并行化处理。文中以二维金属方柱算例验证了算法的正确性和有效性,并将本文实现的加速比以及并行效率与其它文献进行了比较,从而为运用FDTD方法进行电大尺寸复杂电磁问题数值模拟计算提供了一条有效途径。 相似文献
8.
遥感图像PCA融合的并行算法研究与实现 总被引:2,自引:0,他引:2
文章针对已有的遥感图像PCA融合串行算法,提出了一种基于数据并行的新的PCA融合并行算法PPCA.并对该并行算法进行了通信优化,在机群系统上进行了实现。针对IKONOS图像进行实验的结果表明该算法可获得良好的并行加速比.并行效率较高,为遥感图像的实际应用提供了有益的指导和借鉴。 相似文献
9.
基于OpenMP的电磁场FDTD并行程序性能分析 总被引:1,自引:0,他引:1
OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其并行程序执行效率的几个因素。结果表明,采取不同的并行方式,设定不同的调度策略,设置并行区线程数的大小均会影响并行程序的性能。因此,在使用OpenMP编写电磁场并行程序时,需要综合考虑各种因素的影响才能设计出高效的程序。 相似文献
10.
11.
12.
利用基于图形处理器(Graphics Processing Unit, GPU)的并行时域有限差分(Finite Difference Time Domain, FDTD)法计算一维粗糙海面及其上方二维漂浮目标的复合电磁散射.采用各向异性完全匹配层(Uniaxial Perfectly Matched Layer, UPML)吸收边界作为截断边界, 为了便于并行程序的设计, 在整个计算区域使用UPML吸收边界差分公式进行迭代.利用异步通信技术来隐藏主机和设备之间的通信时间, 同时使用片上的共享存储器提高读取速度, 进一步对程序进行优化, 得到很好的加速比, 证明了该方法的计算高效性.通过与串行FDTD法以及串行矩量法获得的数值结果进行比较, 验证了该并行方法的正确性, 进而研究了海面上方类似舰船漂浮目标的电磁散射特性, 讨论了入射角、海面风速以及目标吃水深度对双站散射系数的影响. 相似文献
13.
利用显卡(Graphics Processing Unit, GPU)加速时域有限差分(Finite-Difference Time Domain, FDTD)法计算二维粗糙面的双站散射系数, 介绍了FDTD的理论公式以及计算模型.采用各向异性完全匹配层(Uniaxial Perfectly Matched Layer, UPML)截断FDTD计算区域.重点讨论了基于GPU的并行FDTD计算粗糙面双站散射系数的并行设计方案计算流程.在NVIDIA GeForce GTX 570显卡上获得了50.7×的加速比.结果表明:通过对FDTD计算粗糙面散射问题的加速, 极大地提高了计算效率. 相似文献
14.
This paper introduces a novel parallel shift operator finite‐difference time‐domain (SO‐FDTD) method for plasma in the dispersive media. We calculate the interaction between the electromagnetic wave of various frequencies and non‐magnetized plasma by using the parallel SO‐FDTD method. Then, we compare the results, which are calculated with serial and parallel SO‐FDTD executions to obtain the speedup ratio and validate the parallel execution. We conclude that the parallel SO method has almost the same precision as the serial SO method, while the parallel approach expands the scope of memory and reduces the CPU time. 相似文献
15.
为了加快颗粒全息图的重建速度,提出了一种基于多线程编译框架(OpenMP)和统一计算设备架构(CUDA)并行技术的二级并行架构颗粒全息图快速重建方法。第1级并行针对重建截面,第2级并行针对像素,同时在这两个维度进行并行重建,利用OpenMP实现图片级并行,利用CUDA实现像素级并行。以煤粉颗粒全息图为测试对象,同时采用单线程重建程序和二级并行重建程序进行全息重建,比较了两种计算方式的重建结果和计算耗时。结果表明,二级并行重建结果与单线程重建结果是一致的,且可大大缩短重建耗时; 对于分辨率为5000×5000的全息图,在重建截面数为40时,可实现48.3倍的加速比。此计算架构在数字全息的颗粒场实时在线诊断中具有很好的应用前景。 相似文献