首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于结构网格的大规模并行计算研究   总被引:1,自引:0,他引:1  
通过求解RANS方程和Menter's k-Omega SST两方程湍流模型,以及采用多重网格加速收敛技术、基于多块结构网格的通用数据传输方法和区域分解负载平衡技术,实现CFD软件的并行计算。在国家超算长沙中心的"天河"系统上完成了软件的移植、测试,并实现翼身组合体外形的2048处理器核数、网格规模上亿单元的大规模并行计算,并行效率达到48%,较大幅度地缩短了计算周期,提高了工作效率。通过对DLR-F6的模拟,在气动力系数精确求解、超大规模网格模拟的快速收敛和网格收敛性研究等方面取得了初步结果,为下一步大规模工程实际应用打下了坚实基础。  相似文献   

2.
大规模并行计算机系统并行性能模拟技术研究   总被引:2,自引:0,他引:2  
性能模拟技术是计算机系统性能评价的重要手段.介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状.对几个代表性的并行模拟器系统进行了详细介绍.结合并行计算机系统和应用的发展趋势,讨论了未来并行模拟器设计、实现面临的问题和可能的解决方案.  相似文献   

3.
并行文件系统是提高大规模并行计算机I/O速度的有效途径之一,但构造一个并行文件系统往往是件复杂的工作。文中对并行文件的概念、结构作了深入的探讨,提出了在传统文件系统基础上构造并行文件系统的简单而有效的方法,并介绍了YLT并行文件系统的实现策略,最后在理论上对YLT的性能作出了评估。  相似文献   

4.
曙光1000大规模并行计算机系统软件的设计   总被引:3,自引:1,他引:3  
孙凝晖  刘宏 《计算机学报》1997,20(3):259-268
曙光1000是基于消息的大规模并行计算机系统。本文介绍曙光1000系统软件的设计目标,重要的微核心,用户空间服务。客户/服务模型和标准用户界面的设计思想,实现技术路线,以及组织结构,并详细阐述了系统诊断与监控,系统管理,并行程序开发环境与工具和调试器的设计。  相似文献   

5.
大规模的信息在进行检索的过程中一直都会面临检索速度上的限制问题,本文在基本的检索原理基础之上,实现了一种快速进行大规模分布式并行信息检索技术,该技术具有检索速度快、效率高、易于扩展等优点,具有较好的应用前景,希望能够为信息检索技术开发工作提供一些参考意见。  相似文献   

6.
本文介绍了由Transputer构成的大规模并行计算机系统,和实现其互连网络结构动态重构的方法。  相似文献   

7.
8.
9.
大规模并行计算机的作业调度直接关系到其计算能力的发挥,因而相应的研究具有十分重要的意义。论文通过对国外现有作业调度评价体系的研究,建立了更能反映并行作业特点的作业调度策略评价体系,在此基础上设计并实现了一个作业模拟调度环境。模拟调度环境采用事件驱动的工作模式,支持FCFS、大作业优先、小作业优先、长作业优先、短作业优先、GANG等调度策略。模拟测试结果表明,GANG调度策略优于所有测试的空间共享调度策略;同时在空间共享调度策略中,短作业优先策略和大作业优先策略具有较好的性能。  相似文献   

10.
大规模并行网络模拟系统   总被引:1,自引:0,他引:1       下载免费PDF全文
王蕾  方滨兴 《计算机工程》2007,33(3):133-135
为了提高并行网络模拟的真实性、可用性以及运行效率,该文设计并实现了并行分布式互联网模拟使用系统,它可以用网络测量工具获得真实网络数据作为模拟基础,采用优化的拓扑网络划分方法对模拟任务进行划分,采用基于边界路由器的子网间路由配置实现准确的路由模拟,运行脚本的自动生成以及模拟拓扑图的可视化。通过该并行网络模拟使用系统可以实现大规模网络安全事件的模拟,如蠕虫扩散、DDoS攻击等。  相似文献   

11.
We examine two schemes for parametric parallel simulation on SIMD supercomputers. In SIMD machines, the parallel processors execute a common instruction stream using local data-under the control of a front-end processor. In contrast to most parallel simulation approaches-which simulate a single system using multiple processors-we simulate distinct parametric variants at each processor. We extract some of the common computation embedded in these simulations and perform it on the front-end, leaving the rest to the parallel processors.The first simulation approach, which we call time synchronous, is essentially Vakili's standard clock. This approach generates a uniformized event process on the front-end processor which is thinned at each back-end processor based on local state information. The second scheme, which we call event synchronous, generates a standard Poisson process on the front-end, which is time-scaled and marked on the back-end processors.We develop a framawork for comparing these methods based on their simulated event rate (number of simulated events per real time unit). We show that the time synchronous method can be tuned to optimize the event rate for a given family of systems and we solve this optimal standard clock problem for several test cases. Finally we describe implementation issues peculiar to the SIMD architecture. Our focus is primarily on the M/M/1/K queue, but the methods extend to more general Jackson networks.  相似文献   

12.
大规模并行计算机电源系统稳定性分析   总被引:1,自引:0,他引:1       下载免费PDF全文
大规模并行计算机电源系统通常都采用分布式供电架构,系统稳定性设计是其中的难点和关键点。本文提出了一种实用的输入输出阻抗匹配方法,详细分析了变换器的输入和输出阻抗,绘制了阻抗特性波特图,根据仿真结果确定了总线上的输出电容。电源系统测试和运行结果表明,在总线上放置合适的电容可以解决系统稳定性问题。  相似文献   

13.
针对民机增升构型失速特性的数值模拟,我们基于贪婪负载平衡算法的剖分工具对多块结构网格进行区域分割,在某新型超级计算机系统上完成求解软件的移植、优化和测试,采用 2 亿量级的计算网格开展大规模并行计算研究,测试完成了万核级负载平衡的网格区域分割,实现了增升构型失速特性的 4 096 核数并行计算,并行效率达到 50% 以上,提高了工程应用中对复杂流动现象的数值模拟能力。数值模拟结果加深了对增升构型失速流动机理的理解,可以为增升装置设计优化提供有意义的参考依据。  相似文献   

14.
时间序列大数据记录着复杂系统在时间和空间上大尺度的演化过程,详细描述了系统不同部分之间的相互作用和相互联系.提取时间序列大数据中潜在的低维因子对研究复杂系统的整体机制有着至关重要的作用.大数据的超高维和大尺度导致许多传统因子分析方法难以适应,先验知识缺乏更增加了研究难度.针对这一巨大挑战,提出了一种面向时间序列大数据的海量并行贝叶斯因子化分析方法(the massively parallel Bayesian factorization approach, G-BF).在缺失先验知识的情况下,通过贝叶斯算法导出因子矩阵,将算法映射至CUDA(compute unified device architecture)模型,以大规模并行的方式更新因子矩阵.该方法支持对任意维度张量的因子分解.实验结果表明:1)与通过GPU加速化的因子分解算法G-HALS(GPU-hierarchical alternative least square)相比,G-BF具有更好的运行性能,且随着数据规模的增加,其性能优越性更加明显;2)G-BF在数据处理规模、秩及维度方面都具有良好的可扩展性;3)将G-BF应用于现有子因子融合框架(hierarchical-parallel factor analysis, H-PARAFAC),可将“巨型”张量作为一个整体进行因子化分解(在2个节点上处理10\\+{11}个数据元素),其能力较常规方法高出2个数量级.  相似文献   

15.
In this paper, we describe a massively parallel implementation of the Splitting Equilibration Algorithm using CM FORTRAN on the Thinking Machines CM-2 system. Numerical results using upwards of 32 768 (32 K) processors on the CM-2 system, the Connection Machine, are presented for both input/output and social accounting matrix estimation problems and compared with those obtained for the same problems on the IBM 3090. Our experiences with the relative ease/difficulty of the implementations on these fine-grain and coarse-grain parallel architectures are also presented and discussed.  相似文献   

16.
本文采用MPI消息传递模式自主开发出适用于高超声速流动数值模拟的并行计算软件,该软件以三维Navier-Stokes方程为基本控制方程来求解层流问题,应用基于结构网格的有限体积法对计算域进行离散,采用AUSMPW+格式求解对流通量,利用MUSCL插值方法获得高阶精度,时间格式上采用LU-SGS方法进行时间迭代以加快求解定常流动的收敛过程。在高性能计算机上针对不同高超声速流动进行大规模并行计算的结果表明,所开发的CFD并行计算软件具有较高的并行计算效率,为高超声速飞行器气动力/热的准确预测提供了高效工具。  相似文献   

17.
采用计算流体力学方法,对高超声速流场进行了多区并行计算研究。基于MPI消息传递库采用Fortran语言编制了CFD并行计算程序,对NS方程采用AUSMPW+格式和LU-SGS方法求解。针对流场采用多区剖分,将每一个子区分配给相应节点进行计算。每一迭代步,相邻子区域间交换边界数据。计算表明,本文所建立的程序和方法是可行的,能够进一步延伸到大规模并行计算和工程应用中。  相似文献   

18.
迟利华  刘杰 《计算机工程》2010,36(21):25-27
在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该方法在 4核Xeon处理器构成的分布共享集群系统上可扩展到1 024个CPU核,相对于64个CPU核,其加速比为7.06。  相似文献   

19.
计算划分问题是并行编译中最为重要的问题之一.针对并行循环,在数据分布确定的情况下,提出了基于规范集的计算划分算法,具体讨论了规范集的获取方法及综合通信与负载均衡的最优方案选取算法.实验表明,在并行循环处理方面,这一算法与以前几种算法相比更加简单、有效;采用这一算法的p_HPF编译器对数据并行应用问题可以获得良好的加速比和效率.该编译器已在石油领域得到应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号