首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
大气环流模式是中科院地球系统模式中最为复杂的模式,在当前主流的众核异构平台上开展大气环流模式的众核并行化是高性能计算的热点研究问题。针对AGCM4.0热点程序动力框架的适应过程Tend_lin,利用神威OpenACC编程模型在"神威·太湖之光"高性能计算平台上实现并行化,并从循环分布、循环分块、数据传输的表达、函数调用的从核化等方面提升应用性能。详细讨论了不同场景下的数据传输表达,对比测试了不同分块尺寸对程序性能的影响。相比主核串行,两种测试规模下,Tend_lin应用的单核组多线程并行均获得6倍以上的加速;且随着应用分辨率的扩大,众核处理器的性能得到更好发挥,在C规模下,多进程获得了69倍的全应用加速。  相似文献   

2.
摘要:
针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中:通用处理器核用于执行常规程序;数据驱动模块用于检测数据的完备性;片内路由器则可提供处理器核之间及簇之间的通信.实验结果表明,所设计的多核处理器能够支持C语言“函数式语言”风格的编程模板.每个C代码段执行纯函数的操作,消除了函数间的共享变量,使得并行编程的复杂度有所降低.同时,所采用的数据驱动机制没有执行顺序的严格限制,充分挖掘了算法潜在的并行性.经测试,数据驱动多核处理器的加速比随着计算资源的增加而增大,从而验证了数据流计算机的加速倍数随处理器数目增加而线性增长的结论.
关键词:
数据驱动; 并行编程模型; 数据流机; 多核处理器
中图分类号: TP 338
文献标志码: A  相似文献   

3.
众核芯片系统存在吞吐量低、加速比不能与其片内处理核数的增长成线性比例等问题,无法发挥出相应的计算能力,目前的众核微体系结构并不匹配MapReduce运行时. 针对上述问题,为实现高性能众核芯片系统巨大计算和处理能力目标,文中分析了众核MapReduce的执行模型,基于DOT模型构建了众核存储体系,对其中的片上网络、通信模式、访存流程及基于此的MapReduce存储模式进行了设计. 实验数据表明,和Tile结构相比,基于该三维存储体系的众核系统的吞吐量能提高1.2倍,加速比和片内处理核数接近线性关系.   相似文献   

4.
随着多核处理器片上集成核数的不断增多,并行任务的调度能力越来越成为制约性能提升的关键因素。文章设计一种面向异构多核计算系统的动态任务调度控制器,主要实现动态监控处理单元的负载情况、动态任务唤醒、乱序任务发射、任务写回安全管理等功能;研究一种降低计算任务结果数据回写双倍数据速率(double data rate, DDR)外存储器次数的方法,大幅节省了访存开销,进一步提升了计算性能。仿真及性能测试显示,在典型应用场景下,与已有的无动态调度功能的任务发射控制器相比,实现了显示并行化编程向任务并行的自动化控制过渡,编程友好度显著提高,在不同类型的测试案例中,分别提升了11.3%~37.9%的计算性能。  相似文献   

5.
传统词袋模型已广泛地应用于图像处理领域,并取得较好效果.但在传统词袋模型中,仅考虑了串行计算,使得整个算法流程耗时较长.考虑现有的多核CPU资源,结合共享存储并行编程(OpenMP)并行框架,对词袋模型进行并行优化,并对其性能进行讨论.主要考虑对特征提取、特征聚类和图像直方图生成三个部分进行并行优化.通过对Caltech 100数据库进行实验,结果表明,该方法可以取得接近于CPU核数的加速比,因此减少了词袋模型的构造和图像直方图生成时间,相对于传统词袋方法提高了算法的效率.  相似文献   

6.
数据流编程作为一种编程模式被广泛地应用于多核处理器系统,其多核处理器的并行调度和对主存的访问延迟对程序的性能有很大的影响.为此,结合X86多核处理器的特点,提出一种数据流程序的任务调度与缓存优化方法.任务调度优化首先在预处理阶段提高目标程序的局部性和并行粒度;然后利用数据流程序的数据并行、任务并行和流水并行优化核间负载均衡,并构造软件流水调度.缓存优化针对目标系统的层次性缓存结构特征,通过消除缓存伪共享减少多核并行运行时相互间的干扰,根据逻辑线程间的通信分布实现逻辑线程到处理器核的映射.以COStream作为数据流编程语言,输出经过编译优化后的目标代码.实验选取数字媒体领域典型的算法进行测试,测试结果表明,编译优化后的测试程序基本达到线性加速比,验证了编译系统的有效性.  相似文献   

7.
基于很多大数据应用存在对数据进行多种并行处理的需求, 提出两层混合式并行方法, 即执行单元的混合并行和计算模型的混合并行. 通过在同一个计算节点上执行单元的混合并行, 充分挖掘基础设施的计算能力, 从而提高数据处理性能; 采用在同一个执行引擎中集成多个计算模型的并行方法, 以适合应用多样异质处理模式. 不同的混合并行方法可以契合不同的数据和计算特点, 以满足不同的并行目标. 介绍了混合式并行方法的基本思想, 并以前期开发的并行编程模型BSPCloud为基础, 阐述了进程和线程混合并行、BSP和MapReduce混合并行的主要实现机制.  相似文献   

8.
基于高效能大任务和多任务计算需求以及芯片技术的高速发展,多核处理器进入片上众核处理器时代,但如何将这种硬件能力转变成计算性能的提升,充分利用MPSo C的并行计算能力是该领域亟待解决的问题.文中研究设计了面向片上众核处理器的物理核到虚拟核分配算法(VPD),该算法通过识别任务执行时的阶段状态特征,动态重组物理核并配置成与任务计算需求相适应的虚拟核,在满足任务的计算资源需求的条件下,实现虚拟核最优分配.最后通过实验将VPD算法与不同的多核/众核处理器环境下的主流调度算法进行比较,结果表明:该算法可适用于多种环境,且效能比其他同类算法平均高5%~10%.  相似文献   

9.
基于Intel第二代Xeon Phi代号为Knights Landing(KNL)众核处理器平台,利用MPI+OpenMP混合编程策略对并行矩量法(Method of Moments, MoM)进行了优化.利用OpenMP编程技术和KNL的计算资源,提高了CPU(Center Processing Unit)使用率;线程的引入,大幅度减少了矩阵填充过程中进程间的冗余积分;为发挥KNL的512位矢量宽度优势,通过向量化优化进一步提高了循环结构的执行效率;对计算密集型、CPU利用率高的矩阵求解过程,通过引入的OpenMP编程策略,减少了MPI(Message Passing Interface)通信时间,加速了求解.数值结果表明,通过在KNL众核处理器平台上的优化,可以极大地提升矩量法计算复杂电磁问题的效率.  相似文献   

10.
基于工作站或高性能微机群组的并行计算,是并行计算领域研究的热点。常见的并行环境有MPI等,但它们编程复杂,并行程序的可移植性差。该文介绍了一种有效的并行计算模型BSP,它的并行编程容易,性能可预测,程序的可移植性好。  相似文献   

11.
正当今社会已进入了信息化、网络化、智能化、大数据时代。国务院印发的《促进大数据发展行动纲要》明确提出要推动大数据的发展和应用。大数据需要高性能计算、云计算、分布式文件系统、分布式并行数据库、分布式并行数据挖掘、可扩展存储系统等技术作为支撑。为进一步推动大数据与高性能计算研究开发及应用发展,及时报道专家学者、工程技术与管理人员、研究生在大数据与高性能计算领域取得的最新成果,《广西科学》  相似文献   

12.
提出了面向大型飞机设计的气动模拟软件CCFD的架构和实现方法.对于复杂流场建模和高分辨率湍流数值模拟,CCFD采用对比分析各种计算模型和提高计算网格分辨率的方法来得到高精度的模拟结果和更精细的流场模型.CCFD在并行编程模型、负载平衡、通信重叠等多个方面针对万核级的大规模并行计算进行了改进.同时,CCFD实现了批处理作业、双模式控制参数设置、计算过程监控等功能的用户友好操作界面.通过在"天河一号"上进行的测试可以看出,随着并行规模从128核增加到近万核(8 192核),作业的运行时间稳定降低,加速比稳定增加.  相似文献   

13.
研究了集群环境下并行编程的两种模型——PVM和MPI,分析了基于PVM模型的PVM .CPPVM2种编程工具的发展情况、编程环境及各自特点;同时分析了基于MPI模型下提供开放资源的MPICH,LAM/MPI,MPIJava编程工具的发展情况、编程环境及各自特点、提出了集群编程环境将朝着面向对象的并行程序设计、广泛的异构环境支持、高性能计算程序设计的可视化等方向发展.  相似文献   

14.
在传统的并行编程模型中,对大量数据如何进行并行计算、如何为每个任务分发数据、如何处理单点故障等问题,都需要大量的程序分析和设计,这些问题的有效处理都需要程序员显式地使用有关技术来解决.对于程序员来说,这是一项具有极大困难的工作,使得原本简单的运算反而变得非常复杂,这些问题的存在也在一定程度上制约了并行程序的普及.而MapReduce计算模型能有效地解决上述问题,阐述了Google的MapReduce计算模型的实现机制,并通过实例描述了该模型的执行过程.  相似文献   

15.
针对基于支持向量机的分类器训练时间过长问题,提出一种并行训练策略.该策略在并行程序设计上采用主从模式,将训练任务划分成若干个子任务,分配到多个从节点上计算,最后由主节点将各从节点上的训练结果收集,生成分类器模型.采用这种算法,使用了多组稀疏型和连续型的数据集,经过在自强3000高性能计算机上测试,实验结果表明该算法不仅能够保证多分类的高准确率,而且缩短了训练时间.  相似文献   

16.
并行编程模型是并行计算的基础,在面临多核新挑战的情况下,如何确定未来并行编程模型的主流,是一个重要的问题.通过对常用的并行编程模型和并行编程技术的概念、特点和应用环境进行介绍,为并行应用开发时有效选取并行编程模型和技术提供参考.  相似文献   

17.
随着多核处理器被广泛的应用于桌面系统,如何充分利用多核处理器的计算能力,挖掘应用程序的并行性,以充分发挥多核系统的强大计算能力,成为近几年国内外计算机领域研究的热点,多核系统并行程序设计也成为所有专业软件开发人员必须了解和掌握的一项技术.本文阐述了一种以OpenMP为基础的多核并行程序设计方法,研究并提出了两种符合多核系统并行程序设计特征的编程模式:条件同步模式和线程分组竞争模式.实验证明这些方法简单高效.  相似文献   

18.
PVM(ParallelVirtualMachine)是异构计算环境下消息传递模型实际应用的成功范例.它将计算机网络上的各种机器抽象映象成一台具有高性能计算潜力的虚拟并行机,构成开发和运行大型并行应用软件的灵活、简洁且完整的程序设计环境,在分布式高性能计算领域为人们所广泛接受,成为网络并行计算技术领域中消息传递程序设计模型的事实标准之一.本文介绍PVM的结构、模型和技术发展;分析了典型应用和实验数据,最后对PVM进行评价并给出结论.  相似文献   

19.
基于并行计算的盾构隧道施工三维动态仿真   总被引:1,自引:0,他引:1  
以上海地区某双孔盾构隧道中试验段的施工为仿真对象,在现有多种计算方法的基础上,进一步突出盾构机施工工序和细节模拟,建立了大规模的全三维动态仿真模型,最后在高性能计算平台上结合并行求解算法完成了一系列计算.仿真结果显示了施工引起的具体地表三维隆沉情况,通过实测数据验证计算模型的合理性;同时也研究了不同并行求解方案对大规模盾构隧道开挖模拟的影响.  相似文献   

20.
提出了基于消息传递的刀位轨迹并行计算方法.该方法首先将串行计算任务合理的划分成若干并行子任务,然后动态的分配到各处理机上,能充分利用网络中空闲的计算资源,提高计算速度.分别应用于投影法和自适应投影法编程,试验结果表明该方法具有令人满意的并行加速比.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号