首页 | 官方网站   微博 | 高级检索  
     

一种基于数组生命期的数据分解算法
引用本文:丁锐,赵荣彩,韩林.一种基于数组生命期的数据分解算法[J].软件学报,2013,24(12):2843-2858.
作者姓名:丁锐  赵荣彩  韩林
作者单位:解放军信息工程大学, 河南 郑州 450002;数学工程与先进计算国家重点实验室, 河南 郑州 450001;解放军信息工程大学, 河南 郑州 450002;数学工程与先进计算国家重点实验室, 河南 郑州 450001;解放军信息工程大学, 河南 郑州 450002
基金项目:国家高技术研究发展计划(863)(2009AA01220);“核高基”重大专项(2009zx10036-001-001)
摘    要:划分是一种自动分配计算和数据到各个处理器的编译技术,是分布存储结构下并行编译的核心问题.以往的划分研究较少从生命期的角度考虑数据分解问题,分解在数组的不同生命期中不一致时会产生冗余通信.为解决上述问题,提出了一种数据分解算法,通过定义-引用图来表示数组的数据流信息,并使用分解映射表为数组不同的生命期建立各自的数据分解.对矩阵求逆等9 个实际用例的实验结果表明,与以往不区分生命期的划分研究相比,使用所提算法能够在寻找数据分解时对并行收益做出更准确的评估,减少了通信冗余,从而提升了自动生成的并行代码的加速比.

关 键 词:数据分解  数组生命期  自动并行化  分布存储
收稿时间:2012/11/19 0:00:00

Data Decomposition Algorithm Based on Array Life Cycle
DING Rui,ZHAO Rong-Cai and HAN Lin.Data Decomposition Algorithm Based on Array Life Cycle[J].Journal of Software,2013,24(12):2843-2858.
Authors:DING Rui  ZHAO Rong-Cai and HAN Lin
Affiliation:PLA Information Engineering University, Zhengzhou 450002, China;State Key Laboratory of Mathematical Engineering and Advanced Computing, Zhengzhou 450001, China;PLA Information Engineering University, Zhengzhou 450002, China;State Key Laboratory of Mathematical Engineering and Advanced Computing, Zhengzhou 450001, China;PLA Information Engineering University, Zhengzhou 450002, China
Abstract:Partition is a compiler technique that maps computation and data onto different processors, and is the key issue of automatic parallelization on distributed memory architecture. Array's life cycle has been less considered by previous researches on data decomposition, despite of the fact that the inconsistency of decomposition in different array life cycles often results in communication redundancy. This paper proposes a new data decomposition algorithm which represents data flow information of array by define-use graph, and creates own decomposition for each life cycle of array. The experimental results on Matrix-Inversion and other eight applications show that compared with automatic data decomposition methods that does not distinguish the life cycle of array, the proposed algorithm not only makes more accurate assessment of parallel benefits, but also reduce communication redundancy and rise up the speedup.
Keywords:data decomposition  array life cycle  automatic parallelization  distributed memory
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号