首页 | 官方网站   微博 | 高级检索  
     

广义Hermitian特征问题标准化转换的有效并行块算法
引用本文:赵永华,迟学斌,程强.广义Hermitian特征问题标准化转换的有效并行块算法[J].计算机研究与发展,2007,44(10):1724-1732.
作者姓名:赵永华  迟学斌  程强
作者单位:1. 中国科学院计算机网络信息中心超级计算中心,北京,100080;中国科学院软件研究所,北京,100080;德州学院计算机系,德州,253000
2. 中国科学院计算机网络信息中心超级计算中心,北京,100080
基金项目:国家自然科学基金 , 国家高技术研究发展计划(863计划) , 国家重点基础研究发展计划(973计划) , 国家科技基础条件平台建设基金
摘    要:广义Hermitian特征问题并行求解器的性能依赖于所选择的并行算法和矩阵的分布策略等诸多方面.基于块存储和快算法策略,提出了一个新的标准化转化的并行算法,该并行算法将Cholesky分解结合到广义特征问题标准化转换中,降低了已有并行算法的通信开销,并增加了算法的并行性.新算法可显著改善已有并行算法的性能和可扩展性.另外给出了一个有效求解具有多个右端项的三角矩阵方程AX=B的并行块算法.通过自主开发的特征问题并行软件包PSEPS的测试结果表明,并行算法比传统的并行算法快大约1倍,并具有较好的可扩展性.

关 键 词:特征问题  块算法  Cholesky分解  并行计算  可扩展性
修稿时间:2007年2月25日

Efficient Parallel Blocked Algorithms for Generalized Hermitian Eigenproblem
Zhao Yonghua,Chi Xuebin,Cheng Qiang.Efficient Parallel Blocked Algorithms for Generalized Hermitian Eigenproblem[J].Journal of Computer Research and Development,2007,44(10):1724-1732.
Authors:Zhao Yonghua  Chi Xuebin  Cheng Qiang
Abstract:The performance of a generalized eigenproblem solver relies on many factors,which include selected parallel algorithms and matrix mapping strategy.A new parallelization is presented,which combines the Cholesky into the transformation from generalized to standard form.By reducing the communication cost and extending the parallelism,the new algorithm can obviously improve the performance and scalability of the original algorithm.Moreover,an efficient parallel algorithm is proposed to compute a triangular AX=B with multiple right hand sides.From the tests using the parallel software PSEPS,the speed of the parallel algorithm is about two times that of the classical parallel algorithms,and it has better performance and scalability than the classical parallel algorithms.
Keywords:eigenproblem  blocked algorithm  Cholesky decomposition  parallel computing  scalability
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号