期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

高剑刚胡晋龚道永方燕飞刘骁何王全金利峰郑方李宏亮《计算机研究与发展》2021,58(12):2696-2707

随着系统规模与集成度的快速增加,可靠性与可用性问题成为构建E级计算机系统所面临的重大挑战.针对神威太湖之光超级计算机可靠性与可用性设计与实现开展全面的分析.首先概要描述神威太湖之光超级计算机系统结构.其次,系统提出神威太湖之光超级计算机可靠性增强技术以及故障预测、主动迁移、任务局部降级等主被动容错技术,建立神威太湖之光超级计算机多层次主被动协同的容错系统.再次,根据系统故障统计信息,分析失效分布及主要失效来源,结合指数、对数正态与韦布尔3种典型寿命周期分布,对神威太湖之光系统故障间隔时间分布进行数据拟合分析.最大似然估计与K-S(Kolmogorov Smirnov)检验结果表明,对数正态分布与系统失效经验数据取得了最好的拟合度,建立神威太湖之光系统失效分布模型,并计算得出系统平均无故障时间.通过系统运行统计与实际应用测试,分析了故障预测精确度以及主动迁移、局部降低等容错技术的时间开销与容错效果.最后,在神威太湖之光超级计算机可靠性与可用性分析的基础上,提出E级计算机系统高可靠与高可用技术发展建议. 相似文献

2.

面向高性能众核处理器的超频DDR4访存结构设计

高剑刚李川郑浩王彦辉胡晋《计算机工程与设计》2024,(3):715-722

从高性能众核处理器的多路DDR4嵌入式工程应用出发,设计一种高密度DDR4串推互连结构,提出一种基于不同激励码型的仿真分析方法。采用双面盲孔印制板工艺折叠串推访存结构设计,解决地址组信号概率性出错问题。在压力测试环境下实测读/写信号波形良好,支持信号超频可靠传输,标称2666 Mbps的DDR4存储颗粒可以在3000 Mbps速率下长时间稳定运行。已在神威E级原型机等多台套大型计算装备研发中得到规模化推广应用,产生了良好的技术效益。相似文献

3.

使用GTC-P应用评估曙光E级原型机的性能

王一超胡航 William Tang 王蓓林新华《计算机工程与科学》2020,42(1):1-7

曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,对比了GTC-P在海光CPU和DCU与Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型机的多结点上进行了扩展性分析。性能评估工作反映了高性能计算应用在曙光E级原型机上的实际运行性能。相似文献

4.

面向E-HPC的新型高性能互连网络技术研究项目简介

《计算机工程与科学》2016,(11)

<正>随着神威·太湖之光以125P的峰值性能登顶Top500榜首,超级计算机研制中的一个重要里程碑结点100P系统已被攻克,下一个高峰"E级计算机"正成为各国竞逐的新目标。2016年科技部适时启动了E级计算重点专项,拉开了我国研制E级超级计算机(以下称E-HPC)的序幕。国防科技大学计算机学院牵头,联合相关单位承担了专项第一批唯一单列的基础前沿探索项目—面向E-HPC的新型高性能互连相似文献

5.

基于资源调度的集群节能系统的设计与实现

戴永涌杨树军《计算机工程与科学》2009,31(Z1)

集群计算机系统的运算性能跨入百万亿次、千万亿次时代,节能降耗已成为集群计算机系统必须面对的重要问题之一,本文从系统级节能的角度出发,结合神威高性能集群计算机系统的系统监测、作业管理、IPMI带外电源管理和TuxOnIce系统休眠技术,设计并实现了基于资源调度的集群节能系统,通过对空闲结点的关机或休眠,能够有效地降低集群系统空闲时的能耗,使神威高性能集群计算机系统成为真正的绿色计算机。相似文献

6.

基于接收者的悲观消息记录协议的设计与实现

李海军周明忠《计算机工程与应用》2005,41(11):102-104

消息记录协议是高性能计算机进行局部容错的基础技术之一,该文设计与实现了一个基于接收者的悲观消息记录协议,并且集成到MPI的实现中。最后,利用软件模拟的方法在神威超级计算机上进行了验证。相似文献

7.

基于VP技术的星载智能计算机虚拟原型机的构建

下载免费PDF全文

吴兰蕙刘凯俊彭攀《计算机测量与控制》2020,28(12):222-226

作为新技术和新生产力水平基础上涌现出来的产物,以全新设计理念研制的现代小卫星相较于传统大卫星在功能密度上有了显著提升,得到了广泛的应用。针对目前现代小卫星技术面临的设计复杂度提高和研发周期缩短的双重压力,提出了一种基于虚拟原型（Virtual Platform, VP）技术来构建星载智能计算机的虚拟原型机的设计,利用SystemVerilog的直接编程接口（Direct Programming Interface, DPI）技术在仿真验证平台上对C语言的调用,实现不同硬件平台间的通信,模拟星载计算机在轨运行的数据流向。该设计能缩短卫星的研发周期,降低卫星研制的成本。通过工程实例中虚拟原型机中的构建流程展示,结果证明,基于VP技术构建的虚拟原型机能够模拟星载计算机的部分工作流程,实现星载计算机的功能仿真,满足了商业小卫星快速迭代的研发需求,为小卫星的研制提供新的思路。相似文献

8.

基于不可靠通信链路的数据共享模块

李慧鑫姚文明《计算机与现代化》2019,(1):80

随着企业规模的逐步扩大和计算机网络与企业信息技术的飞速发展，大中型企业陆续建立了很多业务系统，对各个系统之间数据同步的安全性提出了更高的需求。针对此需求，基于RabbitMQ消息队列中间件，本文设计并实现基于不可靠通信链路的数据共享模块，解决在企业内部两级数据中心之间的双向数据同步问题，并通过RabbitMQ的消息确认机制和持久化机制，保证数据的安全送达、无丢失。经过实践证明，该数据共享模块功能稳定，可提高两级数据中心的数据传输效率并保证其安全性。相似文献

9.

天河三号原型机分布式并行深度神经网络性能评测及调优

魏嘉张兴军纪泽宇李靖波岳莹莹《计算机工程与科学》2021,43(5):782-791

深度神经网络DNN模型是人工神经网络ANN模型的重要分支,是深度学习的基础。近年来,由于计算机算力的提升和高性能计算技术的发展,使得通过增加DNN网络深度和模型复杂度来提高其特征提取和数据拟合的能力成为可能,从而使DNN在自然语言处理、自动驾驶和人脸识别等问题上显现了优势。然而海量的数据和复杂的模型大大提高了深度神经网络的训练开销,因此加速其训练过程成为了一项关键任务,其技术范围涵盖从底层电路设计到分布式算法设计等多个方面。国产天河三号原型机峰值速度的设计目标为百亿亿级,巨大的计算能力为DNN训练提供了潜在的契机。针对天河三号原型机ARM架构特点,采用PyTorch框架与MPI技术,针对单个MT-2000+计算节点、单个FT-2000+计算节点,以及通过拓展的多节点集群设计CNN训练策略,并对上述处理器在神经网络分布式训练的性能做出了评测和优化,为进一步提升和改进天河三号原型机在神经网络大规模分布式训练方面的表现提供了实验数据和理论依据。相似文献

10.

两级嵌入式系统的消息驱动和快速传送

何煦岚沈丽容《计算机工程与设计》2007,28(20):4980-4983

提出了两级调度嵌入式操作系统的运行原理和任务、子任务的消息驱动机制,设计了一种新的描述消息的数据结构,用以满足两级调度嵌入式操作系统的运行.利用这种数据结构,可以用零拷贝的方式来传送消息,极大地提高了系统的效率.在两级嵌入式操作系统中,构建了完全独立的、由不同类型消息所组成的任务级消息队列和子任务级消息队列.最后,分析了这两种消息队列和各种不同类型消息的特点,并分析了利用消息驱动任务和子任务的方法. 相似文献

11.

网络并行超级计算系统THNPSC—1 总被引：2，自引：0，他引：2

李三立都志辉马群生王小鸽《计算机学报》2001,24(6):627-632

网络并行计算（也称集群式计算）是实现高性能计算的重要方式,该文介绍了一个清华大学研制的网络并行超级计算系统THNPSC－1,它是由Pentium Ⅲ SMP计算结点组成;网络互联采用两种高速网：一种是自制的具有动态仲裁与路由寻经的交叉开关网络THNet,另一种是100Mpbs的Ethernet.THNet中的交叉开关THSwitch是用15万门的ALTERA FPGA芯片构成,THNet还包括具有DMA引擎的网络适配器THNIA.THNet每一端口可以提供数据传输率为1．056Gbps,其聚合频宽可达8．4Gbps;采用固定用户缓冲和扩展的主动消息传递等法,THNet执行用户层的消息传递,旁路操作系统的系统调用,做到零拷贝的消息传递,乒乓测试结果表明：单向消息传递延迟可减少到8μs。THNetl软件包括THNIA驱动程序和支持用户层通信的函数库。此文对相关工作进行了简要对比,并说明了该系统的应用情况。相似文献

12.

高阶路由器结构研究综述

杨文祥董德尊雷斐李存禄吴际孙凯旋《计算机工程与科学》2016,38(8):1517-1523

随着高性能网络规模的增加,高阶路由器结构设计成为高性能计算中研究的重点和热点。使用高阶路由器,网络能实现更低的报文传输延迟、网络构建成本和网络功耗,同时高阶路由器的应用还可以提高网络可靠性。过去十年是高阶路由器发展最快的时期,对近年高阶路由器的研究进行了综述,并对未来发展趋势进行了预测,主要介绍了以YARC为代表的经典结构化设计以及"network within a network"等近年来涌现的新型设计方法。未来的研究重点是解决高阶路由器结构设计中遇到的缓存和仲裁等各种问题,并利用光互连等技术设计性能更好的结构。相似文献

13.

一种基于Chiplet集成技术的超高阶路由器设计

梁崇山戴艺徐炜遐《计算机工程与科学》2022,44(2):207-213

高带宽、低延迟的高阶路由器对于构建大规模可扩展的互连网络有着重要的作用,但是受限于单个路由芯片设计复杂度的不断增加以及摩尔定律、登纳德缩放定律的放缓与停滞,在单个路由芯片上扩展更多的端口数将变得越来越难.Chiplet将多个裸片以特定的方式集成在一个高级封装内,形成具有特定功能的大芯片,以此解决芯片设计中涉及的规模、研... 相似文献

14.

基于OMNet++的大规模InfiniBand互连网络模拟系统

汪鑫林放刘轶钱德沛《计算机工程与科学》2021,43(5):792-798

随着多核处理器的发展和计算需求的不断增长,高性能计算系统规模不断增大.使用模拟器对高性能计算系统进行模拟,对系统设计及优化有着重要的作用,互连网络模拟则是其中不可或缺的一部分.设计实现了一种基于OM Net++的大规模InfiniBand互连网络模拟系统,该系统通过记录的并行程序M PI消息来驱动网络仿真过程,可以模拟互连网络在程序运行过程中的工作状态,并可与消息驱动的高性能计算机模拟系统集成.通过与真实集群中节点间通信时延做对比,验证了模拟精度,并测试了模拟性能. 相似文献

15.

HPSEPS 在元与神威 • 太湖之光上的移植和性能分析

李燕赵永华王武赵莲《数据与计算发展前沿》2018,9(2):46-52

“神威·太湖之光”高效能计算机系统是世界上首台峰值运算速度超过 10 亿亿次量级的超级计算机,HPSEPS (High Performance Symmetric Eigenproblem Solvers) 是自主开发的大规模对称稠密矩阵特征问题并行求解器,包括标准对称稠密矩阵特征问题的并行计算方法, 对大规模数据问题的计算,表现出较好的性能,本文分别在中科院的“元”超级计算机上和神威·太湖之光超级计算机上进行了移植, 对比了两种超级计算机的系统性能, 并且在“神威·太湖之光”上分别链接适合其异构众核结构的 xMath 数学库和 mkl 数学库, 对求解器在链接两种不同数学库的计算机效果进行了测试与分析。相似文献

16.

并行系统的以存储器为中心的互联机制MCIM 总被引：2，自引：1，他引：1

李三立戈弋武剑峰《计算机学报》1999,22(4):395-402

并行系统中计算结点之间的互联网络一直是并行体系结构的研究热点,３０年来曾研究过多种ＩＮ的结构及其特性,然而这些ＩＮ都是以逻辑电路为基础的。本文提出一种以多端口快速静态存储器为中心的并行系统互联机制,称之为ＭＣＩＭ,ＭＣＩＭ不同于共享共享存储器,它的容量较小,划分为多个消息传递的通信邮区,并通过每个端口的访问接口（ＰＡＩ）。连接８－１６个计算结点。常用的四端口存储器可组成３２－６４个计算结点的并行相似文献

17.

面向图计算的运行时系统的消息聚合技术

张鲁飞孙茹君秦芳《计算机应用》2021,41(4):984-989

图计算应用的通信模式以时空随机的点对点细粒度通信为主,但现有高性能计算机的网络系统应对大量细粒度通信时表现不佳,进而影响整体性能。虽然在应用层进行通信优化可以有效提升图计算应用性能,但这会给应用开发人员带来很大的负担,因此提出并实现结构动态的消息聚合技术,通过构建虚拟拓扑的方法在通信路径上增加中间点从而提升消息聚合的效果。传统的消息聚合策略一般仅在通信源或者目的地上进行,聚合机会有限,而所提技术通过灵活调整虚拟拓扑的结构和配置适应了不同硬件条件和应用特征。同时,还提出并实现了面向图计算的有消息聚合的运行时系统,这使得在程序迭代执行时可以动态选择参数,从而减少开发人员负担。在256节点规模的系统上实验的结果显示,使用所提消息聚合技术优化后的典型图计算应用的性能可得到100%以上的提升。相似文献

18.

Beacon+：面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统

杨斌王敬宇刘世超邵明山肖伟陈起何晓斌刘卫国薛巍《计算机工程与科学》2022,44(9):1521-1531

随着E级计算的屏障被打破,高性能计算已经迈入了新时代。为了满足日益增长的数据访问需求,新兴的技术和存储介质都被运用到了超级计算机中,这使得其架构变得日趋复杂,其性能异常和系统热点定位也变得十分困难。为此,设计并实现了一个面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统——Beacon+。该系统无需修改应用代码/脚本即可对每个应用的数据访问过程进行全路径实时监控与分析。通过在线+离线的压缩方法和分布式缓存/存储等机制,Beacon+在保证系统本身高扩展性、低开销的同时还可以持续稳定地提供I/O诊断服务。以神威新一代超级计算机为部署平台,通过I/O标准测试应用和实际应用证明了Beacon+的低开销和高准确性,以及I/O诊断的高效性。相似文献

19.

SuperStar:一种可扩展高阶互连拓扑结构

雷斐董德尊廖湘科《计算机工程与科学》2014,36(6):1034-1041

随着高速信号传输技术和VLSI技术的发展,使用高阶路由器来应对因高性能计算机峰值性能不断攀升给高性能互连网络带来的新挑战已是发展需求;同时,如何利用高阶特性减少互连网络延迟和成本开销,以支持更大的网络规模是设计高性能互连网络拓扑结构的关键和突破点。针对目前基于高阶路由器的典型拓扑结构进行了分析,并在此基础上提出一个新的高阶拓扑架构SuperStar,其不仅具有较短的网络直径而且具有良好的可扩展性;通过在一个基于OMNeT++平台自主开发的高阶互连网络性能测评模拟器上设定不同的通信负载,测评各种拓扑结构在通信系统下实际的网络延迟和吞吐率的走势,以分析SuperStar的通信开销。相似文献

20.

面向国产异构众核系统的Parallel C语言设计与实现

何王全刘勇方燕飞魏迪漆锋滨《软件学报》2017,28(4):764-785

异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战,因此研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能有效描述国产众核系统的异构并行性,与其它众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据表明,Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 相似文献