首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
中国气象局的高性能计算机系统属于国家级的关键应用,承担着中国气象局所有业务及绝大部分科研项目的计算任务,系统的高可靠性对于整个系统和气象业务来说尤为重要。本文在简单介绍中国气象局目前主要的业务系统IBM cluster1600概况的基础上,从系统部件、网络配置、文件系统、存储等多个方面阐述了该系统设计实施过程中在高可靠性方面的考虑,并对2012年全年系统运行概况、故障及节点和系统可用性进行了统计和分析,证明该系统具有良好的高可靠特性。  相似文献   

2.
E级计算机系统规模巨大,使得故障异常总量随之增多,导致诊断发现的难度增加,因此,迫切需要一套更加准确高效的实时维护故障诊断系统,对硬件系统进行全面的异常及故障信息实时检测、故障诊断及故障预测。传统故障诊断系统在面对数万节点规模的诊断时存在执行效率低、异常检测误报率高的问题,异常检测及故障诊断的覆盖率不足。对异常及故障检测、故障诊断与故障预测相关技术进行研究,分析技术原理及适用性,并结合E级高性能计算机实际工程需求,设计一套满足数E级高性能计算机需求的维护故障诊断系统。基于维护系统的结构组成设计可扩展的边缘诊断架构,将高性能计算机系统知识、专家知识与数理统计、机器学习相融合给出故障检测、诊断及预测算法,并针对专用场景建立预测模型。实验结果表明,该系统具有较好的可扩展性,能在10 s内完成对十万个节点规模系统的故障诊断,与传统故障诊断系统相比,异常检测某特定指标误报率从3.3%降低到几乎为0,硬件故障检测覆盖率从90.2%提升至96%以上,硬件故障诊断覆盖率从71%提升至约94%,能较准确地预测多个重要应用场景下的故障。  相似文献   

3.
高性能计算(HPC)已经进入后E级时代。作为超算系统核心器件,高性能处理器通过核心运算架构为HPC提供超强算力。核心运算架构的研究进展代表了高性能处理器体系结构的发展方向。以面向E级计算的先进高性能处理器为目标,从运算资源组织结构、数据和指令级并行方式、领域专用加速结构、支持数据类型和算力等方面对核心运算架构研究进展进行分析和探讨,并展望了高性能处理器核心运算架构的发展趋势。超宽向量SIMD和SIMT、领域专用加速结构加速矩阵运算、支持多种低精度运算以加速HPC和AI融合,将是未来高性能处理器核心运算架构研究和发展的主要方向。  相似文献   

4.
根据在变电所监控系统设计中所遇到的抗干扰问题,分析了产生干扰的各种因素,介绍了相应的单片机抗干扰措施。  相似文献   

5.
高性能计算是气象业务及科研应用的重要的基础平台,中国气象局(CMA)近年来相继引进多套高性能计算机系统用以提高气象服务和研发能力。随着用户和应用的增加,如何有效管理高性能系统资源成为一个重要课题。本文详解介绍CMA高性能计算机系统统一资源管理平台的设计和实现,该系统可以对多套异构的高性能计算机系统进行统一的资源精细化统计分析和计费管理,通过该平台,系统管理员动态掌握系统的运行和资源使用情况,并据此调整系统资源分配调度策略,从而更合理高效的利用系统资源,有效提高系统运行效益。  相似文献   

6.
由于并行应用程序的运行效率往往很低,如何帮助程序员提高性能成为高性能计算中的重要问题,本文介绍了一个基于MPI的性能评价工具,它可以在应用程序运行的同时是收集系统负载信息,跟踪程序流程,根据硬件资源情况对处理机进行分组,并将负载信息和程序流程同时以图形方式展示,程序员可以藉此对并行应用程序运行情况进行监测,分析算法执行过程和系统负载的关系,找出性能瓶颈,发掘应用程序的潜力,最终提高应用程序的性能。  相似文献   

7.
高性能计算机在气象部门得到了广泛应用,发挥了重要作用,对高性能计算集群的科学高效的运维管理是确保高性能计算机系统正常运行的首要任务.本文结合武汉军运会气象高性能计算机的实际情况,对高性能计算机在业务应用、运行监控与维护管理等方面做了介绍,对业务科研人员和运维管理人员具有一定参考借鉴意义.  相似文献   

8.
高性能计算机系统的研究和发展   总被引:1,自引:1,他引:1  
本文先介绍构造高性能计算机系统的几种主要方法:向量巨型机、大规模并行处理机系统和工作站群机系统,对这些方法各自的特点、优势和不足进行了分析;接着对一种新型的工作站网络并行系统的研究进行了探讨;最后就当前高性能计算机系统的研究、开发和应用中的几个热点问题进行了讨论  相似文献   

9.
当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响,是众核结构设计中的重要环节,也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同,以及所面向的应用领域需求不同等原因,目前的HPC主流众核片上存储层次结构并不单一,但从横向比较和各处理器自身纵向发展趋势,以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看,SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面,开展针对众核存储层次特点的设计与优化,可以帮助HPC应用更好地发挥众核处理器的计算优势,从而有效提升实际应用性能,因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。...  相似文献   

10.
本文对配变基于Internet和Intranet技术的远程监控系统进行了研究,介绍了远程监控系统的总体结构、调度自动化设计以及系统软件设计.系统利用Delphi语言本身的多功能控件和强大的数据库功能,以及语言本身灵活的数据计算能力实现了电力信息的远程监控,实现了电力信息的共享,人机对话界面生动的模拟了现场工况,这使得电力调度的管理更加方便、快捷、提高了电力系统运行的安全性.  相似文献   

11.
文中分析了传统基于并行基准测试程序测试方法的不足,针对目前高性能计算机处理机台数多的特点,给出了实用的测试方法,推广了传统加速比的概念,提出了一种可扩展性评价方法。使用文中给出的方法,可方便地对高性能计算机进行测试和性能评价,同时可以使用小规模的并行机测试结果预测大规模并行机的性能。最后给出了NPB在某高
性能计算机上的测试和性能评价结果。  相似文献   

12.
高性能计算机电源系统设计的关键技术   总被引:1,自引:0,他引:1  
本文讨论了高性能计算机电源系统设计的三个关键问题--确定电源架构、选择DC/DC电源和进一步提高电源系统的可靠性.本文作者根据实际工程设计经验,总结出解决这些问题的技术方案和方法.  相似文献   

13.
黄河二桥健康监测系统—温度监测子系统   总被引:2,自引:0,他引:2  
掌握桥梁结构各部分温度在空间上分布和随时间变化的规律,对于校核设计取值、计算由温度变化引起的结构变形和应力具有重要意义。采用DS1820数字式温度传感器芯片与单片机构成桥梁温度监测系统,实现对桥梁的16个测点进行实时监测。由DS1820构成的测温系统电路简单、应用方便灵活,在常温测量中有较大优势,应用前景十分广阔。  相似文献   

14.
Parallel Algorithm Design on Some Distributed Systems   总被引:3,自引:0,他引:3       下载免费PDF全文
Some testing results on DAWINING-1000,Paragon and workstation cluster are described in this paper.On the home-made parallel system DAWNING-1000 with 32 computational processors,the practical performance of 1.1777 Gflops and 1.58 Gflops has been measured in solving a dense linear system and doing matrix multiplication,respectively .The scalability is also investigated.The importance of designing efficient parallel algorithms for evaluating parallel systems is emphasized.  相似文献   

15.
根据停车场的现代化管理需要,设计了一个简洁、高效、实用的停车场门禁监控系统。相对一些现有的停车场管理系统来说,本系统采用先进、成熟、实用和具有良好发展前景的技术,在容错性、实用性、易操作性等方面具有一定特色,并且本系统可扩展性较强,能够适应当前和未来的需要。  相似文献   

16.
The Manchester dataflow computer is a famous dynamic dataflow computer.It is centralized in architecture and simple in organization.Its overhead for communication and scheduling is very small.Its efficiency comes down,when processing elements in the processing subsystem increase.Several articles evaluated its performance and presented improved methods.The authors studied its processing subsystem and carried out the simulation.The simulation results show that the efficiency of the processing subsystem drops dramatically when average instruction execution microcycles become less and the maximum instruction execution rate is nearly attained.Two improved methods are presented to oversome the disadvantage.The improved processing subsystem with a cheap distributor made up of a bus and a two-level fixed priority circuit possesses almost full efficiency no matter whether the average nstruction execution microcycles number is large or small and even if the maximum instruction execution rate is approached.  相似文献   

17.
EAST是为科学研究建造的全超导核聚变实验装置。根据EAST的实验特点和性能要求,技术诊断系统数据监控子系统采用管理层、控制层和现场设备层3 层网络结构完成对装置的监控,通过采集卡和以太网实现信号采集及数据的传送。在EAST工程调试实验和两轮放电实验中,该数据监控系统成功实现了对EAST装置的运行状态和故障诊断的实时监控,表明该系统具有性能稳定、可靠等特点。  相似文献   

18.
分析了多媒体技术在煤矿安全监视监测系统中的实际应用,重点讨论了该系统的组成、特点、功能与关键技术以及提高系统可靠性的措施。  相似文献   

19.
为保证冶炼厂废水处理工程正常运行而专门设计、安装了一套计算机监控系统。该计算机监控系统采用分布式的硬件结构和面向对象的软件模块。经过近一年的实际运行该监控系统的工作一直正常。文章介绍了该系统的硬件和软件结构、功能和具体的实施方法。  相似文献   

20.
电缆温度监测是一些大中型企业经常面临的问题。详细介绍了利用计算机、单片机构成的电缆接头温度自动监测系统。通过该系统可及时获得电缆温度变化情况 ,为安全生产提供保障  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号