首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
《微型计算机》2005,(4):31-38
2003年3月,英特尔发布了针对笔记本电脑的迅驰移动计算技术,和以往英特尔产品不同的是.迅驰不再是一个处理器的品牌.而是提供了一整套笔记本的核心部件.包括处理器、芯片组和无线局域婀组件英特尔专门针对笔记本电脑设计的Pentium M处理器和855系列芯片组具有高性能、低功耗的特点,能提高笔记本的性能和电池续航时间此外,英特尔大力推动无线应用.  相似文献   

2.
《个人电脑》2008,14(12)
2008年11月12日,2008年全国高性能计算学术年会在无锡举行.会上发布了2008年中国高性能计算机性能TOP100排行榜。此次榜单显示.英特尔进一步扩大了其在国内高性能计算业领域应用的领先优势。在总共100套系统中:基于英特尔架构处理器的系统共有72套上捞,并贡献了全部上榜系统计算力总和的67.01%(以Linpack值计算),排行前10的系统中有9席为基于英特尔架构的系统;四核英特尔至强处理器成为TOP100主力军.占据前十名上榜系中的8席,以及全部54个基于四核处理器系统中的43席;英特尔推动高性能计算在商业领域中的应用成效显著.以能源(油气勘探)领域为例.总计35台高性能计算系统中有32台基于英特尔架构。  相似文献   

3.
在计算机图形学、积分计算和神经网络等应用场景中,平方根函数的高性能实现在构建处理器的基础软件生态中起到了十分重要的作用.随着A RM架构处理器得到广泛的使用,研究A RM架构下的函数快速算法实现变得更加关键.当前大量处理器都采用了SIMD架构,所以,研究基于SIMD实现高性能函数计算方法具有重要的研究意义和发展前景.因此,对平方根函数进行了高性能的实现与优化.通过分析IEEE 754标准的浮点数在内存中的存储格式,设计了高效的平方根函数算法;然后通过结合平方根倒数和泰勒公式算法,进一步提高了算法精度;最后通过SIMD优化进一步提升了算法性能.实验结果表明,在满足精度的前提下,相比于libm算法库,实现的平方根函数的,性能提高了约7倍,相比于A RM V8提供的计算平方根的指令在性能上提高了约3倍.  相似文献   

4.
受限于功耗,十多年前通用微处理器就停止追求更高的主频转而向集成更多处理器核的方向发展;同时,随着晶体管密度按摩尔定律不断提高,单片可集成的处理器核数成倍增长,片上多核、众核处理器已成为高性能微处理器发展的主流。未来千核级通用众核处理器支持共享存储编程模型是一种必然趋势,但传统的Cache一致性目录结构面临着查找延迟高、目录项替换频繁以及硬件代价和功耗可扩展性有限等问题。稀疏目录实现了传统目录结构硬件开销与一致性维护效率的折衷,被认为是众核处理器维护Cache一致性的一种高能效、可扩展结构。综述了近年来提高稀疏目录性能的相关研究与方法,并对其在面积、访问延迟、功耗和实现复杂性等方面进行分析,归纳出这些方法各自的优点和存在的不足,对创新设计未来高性能众核处理器共享存储体系结构具有一定的参考价值。  相似文献   

5.
陈少虎  张云泉  张先轶  程豪 《软件学报》2010,21(Z1):214-223
BLAS 库是高性能计算中最基本的数学库,它的性能对超级计算机的性能有着极大的影响.而且随着CPU多核化的发展,BLAS 的多核并行性能已经变得比与体系结构相关的单核性能更加重要.实验以流行于高性能计算的Xeon、Opteron 系列多核X86 处理器为例,全面测试了GotoBLAS、Atlas、MKL 和ACML 四种主流的BLAS 库的所有1,2,3 级函数,并覆盖了不同计算规模和多核并行方面的测试.通过测试结果,分析源代码、BLAS 库资料和论文的方式,分析BLAS 有效的优化和并行方法,以及它们所适合的平台.为BLAS 的优化、使用,甚至高性能处理器的发展上提供有益的建议.实验结果表明,比起一个逻辑处理强大但是复杂的处理器,一个cache 更大、性能更好,内存带宽更宽、延迟更小,主频更高的处理器往往能在高性能计算中取得更好的性能.同时,X86 平台上的状况对其他体系结构也有巨大的借鉴意义.  相似文献   

6.
高性能计算(HPC)已经进入后E级时代。作为超算系统核心器件,高性能处理器通过核心运算架构为HPC提供超强算力。核心运算架构的研究进展代表了高性能处理器体系结构的发展方向。以面向E级计算的先进高性能处理器为目标,从运算资源组织结构、数据和指令级并行方式、领域专用加速结构、支持数据类型和算力等方面对核心运算架构研究进展进行分析和探讨,并展望了高性能处理器核心运算架构的发展趋势。超宽向量SIMD和SIMT、领域专用加速结构加速矩阵运算、支持多种低精度运算以加速HPC和AI融合,将是未来高性能处理器核心运算架构研究和发展的主要方向。  相似文献   

7.
随着芯片密度的不断增加和对可靠性要求的不断提高,高性能处理器的容错设计越来越受到关注.对近年来高性能处理器的差错校正技术进行了分析和比较,它们被分为时钟级差错恢复、指令级差错恢复、线程级差错恢复以及重构等4类,研究对象包括研究方案、原型和产品.研究结果表明,以片上多处理器和/或同时多线程为特征的高性能处理器除了沿用传统的容错技术之外,多以固有的、旨在为改善性能而重复设置的硬件资源为基础来设计容错机制和调度方案.  相似文献   

8.
在当今的网络处理器中,为了提高吞吐率、实现高性能,部分处理器采用了流水线技术和硬件多线程技术。支持硬件多线程不仅有效地隐藏了访存延迟,而且略去了线程切换时线程相关信息的保存与恢复,减少了线程切换的开销,从而提高了性能。然而硬件多线程并未能彻底消除线程切换的开销,线程切换时仍需要清除与重载流水线,这将浪费一定的时钟周期,不能充分利用多线程带来的好处。该文在IXP2400网络处理器的基础上,提出了一种新的设计方法,使得线程切换时略去了清除与重载流水线的环节,减少了这部分的开销,从而提高了处理器性能。  相似文献   

9.
陈虎  周鹏灵 《计算机应用》2023,(11):3517-3526
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代...  相似文献   

10.
个人计算机近期最主要的发展之一是使用多处理器以提高计算能力。为了分析个人计算机额外处理器所获得的性能,研究操作系统性能与计算机体系结构的相关性,我们用功能模块设计了一个双处理器计算机系统,采用修改过的快速傅立叶算法验证加强计算的能力。Windows NT4.0版本和Linux 2.0版本采用双处理器系统运行快速傅立叶算法,无需线程技术,使第二个处理器产生的性能得到了确认。文章探讨了这方面的细节问题。  相似文献   

11.
赵明 《电脑时空》2012,(3):22-22
长久以来谈起低功耗处理器基本上大家都会将其与低性能划上等号,这不仅反映在CPU的处理速度上,更是反映在那可怜的显示性能上。2011年随着两大芯片阵营相继推出新的处理器,融合了GPU的较高性能的低功耗处理器也浮出了水面,本期我们就为大家介绍一款采用了AMD低功耗E-450处理器的13英寸笔记本一ThinkPadE325。  相似文献   

12.
基于ARM平台的多媒体播放器的设计与实现   总被引:1,自引:0,他引:1       下载免费PDF全文
马燕  李存  李晓勇  刘海涛 《计算机工程》2006,32(24):221-222
基于ARM平台设计了一个状态机控制的多媒体播放器系统,并进行了相应的性能优化,从而在资源受限的通用处理器上实现了软解码的高性能计算,完成了一个高性能、低功耗、低成本的嵌入式系统。  相似文献   

13.
随着集成电路工艺的发展,高性能计算系统中互连网络性能提升速度远低于处理器性能的提升,互连网络带宽已成为制约高性能计算性能提高的瓶颈之一。从减少网络注入数据量的角度出发,对网络通信实时压缩技术进行了研究,给出了一种面向网络通信的硬件实时压缩引擎RTCE的设计,在网络通信过程中,硬件自动实现对网络包的压缩传输。采用SPEC2006、Graph500、CFD算法测试数据进行测试,压缩后的网络包数据量平均减少32.8%~48.7%。  相似文献   

14.
随着VLSI技术和半导体制造工艺的不断发展,多核处理器已经取代了单核处理器.当技术和工艺的发展使片上多处理器中核的数目增加时,各个处理器核之间的互连及其通信就成为制约处理器性能提高的瓶颈.为了能够充分发挥多核处理器的高性能,文中根据当今主流多核处理器的互连方法,通过分析各种互连方法的优势与不足,提出了针对不同的核的数目和结构采用不同的互连方法,指出将新材料、新技术、新器件与已有的成熟的多核互连方式相结合是提高多核互连效率的有效方法,并阐述了未来多核互连的研究方向和发展趋势.  相似文献   

15.
2010年3月17日,本刊讯,英特尔公司在北京发布了新一代智能服务器处理器——英特尔至强处理器5600系列。据了解,该系列处理器传承了英特尔创新的智能计算理念,主要用于双路服务器和工作站系统,可为不同行业和不同应用领域的用户带来出色的计算性能,尤其适用于大规模数据中心、高性能计算、云计算和其他数据密集型应用环境。  相似文献   

16.
当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响,是众核结构设计中的重要环节,也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同,以及所面向的应用领域需求不同等原因,目前的HPC主流众核片上存储层次结构并不单一,但从横向比较和各处理器自身纵向发展趋势,以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看,SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面,开展针对众核存储层次特点的设计与优化,可以帮助HPC应用更好地发挥众核处理器的计算优势,从而有效提升实际应用性能,因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。...  相似文献   

17.
随着人们对PC机高性能需求的增加,双核心处理器正在不断涌向市场,被人们所认知。那么,何为双核心处理器?为什么它能被市场认定?本文将从双核心处理器的发展、定义和分类,AMD的双核心方案,超线程技术和双核心技术的区别与联系几个方面出发.详细概述了双核心处理器,使人们对其有一个全面的认识。  相似文献   

18.
张麒赟 《微型计算机》2007,(8S):156-158
Core 2 Duo处理器由于具有低功耗,高性能的特点而特别吸引玩家的注意力.对如何彻底挖掘core 2 Duo处理器性能也是许多玩家一直在研究探索的。超频.显然是提升处理器和系统整体性能的最直接方法。那么.要玩好你手中的Core 2 Duo处理器超频.要注意些什么?又应该如何去做呢?[编者按]  相似文献   

19.
矩阵乘作为许多科学应用中被频繁使用的关键部分,其计算量巨大且稠密的本质,使得高性能计算领域中矩阵乘并行算法的研究一直是经久不衰的热门话题.随着我国自主研发的申威众核处理器SW26010在科学计算和人工智能领域的快速发展,对面向SW26010众核处理器的高性能矩阵乘算法提出了迫切的需求.针对SW26010众核处理器的体系结构特征,首次对单精度矩阵乘实现进行了深入探讨,提出了3种不同存储层次的高性能并行算法.在进行算法设计时,计算方面,结合该处理器的从核双流水,从汇编层面手动控制核心计算任务的指令序列,保证了高效的指令级并行;访存方面,综合考虑了有限片上存储资源的有效使用,以及访存任务和计算任务的交叉并行,实现了计算访存的平衡以及算法整体性能的提升.实验结果显示,与该处理器上最先进的官方数学库xMath中的单精度矩阵乘实现相比,运行时峰值性能提升了6.8%,达到了理论峰值性能的86.17%;在基于不同矩阵乘场景的通用性比较中,95.33%的场景中性能更高,最高性能加速比达到247.9%,平均性能加速比为61.66%.  相似文献   

20.
解高阶Hermitian矩阵特征值问题的并行块消去迭代法   总被引:1,自引:0,他引:1  
§1.引言在现代计算物理、计算化学、计算生物以及许多科学研究与工程计算中都涉及很高阶的Hermitian矩阵特征值问题.对这个问题已有许多的研究成果和计算方法,但是现有的方法或者是不能并行执行或者是仅能计算少量的特征值.对于很高阶的矩阵,要求不是太少量的特征值的问题还没有一个好的并行算法.本文工作的目的是给出一个粗粒度的并行算法,能充分利用高性能大规模分布式存贮的并行计算机巨大潜力解决实际应用的计算问题.本文给出的并行分块消去迭代法把在单处理器上串行求解矩阵特征值问题的解算器看作“黑盒子”来使用,解算器…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号