首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
公平性是一个关键的优化问题,当系统缺乏公平时,会出现线程饿死和优先级反转等问题.以公平性优化作为研究目标,分析当前共享Cache划分公平性的评价标准,找出了其评价参数和划分策略的不足,提出了一种新的共享Cache划分方案.通过提出一个新的多线程公平性评价指标并改进了已有的公平划分策略,从而提高多线程运行的公平性.实验结果表明,该共享Cache划分方案显著提高了系统公平性,并且系统吞吐量也有提高.  相似文献   

2.
片上多核处理器存储一致性验证   总被引:2,自引:0,他引:2  
存储一致性验证是片上多核处理器功能验证的重要部分.由于验证并行程序的执行结果是否符合存储一致性模型理论上是NP难问题,现有的验证方法中只能采用一些时间复杂度大于O(n3)的不完全方法.发现在支持写原子性的多处理器系统中,两条执行时间不重叠的操作之间存在确定的时间序.通过引入时间序的概念,设计并实现了一种线性时间复杂度的存储一致性验证工具LCHECK.LCHECK利用时间序将验证局部化,使得在表示程序执行结果的有向图中,序关系边的推导和正确性检测都被限定在有限范围内.与现有其他方法相比,LCHECK时间复杂度低,对程序长度和访存地址数没有限制,因此验证效率更高.作为国产片上多核处理器龙芯3号的重要验证工具, LCHECK发现了一些存储系统的设计错误.  相似文献   

3.
随着多核处理器规模的扩大,请求数据的处理器核到数据的宿主节点之间的平均距离相应增大,并且数据访问在分布式共享高速缓存块中的分布并不均衡引起了网络热点。这些情况导致一级高速缓存缺失延迟的增大。为了解决该问题,将每四个处理器核分为一组,在组内设计邻近数据探测器。邻近数据探测器通过确定一次缺失能否在邻近核的一级高速缓存中得到数据,从而利用了并行程序在多核处理器上执行时数据访问的核间局部性。另外,根据新的结构相应优化了高速缓存一致性协议。实验表明,该片上存储优化方法提高了系统性能,减少了片上网络流量,节省了能耗。  相似文献   

4.
曹非  刘志勇 《计算机科学》2012,39(8):304-310
片上多核处理器(CMP)通常采用私有或者共享的末级高速缓存(cache)结构,而共享末级cache一般使用静态地址映射机制。该机制将各处理器临时私有访问的数据映射于分布在其他处理器的末级cache中,使得各处理器对临时私有数据的访问延时增加。针对该问题,提出了一种动静结合的共享末级cache地址映射方法。该方法可将原来静态映射于其他处理器末级cache中的临时私有数据动态映射于访问者处理器的本地末级cache中,减少了大量静态映射所造成的长延时非本地末级cache访问,从而有效降低了整个共享末级cache的访问延时,在提高性能的同时降低了功耗和带宽使用。实验结果表明,动静结合的地址映射方式应用于采用环连接互连结构和侦听顺序环协议的CMP结构时,可获得的平均性能提升为9%,最大性能提升为38%。  相似文献   

5.
现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.本文介绍了片上多核处理器一致性问题的由来.总结了多核时代高速缓存一致性协议设计的关键问题,综述了近年来学术界对一致性的研究.从程序访存行为模式、目录组织结构、一致性粒度、一致性协议流量、目录协议的可扩展性等方面,阐述了近年来缓存一致性协议性能优化的方向.对目前片上多核处理器缓存一致性协议设计中存在的问题进行了讨论,并指出了未来进一步研究的方向.  相似文献   

6.
多核处理器非一致Cache体系结构延迟优化技术研究综述   总被引:1,自引:0,他引:1  
非一致Cache体系结构(non-uniform cache architecture,NUCA)为解决多核处理器(chip multi-processor)"存储墙"难题提供了新的设计思路.重点关注面向CMP的NUCA延迟优化技术,在介绍若干典型NUCA模型的基础上,分析大容量Cache环境下共享/私有机制中的延迟-容量权衡问题,讨论映射、迁移、复制和搜索等数据管理机制在多核环境下的优缺点.最后,针对基于片上网络(network-on-chip,NoC)互连结构的可扩展CMP体系结构,从NUCA模型优化、数据管理和一致性维护机制3个方面讨论和预测未来CMP NUCA延迟优化领域的发展趋势及面临的挑战性问题.  相似文献   

7.
8.
随着集成电路工艺水平的不断提升以及应用对处理器性能要求的日益增长,验证已成为未来片上多核处理器发展的主要技术瓶颈.文中深入分析了片上多核处理器验证中状态空间大、完备性不足、存储结构与互连网络验证复杂、硅后验证困难等突出问题,系统地总结了片上多核处理器模拟验证、硬件仿真、形式验证、硅后验证等方面的研究进展,并对该领域未来的发展方向进行了分析与展望.  相似文献   

9.
多核处理器已经成为当前微处理器技术发展的重要方向.介绍了多核处理器的起源和发展现状,分析了多核处理器技术的发展趋势.重点讨论了多核处理器技术涉及的片上网络、存储结构设计、编程接口以及资源管理等关键技术;在此基础上,进一步探讨了多核处理器的发展所面临的主要挑战.  相似文献   

10.
多核处理器的关键技术及其发展趋势   总被引:10,自引:1,他引:9  
多核处理器以其高性能、低功耗优势正逐步取代传统的单处理器成为市场的主流.介绍了Hydra、Cell、RAW这3种典型的多核处理器结构,重点讨论了核心结构选择、存储结构设计、片上通信、低功耗、操作系统设计、软件应用开发等7个影响当前多核处理器发展的关键技术,最后得出多核处理器的未来将呈现众核、低功耗和异构结构3种发展趋势.  相似文献   

11.
在基于低层虚拟机的四层C-to-VHDL可重构编译架构上,针对RAM访问和设计执行性能之间的矛盾,提出一种RAM读取优化算法。通过对IR访存指令及数据相关性的分析,创建专用数据通路,优化RAM的访存过程。实验结果表明,该优化算法能够有效减少RAM访问次数。  相似文献   

12.
An SSD generally has a small memory, called cache buffer, to increase its performance and the frequently accessed data are maintained in this cache buffer. These cached data must periodically write back to the NAND Flash memory to prevent the data loss due to sudden power-off, and it should immediately flush all dirty data items into a non-volatile storage media (i.e., NAND Flash memory), when receiving a flush command, while the flush command is supported in Serial ATA (SATA) and Serial Attached SCSI (SAS). Thus, a flush command is an important factor to give significant impact on SSD performance.In this paper, we have investigated the impact of a flush command on SSD performance and have conducted in-depth experiments with versatile workloads, using the modified FlashSim simulator. Our performance measurements using PC and server workloads provide several interesting conclusions. First, a cache buffer without a flush command could improve SSD performance as a cache buffer size increases, since more requested data could be handled in the cache buffer. Second, our experiments have revealed that a flush command might give a negative impact on SSD performance. The average response time per request with a flush command is getting worse compared to not supporting the flush command, as cache buffer size increases. Finally, we have proposed the backend flushing scheme to nullify the negative performance impact of the flush command. The backend flushing scheme first writes the requested data into a cache buffer and sends the acknowledgment of the request completion to a host system. Then, it writes back the data in the cache buffer to NAND Flash memory. Thus, the proposed scheme could improve SSD performance since it might reduce the number of the dirty data items in a cache buffer to write back to NAND Flash memory.All these results suggest that a flush command could give a negative impact on SSD performance and our proposed backend flushing scheme could improve the SSD performance while supporting a flush command.  相似文献   

13.
研究一种利用硬件实现片上存储器管理的方法,针对目前交换机最长至9 728 Byte的超长帧存储问题,在交换控制芯片描述符管理方法的基础上,提出一种两级链表的设计方法,即第一级发送队列链表和第二级缓存标签链表,分别用于维护每个端口的帧优先级次序及每个帧的缓存页地址.仿真实验结果证明,该设计方法能有效地管理描述符,可处理超长帧的交换控制芯片.  相似文献   

14.
赖鑫  刘聪  王志英 《计算机工程》2012,38(24):228-234
在线程级猜测中进行数据依赖相关检测时,存在Cache一致性协议无法容忍线程切换引起的Cache块替换等问题。为此,通过分析推测线程数据管理模型,结合推测线程切概率低的特点,提出一种分布-共享式恢复缓冲区结构。该结构在进行Cache一致性检验时结合作废向量和版本优先级寄存器进行数据依赖检测,利用L2 Cache进行推测数据缓冲和恢复以支持推测线程切换。修改SESC模拟器以验证和评估该存储体系结构。实验结果表明,在保持模拟器理想加速比的情况下,该存储体系结构可以较好地支持推测线程切换。  相似文献   

15.
为了实现全球范围内的信息资源共享,美军提出了全球信息栅格(Global Information Grid,GIG),在此基础上,基于GIG的虚拟专用网络(Virtual Private Network,VPN)技术也得到了发展和应用;虚拟专用网络技术在战术级网络和作战单元之间实现了互通,并且,GIG虚拟专用网络技术的可测量性,使GIG得以从服务供应网络拓扑中分离出来;文章首先介绍了2547双重虚拟专用网络的操作,并且研究了它在GIG网络技术中的几种应用情况;其次提出了几种2547双重虚拟专用网络体系结构及其可选取性;研究表明,在大规模IP网络中,2547双重虚拟专用网络的作用十分明显。  相似文献   

16.
介绍了一种求解复杂TSP的蚁群算法,阐述了该算法的基本原理、模型以及实现过程,并介绍了蚁群算法在旅行商问题(TSP)中的应用思路。  相似文献   

17.
关键业务中内存数据库的T树索引优化   总被引:3,自引:0,他引:3  
林鹏  李航  徐学洲 《计算机工程》2004,30(17):75-76,97
在关键业务中,提高DBMS性能的一个途径是把数据库放在主存巾而不是硬盘中,这样便可以设计新的数据结构和算法,来提高内存数据库(MMDB)的效率。该文列举了当前MMDB研究中关于索引结构的一些成果,并设计了一个新的索引结构——T-tail树,最后给出T-tail树的主要算法和这些算法的性能分析。结果表明在内存数据库中,T-tail树具备非常好的性能。  相似文献   

18.
用基于模型的方法获取故障状态下的系统残差,并用一种改进的时序概率比检验进行残差判决,缩短了残差判决的时间.仿真结果表明该方法可以提高故障检测的实时性.  相似文献   

19.
寻求一组能使共同工作方程组收敛的试给参数是确定航空发动机设计点的难点,为克服传统求解方法中,因试给参数与经验密切相关造成方程组收敛率和收敛速度较低的问题,在基本粒子群算法的基础上,综合能加速收敛的收敛因子和具有明确社会性定义的被动聚集压力因子,提出一种新的用于求解发动机共同工作方程组的粒子群算法,并称之为CPCPSO.前者能增加粒子的振幅,减少无效迭代,从而加速算法运行速度;后者能在不增加种群规模的前提下增加种群多样性.经仿真验证,针对两个不同的初始试给参数,CPCPSO算法均能使共同工作方程组收敛,且达到收敛时的总迭代次数更少.结果表明,CPCPSO算法克服了N+1残量法对共同工作方程组初值的依赖性,收敛速度快,试给参数确定更加有效.  相似文献   

20.
三群粒子群优化算法及其在丙烯腈收率软测量中的应用   总被引:4,自引:0,他引:4  
提出了一种三群粒子群优化算法(THSPSO, three sub-swarms particle swarm optimization).该算法将整个粒子群分为三群,第一群粒子朝全局历史最优方向飞行,第二群粒子朝着相反方向飞行,第三群粒子在全局历史最优位置周围随机飞行.分别将该算法和基本粒子群优化算法(PSO, particle swarm optimization)用于一些常用测试函数的优化问题;结果表明,与PSO相比,THSPSO具有更好的优化性能.然后,用THSPSO训练神经网络,并将其用于丙烯腈收率软测量建模,结果显示了三群粒子群优化算法在丙烯腈软测量建模中的可行性与有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号