首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
描述了针对异构多核处理器的编译器Shangri-la基于Whirl2c构建统一编译后端框架采用的编译器的聚集技术,介绍了它采用的地址转换方法来解决聚集时不同寻址方式面临的指针共享问题。这些技术的运用使Shangri-la很好地整合了两种不同内核的编译工作。这种统一的编译平台使得网络程序员从传统繁琐的网络程序编写方式中解放出来。  相似文献   

2.
在如今这个信息技术高速发展的时代,嵌入式技术已经在国内各大领域中广泛被应用,并逐渐成为各种移动设备中最为主要的应用技术.由于Java有着非常多的优点,因此成为最近几年社会中广泛认可并且使用的一种编程语言.本文通过对多核处理器中仿真问题的讨论,对异构多核系统方面存在的相关问题进行了一次研究,并将其性能测试相关问题进行了分析.  相似文献   

3.
输入输出系统(I/O系统)作为计算机系统中的一个重要组成部分,其性能的好坏对CPU的性能有很大的影响,因此本文从I/O系统基本概述开始介绍,并采用了模型模拟和实际测量的方法来衡量I/O系统性能,并做了相关的评价分析.  相似文献   

4.
传统操作系统核内驱动的I/O结构无法满足嵌入式操作系统的需要,核外I/O技术的实现难点是如何将外部中断从核内引向核外,分析了基于信号机制的核外I/O的实现方法,并提出了一种由系统核心ISR直接跳转到核外驱动程序ISR的核外硬中断方法及其实现方法。  相似文献   

5.
异构多核处理器体系结构设计研究   总被引:2,自引:0,他引:2  
多核技术成为当今处理器发展的重要方向,异构多核处理器由于可将不同类型的计算任务分配到不同类型的处理器核上并行处理,从而为不同需求的应用提供更加灵活、高效的处理机制而成为当今研究的热点.本文从体系结构的角度探讨了异构多核处理器设计中的关键点,从内核结构、互连方式、存储系统、操作系统支持、测试与验证、动态电压调节等方面分析...  相似文献   

6.
众核处理器中I/O资源被多个处理器核所共享。I/O虚拟化实现了I/O资源的高效共享和安全隔离,被越来越多的处理器设计所采用。硬件支持的I/O虚拟化从体系结构设计时就考虑对I/O虚拟化的支持,提供了一个全面、高效的I/O虚拟化的解决方案。深入研究了硬件支持I/O虚拟化的两大关键技术——DMA重映射技术和中断重定向技术,提出了基于Hint的IOTSB Cache管理方法和基于失效队列的失效方法来对DMA重映射进行优化,提出了多层可操控的中断模型和灵活可控的中断重定向实现方法来对I/O中断重定向进行优化。测试结果表明,提出的硬件支持的I/O虚拟化优化方法以很低的I/O性能开销实现了I/O资源的高效共享,提供了几乎接近无虚拟化环境下的I/O性能。  相似文献   

7.
一种异构多核处理器嵌入式实时操作系统构架设计   总被引:2,自引:1,他引:2  
由于异构多核处理器和多处理器系统及同构多核处理器的构架存在很大差别,应用于多处理器系统的分布式结构以及应用于同构多核系统的主从式结构操作系统不能解决异构多核处理器的实时调度和效率问题。对异构多核处理器的特点及发展趋势进行了研究,提出了一种适用异构多核处理器的多主模式实时操作系统构架。这种构架将通信总线中的多主模式引入多核操作系统构架中,采用对称式结构及组件模式设计操作系统模型,使多核处理器中每个内核都可以作为主核实现对资源、任务的实时管理,提高系统性能,同时可以解决主从式操作系统存在的由于处理器核增多而带来的主内核不能满足系统性能要求的瓶颈问题。通过这种单一构架模型可以进行灵活配置,以适应不同结构及功能要求的处理器内核,降低操作系统开发难度。  相似文献   

8.
为满足应用程序的多样性需求,提高异构多核环境下的任务调度效率,基于麻雀搜索算法(Sparrow Search Algorithm, SSA),提出一种新的异构多核处理器任务调度算法。该问题是以执行任务完成的时间最短为目标,并使用SSA对其优化。根据任务优先权规则,设计任务分配编码方案,将麻雀搜索空间映射到离散空间,使麻雀搜索算法更能适用于离散的异构多核任务调度问题研究上。实验表明,SSA寻优能力强、收敛速度快、性能好。与目前应用广泛的GA和IPSO相比较,其执行时间分别缩短21.48%和17.52%。在异构多核处理器任务调度领域中具有良好的研究意义,应用前景十分广泛。  相似文献   

9.
罗殊彦  朱怡安  曾诚 《计算机科学》2018,45(Z6):262-265, 274
随着嵌入式技术的不断发展,越来越多的平台采用异构多核处理器(Heterogeneous Multi-Processor Unit,HMPU)进行高性能计算,但多核处理器的核间通信效率严格地制约着系统的高性能计算能力。针对HMPU的核间通信性能难以量化的问题,提出了基于通信粒度、通信缓存和消息传输机制的阶段评价模型,并通过实验验证了这3个影响因子对不同阶段的核间通信性能的影响。此外,由于嵌入式系统环境多变、资源有限,使得静态通信策略对系统性能优化具有局限性。针对该问题,提出了基于系统内存约束、时间约束和性能目标的动态通信策略优化模型(Dynamic Communication Strategy Optimization Model,DCSOM)。通过实验证明:在数据量较小、通信周期较长的异构多核处理器中,DCSOM更具优越性。  相似文献   

10.
随着NOW在科学研究中白益广泛的应用,如何为NOW上的科学计算提供高性能的输入输出成为我们面临的一个新课题。作者根据NOW的特点,设计并实现了一个具有NOW特色的基于CollectiveI/Q的并行I/O系统,吸取了DDIO与two-phaseI/O的优点,从而有效地解决了高带宽和低延迟问题。初步的系统吞吐量测试显示了良好的性能。  相似文献   

11.
可扩展并行处理机系统有两个需要解决的问题:(1)多级互连网络的延迟;(2)吞吐能力;本文根据SPP体系结构的特点和实际应用的需要提出了解决这两个瓶颈问题的有效方法在前端服务器与共享存储器之间设计专用的并行I/O处理机作为系统I/O设备与SM/SSM的直接数据通路。  相似文献   

12.
侯昉  赵跃龙  王禹 《计算机应用研究》2011,28(12):4546-4549
对目前主流操作系统的文件大小分布和空间占用、网络文件服务环境下的文件读取请求和视频下载点播等典型应用进行了统计分析,总结了对交换文件、小尺寸文件和访问集中文件进行优化的必要性和可行性.基于目前已有的存储器件,提出了基于统计结果的混合加速外存储体系结构及相应的调度算法.实验结果表明,可以缩短I/O响应时间,提高传输率,改善系统性能.  相似文献   

13.
I/O和网络开销是数据库系统主要的性能瓶颈,本文针对数据库I/O请求的特点,讨论在大量并发I/O请求到来的情况下如何有效地对这些I/O请求进行重组、排序和合并,以便提高数据库系统的总体性能。  相似文献   

14.
并行处理机外围子系统的设计和实现技术直接影响整个系统的性能价格比,本文根据SPP体系结构的特点和实际应用需要,在前端服务器与SM/SSM之间设计了专用的I/O处理机,使得系统I/O设备与SM/SSM之间直接进行高速数据传送,从而大大提高系统的I/O性能。在I/O处理机的设计中,采用了i860+82380+SRAM的总体结构,从而实现了处理机访问主存和DMA控制器访问SRAM之间的并行。  相似文献   

15.
一个基于NOW的并行I/O系统   总被引:1,自引:0,他引:1  
李冀  陈晓林  陆桑璐  陈贵海  谢立 《软件学报》2001,12(11):1654-1659
随着NOW(networksofworkstations)在科学研究中的应用日益广泛,如何为NOW上的科学计算提供高性能的输入、输出成为人们所面临的一个新课题.根据NOW的特点,设计并实现了一个具有NOW特色的采用CollectiveI/O技术的并行I/O系统CION(collectiveI/Oonnowsystem).CION吸取了DDIO(disk-directedI/O)与two-phaseI/O的优点,同时采用了数据筛选等一系列优化技术.初步的测试已经显示了良好的系统性能.  相似文献   

16.
详细分析Windows的I/O机制,提出了分别在用户级、系统级、驱动级的I/O模拟操作,通过实际案例和源代码分享在I/O模拟上的得失,着重介绍鼠标与键盘的模拟。  相似文献   

17.
VOD服务器的I/O带宽是影响VOD系统性能的关键因素。如何通过使多个用户请求共享一个I/O流,减少对I/O带宽的要求是VOD研究领域中的研究热点之一。文章对VOD服务器中共享I/O流的基本技术Batching、AdaptivePiggybacking、Bridging和Chaining进行了全面的讨论,并对当前的研究现状进行介绍。  相似文献   

18.
本文对MPI-IO库中Collective I/O的实现算法Two-phase I/O提出了改进。通过选取主联络进程来减少第一阶段进程间的通信量,从而减少Two-phase I/O方法在通信过程中的时间消耗,提高了整体的I/O性能。  相似文献   

19.
In this paper, we study I/O server placement for optimizing parallel I/O performance on switch-based clusters, which typically adopt irregular network topologies to allow construction of scalable systems with incremental expansion capability. Finding optimal solution to this problem is computationally intractable. We quantified the number of messages travelling through each network link by a workload function, and developed three heuristic algorithms to find good solutions based on the values of the workload function. The maximum-workload-based heuristic chooses the locations for I/O nodes in order to minimize the maximum value of the workload function. The distance-based heuristic aims to minimize the average distance between the compute nodes and I/O nodes, which is equivalent to minimizing average workload on the network links. The load-balance-based heuristic balances the workload on the links based on a recursive traversal of the routing tree for the network. Our simulation results demonstrate performance advantage of our algorithms over a number of algorithms commonly used in existing parallel systems. In particular, the load-balance-based algorithm is superior to the other algorithms in most cases, with improvement ratio of 10 to 95% in terms of parallel I/O throughput.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号