首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
在H.264视频解码中,去块滤波是运算量很大的一部分.由于去块滤波过程中,数据之间存在复杂的依赖性,现有的很多去块滤波并行方案存在着并行度小、同步互斥开销大的缺点.本文结合去块滤波算法及众核处理器Godson-T的结构特性,提出了一种可以减少数据依赖的去块滤波算法并行优化方案.相对于以前的很多方法,此并行方案首先在算法上增大了并行度,减少了同步开销,同时,我们通过片上众核处理器Godson-T的硬件支持,采用计算与通信重叠等优化策略,使得优化后的算法达到了数倍的性能提升.  相似文献   

2.
众核处理器片上同步机制和评估方法研究   总被引:1,自引:0,他引:1  
同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.针对片上众核体系结构,提出并实现了两种粗粒度同步机制和一种细粒度同步机制,即片上专用硬件支持的同步机制、基于原语的片上互斥访问同步机制和基于满空标志位的细粒度同步机制;提出了粗粒度同步机制的评估标准和评估方法,并设计了量化评估程序.以片上同构众核处理器Godson-T模拟器和AMD Opteron商业片上多核处理器为平台,评估比较了提出的硬件支持的同步机制与基于原语的同步机制的性能.结果表明,硬件支持可以使得片上众核处理器的同步机制性能明显提高;在传统基于原语的同步机制中,大部分性能损失是由于负载不平衡和同步点的串行化操作而造成的等待时间.  相似文献   

3.
叶笑春  林伟  范东睿  张浩 《软件学报》2010,21(12):3094-3105
在生物信息学中,蛋白质序列比对是最为重要的算法之一,生物技术的发展使得已知的序列库变得越来越庞大,这类算法本身又具有计算密集型的特点,这导致进行序列比对所消耗的时间也越来越长,目前的单核或者数量较少的多核系统均已经难以满足对计算速度的要求.Godson-T是一个包含诸多创新结构的众核平台,在该系统上实现了对一种蛋白质序列比对算法的并行化,并且结合蛋白质比对算法以及Godson-T结构的特征,针对同步开销、存储访问竞争以及负载均衡3个方面对算法进行了细致的优化,最终并行部分整体也获得了更优的、接近线性的加速比,并且实际性能远远优于基于AMD Opteron处理器的工作站平台.  相似文献   

4.
在机器视觉在线检测系统中,使用数据缓冲队列技术可以提升系统检测速度的上限.但由于队列在同步数据过程中,可能发生满阻塞和互斥阻塞的情况,这样又降低了数据缓冲队列带来的性能提升.为此提出一种链式复合结构,消除队列在同步数据时的阻塞问题.针对机器视觉系统中,相机成像与图像处理之间的单生产者/单消费者并发模型,实现了对图像数据的非阻塞同步,运行效率达到了wait-free级别,避免了各类阻塞给队列带来的性能损失.将该复合结构应用于雪糕棒表面缺陷在线检测系统中,经测试该方法可有效提高视觉检测系统的运行效率和鲁棒性.  相似文献   

5.
为了准确快速地采集等离子体I-V特性数据,设计了一个双通道同步数据采集系统.详细阐述了系统的功能、结构和具体实现过程.系统由ARM、FPGA、双通道ADC、两片高速FIFO和USB 2.0控制器组成,可实现对双通道信号的同步采集,并对采集数据进行准确地缓存处理和高速传输.实验分析结果表明,该系统达到了预期设计要求.  相似文献   

6.
大规模的数据存取是制约数字信号处理器系统效率的主要因素之一。在传像光纤束成像系统中,为提高出端光纤束在光纤中心定位过程中数据存取的效率,提出DM642平台下的光纤中心定位优化方法。在存储器配置方面,设置二级储存器缓存与片内随机存储器的模式,预取部分片外数据到片内随机存储器。在数据传输方面,设计数据存储动态偏移量,自适应迭代,避免重复读入。实验结果表明,优化后的算法实现了光纤中心的定位,时间开销降低了1/4,提高了系统的运行效率。  相似文献   

7.
数据流编程模型将程序设计与媒体处理相结合,已大量应用到各个领域.众核处理器已经成为主流和工业标准,如何利用众核架构的特性来提高流应用执行性能已成为目前研究工作的一大难点.文中提出了一个高效的流编译框架来优化流应用的执行,该框架包含3个优化策略:设计一个最优的软件流水调度方法;提出一个高效的数据存储分配算法;并采用合理的众核间的映射策略,减小通信以及同步的开销.文中在Godson-T上实现了该编译器框架,实验结果表明,该方法比优化前有较大性能改进.  相似文献   

8.
多核处理器YHFT-QDSP的调试系统   总被引:3,自引:1,他引:2       下载免费PDF全文
YHFT-QDSP是一款多核处理器。为满足其并发调试和实时调试的需要,在原有单核调试系统的基础上设计实现了多核同步调试系统和片上实时追踪系统(片上Trace)。多核同步调试提供了命令广播和断点同步触发等并发程序协同调试的功能;片上Trace通过专用硬件记录程序执行路径和数据读写等信息实现非入侵实时调试。本文从原理、结构和
软硬件实现等方面介绍了该调试系统。  相似文献   

9.
大规模片上系统面临着性能、同步、能耗等方面的通信问题,片上网络为复杂的片上系统通信问题提供了一种有效的解决方案。由于网络拓扑优化是一种NP难问题,针对片上系统主要面向特定应用的特点,提出一种基于两级遗传算法来求解特定应用片上网络的拓扑优化问题近似解。实验结果表明,相对于现有的三级遗传,两级遗传算法在最小能耗上平均有1.1%的改进,而且仿真运行时间大大减少,平均减少97%.  相似文献   

10.
时钟同步与能耗有效性是无线传感器网络多跳传输关键问题.提出一种自适应唤醒算法,在MAC层和网络层进行跨层优化,节点按需自适应唤醒,实现多跳网络的协同传输,能够有效降低系统能耗.该算法不需要节点间的周期性同步,减少了频繁的包交换带来的数据冲突与能量浪费,从而提高了网络可靠性和能耗效率,提高了基于IEEE802.15.4标准的多跳网络的节能效率.为了验证算法有效性,工作分别在NS-2仿真环境和实际应用场景下进行了仿真与测试验证,结果表明在传输可靠性和节能效率上均由较大提高.跨层自适应唤醒算法可进一步推广到大规模异构自组织网络中.  相似文献   

11.
Moore’s law will grant computer architects ever more transistors for the foreseeable future, and the challenge is how to use them to deliver efficient performance and flexible programmability. We propose a many-core architecture, Godson-T, to attack this challenge. On the one hand, Godson-T features a region-based cache coherence protocol, asynchronous data transfer agents and hardware-supported synchronization mechanisms, to provide full potential for the high efficiency of the on-chip resource utilization. On the other hand, Godson-T features a highly efficient runtime system, a Pthreads-like programming model, and versatile parallel libraries, which make this many-core design flexibly programmable. This hardware/software cooperating design methodology bridges the high-end computing with mass programmers. Experimental evaluations are conducted on a cycle-accurate simulator of Godson-T. The results show that the proposed architecture has good scalability, fast synchronization, high computational efficiency, and flexible programmability.  相似文献   

12.
周琰 《计算机系统应用》2013,22(10):124-128
Godson-T缓存一致性协议是用于Godson-T众核处理器的缓存一致性协议.在Godson-T协议中,缓存一致性协议和存储一致性模型存在紧密的紧耦合关系,分析协议的一致性时发现该协议满足的缓存一致性不是强一致性,不满足传统意义上缓存透明的一致性要求.我们选取了Murphi模型检测工具作为我们建模的语言和验证工具.在对Godson-T缓存一致性协议建模的时候,由于协议的上述特点,我们需要对处理器核结点,高速缓存和内存作为一个整体建模,并成功地验证了协议的相关性质.  相似文献   

13.
随着Computer Science和IT技术的迅速发展,计算机及网络技术已经逐步渗透进入人们的日常生活,但是目前由于网络具有的开放性和共享性,也导致了木马、黑客、计算机病毒等恶意程序的入侵,给计算机安全甚至计算机使用者的人身安全、财产安全都带来了极大地威胁,因此应对计算机网络安全漏洞势在必行.本文就目前计算机网络安全问题进行了分类并分析了其成因,还探讨了一些针对计算机网络安全问题的解决方案,为大家提供一定的借鉴意义.  相似文献   

14.
Godson-T众核处理器的RCC高速缓存一致性协议是一种非常有特色的带参并发系统,对此协议的带参验证是一个很大的挑战。 Cubicle是最近出现的基于SMT求解器的带参模型检测工具。我们使用了Cubicle带参模型检测工具,成功对RCC协议进行了建模和验证。实验结果表明, RCC协议在结点个数为任意规模时均满足协议的各种安全性质。  相似文献   

15.
为解决协同工作过程中CAPP系统与其它计算机辅助系统及企业管理信息系统之间的信息集成和数据共享问题,使CAPP系统能够适应协同工作的需求,提出了基于PDM的CAPP系统信息集成策略.对CAPP系统的功能结构进行了改进并对其特点进行了分析.较之传统的信息集成方法,该策略提高了CAPP系统的运行效率,更好地保护了产品数据的一致性和完整性,并为企业实现产品全生命周期信息集成提供了解决方案.通过企业应用实例证明了该方法的正确性和有效性.  相似文献   

16.
The advent of multi-core/many-core chip technology offers both an extraordinary opportunity and a profound challenge. In particular, computer architects and system software designers are faced with a unique opportunity to introducing new architecture features as well as adequate compiler technology — together they may have profound impact. This paper presents a case study (using the 1-D Jacobi computation) of compiler-amendable performance optimization techniques on a many-core architecture Godson-T. Godson-T architecture has several unique features that are chosen for this study: 1) chip-level global addressable memory in particular the scratchpad memories (SPM) local to the processing cores; 2) fine-grain memory based synchronization (e.g., full-empty bit for fine-grain synchronization). Leveraging state-of-the-art performance optimization methods for 1-D stencil parallelization (e.g., timed tiling and variants), we developed and implement a number of many-core-based optimization for Godson-T. Our experimental study shows good performance in both execution time speedup and scalability, validate the value of globally accessed SPM and fine-grain synchronization mechanism (full-empty bits) under the Godson-T, and provides some useful guidelines for future compiler technology of many-core chip architectures.  相似文献   

17.
为解决计算机取证系统现有方案中没有考虑到取证信息可能在传输过程中及取证服务器中被破坏这一安全性问题,提出了基于Shamir秘密共享的安全取证服务器方案。方案首次将Shamir秘密共享的思想引入计算机取证中,利用Shamir(n,t)算法共享取证信息m成n份,然后将n份信息传输并分别储存于n个独立的服务器,从而有效提高了取证信息在传输过程、存储过程及存储区内的安全性。n个独立的取证存储区使系统可以在取证存储区的破坏数不超过n-t时仍能完成取证审计,提高了取证信息在取证服务器中的安全性,增强了系统的容错、容侵性能。  相似文献   

18.
计算机网络的开放性和共享性给人们带来了极大的便利,然而针对网络系统的攻击并造成经济损失的现象时有发生,安全问题日趋严重。本文分析常见网络攻击手段和特点,提出一些建议和防范措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号