首页 | 官方网站   微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   34篇
  免费   6篇
  国内免费   9篇
工业技术   49篇
  2021年   1篇
  2020年   1篇
  2012年   1篇
  2008年   3篇
  2007年   4篇
  2006年   4篇
  2005年   3篇
  2004年   2篇
  2002年   5篇
  2001年   1篇
  2000年   6篇
  1999年   5篇
  1998年   4篇
  1997年   2篇
  1996年   3篇
  1991年   2篇
  1983年   1篇
  1980年   1篇
排序方式: 共有49条查询结果,搜索用时 15 毫秒
11.
过程繁衍及其实现方法   总被引:3,自引:2,他引:1  
过程的处理在并行化编译工具中是十分关键的问题,过程嵌入和跨过程信息传播是常用的解决方法.近年来,兼有前二者优点的新技术:过程繁衍(Cloning),逐渐受到人们的重视.而以往的研究中,过程繁衍仅局限于常数值的传播.本文提出了在过程繁衍中进行符号等式约束信息传播的方法,该方法可以增强系统中全局的符号分析(SymbolicAnalysis)能力,并可与一些新技术(如Omega测试)互相配合,从而提高并行化系统的能力.该方法在作者开发的并行化编译工具AFT中得到了实现.对于PerfectBenchmark的测试  相似文献   
12.
多媒体程序中消除控制相关的技术研究   总被引:1,自引:0,他引:1  
随着多媒体应用的快速发展,最大程度地提升多媒体程序的性能逐渐变为计算机领域研究的热点。硬件平台和多媒体程序的特点是该领域研究需要关注的两个主要方面,当前的主流桌面处理器在提升主频的同时也增大了分支预测失误的开销,而多媒体应用程序中分支语句的大量使用进一步增大了分支预测失误的概率。我们在优化多媒体程序测试试包BMW(Berkeley Multimedia Workload)过程中发现,通过消除程序中的控制相关,尽量减少程序中的分支指令可以显著地提升程序的性能。本文首先讨论了多媒体程序中消除控制相关的一些基本优化方法。针对当前主流处理器引入多媒体扩展指令集来优化程序的趋势,本文进一步总结了在SIMD架构下使用多媒体扩展指令集消除控制相关的 方法。这两方面的优化方法应用到实际程序中,得到的平均性能提升分别为7%和26%。  相似文献   
13.
Parallelizing compilers have made great progress in recent years.However,there still remains a gap between the current ability of parallelizing compilers and their final goals.In order to achieve the maximum,parallelism,run-time techniques were used in parallelizing compilers during last few years.First,this paper presents a basic run-time prviation method.The definition of run-time dead code,backward data-flow information must be used.Proteus Test,which can use backward information in run-time,is then presented to exploit more dynamic parallelism.Also.a variation of Protus Test,the Advanced Proteus Test,is offered to achieve partial parallelism.Proteus Test was implemented on the parallelizing compiler AFT.In the end of this paper the program fppp.f of Spec95fp Benchmark is taken as an example,to show the effectiveness of Proteus Test.  相似文献   
14.
本文介绍了一种基于二级网络互联、二级共享存储、三级I/O通道的可缩放共享存储多机系统SMMP(ScalableMemory-sharedMulti-Processing)体系结构。另外还详细介绍了具有信息就地加工能力的共享存储器的设计。由于共享存储器不仅具有存储信息的能力,而且能对有关信息进行就地处理,所以利用该特点能方便有效地实现操作系统中的同步与互斥原语,同时也为某些应用工程中的并行、迭加运算提供了极其有效的操作。经初步测算表明该系统并行与同步效率高,I/O吞吐量大,具有较高的性能/价格比,可应用于科学计算、图象处理、三维实体造型、地震数据处理等领域,亦可用作客户机/服务器网络环境下的超级网络服务器。  相似文献   
15.
利用U模变换增加并行粒度与改善数据访问局部性的方法   总被引:3,自引:0,他引:3  
提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法,该方法利用了给定二重循环的相关向量集的某些性质,将外层循环变量不同而内层循环变量相等的若干次迭代合并,成为折叠后迭代空间的一个结点,并且保持内层循环的并行性不变,从而达到增加循环并行粒度的目的。对于更普遍的情况,该文讨论了如何根据给定循环的循环向量集,确定一个U模变换对迭代空间进行变换,达到内层循环可并行和扩大循环粒度两个目的,针对循环变换中数据访问局部性可能变差的问题,该文提出了对内层循环先合并,根据合并后的相关向量集变换迭代空间,以及折叠迭代空间的方法,该文的方法是Wavefront循环并行化方法的一种扩展。  相似文献   
16.
从变量的初始化中获取指针指向信息完整的指针分析不可缺少的一个重要环节,它有助于提高其它数据流分析的准确性,文中提出了一个实用的从变量的初始化中获取指针同信息的方法,在此方法中,变量的初始化首先被转换成语义等价的语句序列,然后在指针分析的过程中融入对这些语句序列的分析而求取出相关的指针指向信息,这个方法被实现天复旦大学并行处理研究开发的C程序分析工具Agassiz系统内,实验数据说明是非常有效。  相似文献   
17.
有效的数组私有化方法:相关-覆盖方法   总被引:5,自引:0,他引:5  
数组私有化是并行化编译中的重要技术,该方针对现有数级私有化方法的不足,分析了数组私有化的本质,提出了一个数组私有方法:相关-覆盖方法。它将相关性分析技术和数据覆盖技术有机地结合在一起,具有了执行效率高、处理能力强、独立于数据表示的特点。  相似文献   
18.
并行化编译中递归标量的优化处理*   总被引:2,自引:0,他引:2  
提出了一种并行化编译中统一处理递归标量的通用方法.该方法将递归标量的处理转化为差分方程(组)的求解,然后利用Z变换与反Z变换来求解方程(组).提高了并行化编译器对递归标量的处理能力,有利于对串行程序的自动并行化.  相似文献   
19.
针对目前二维SIMD结构编译技术研究的不足,结合二维SIMD结构中普遍采用的复用数据通路和寄存器少的限制和应用程序的特点,提出了一种解决数据向量复用的算法.该算法先使用数据向量的代表元计算各SIMD指令间数据向量的重用信息,再根据这些信息对SIMD指令进行调度.该算法可以有效缓解应用程序在二维SIMD结构执行时加载数据的压力,有效提高结构受限二维SIMD结构的并行性.实验数据显示,该算法对各种应用程序可获得平均2.97的加速比和平均3.86的SIMD指令级并行度.  相似文献   
20.
数据划分是在当前主流高性能计算平台上高效并行化应用程序的关键技术,它包括数据分割和处理机分配两个主要部分.Line-Sweep计算模式被众多科学工程计算核心采用,目前该计算模式的并行化主要采用多重数据划分.多重数据划分能保证各处理机的计算量、访存量和通讯量相等,但在某些情况下也会导致访存量和通讯量过多,因此无法保证性能最优.为解决这一缺陷,文中提出均衡数据划分,进一步放松对数据分割和处理器分配的非本质约束,以利于在计算、访存和通讯这3种开销之间达到最佳平衡.文中给出生成最佳均衡数据划分的算法,它包含3个关键技术:首先建立性能模型,在该模型中均衡数据划分的性能只与数据分割方式有关;接着基于该模型缩减数据分割方式的搜索空间,并以该模型为判据搜索性能最佳的数据分割方式;最后设计处理机分配函数以满足均衡数据划分的条件.均衡数据划分被应用于NPB并行测试包中的SP程序和高分子材料计算程序LineABC.实验结果表明,当均衡数据划分与多重数据划分的数据分割方式相同时,二者性能基本一致;当两种数据分割方式不同时(对于SP和LineABC,这种情况所占比例分别高达38.7%和37.9%),采用均衡数据划分的SP程序和LineABC程序的并行效率比多重数据划分平均分别高出44.45%和22.15%.  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号