首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
提出了一种面向SIMD机器的全局数据自动分割算法,该算法能处理多个非紧嵌折循环嵌套,并且数组下标存取为循环变量的线性式,首先通过数据与迭代映射抽象了计算中的通信方式,然事提出识别规则模式通信模式的形式比条件,接着建立包含对准信息和相应通信开销的数据迭代图,并在数据迭代图的基础上提出了一个启发式算法来计算较优的数据分布和迭代分布,以优化处理单元之间的通信开销,通过发析多个循环嵌套所涉及的多个数组映和  相似文献   

2.
本文在SIMD机器上给出了两个并行选择算法。其一为在树模型上基于归并排序与选中元思想而设计的并行归并选择算法;其二为在共享存贮的机器上基于基数排序的思想而设计的并行基数选择算法,它们的运行时间依次为O(Nkloglogn+n/logn)与0(m(n~c+rlogn)),其中0相似文献   

3.
(m,n)选择问题在多处理器系统上的并行求解是一个具有实际意义的研究课题。单指令多数据流(SIMD)机器是目前一种较为成熟和流行的并行处理系统。本文给出了在立方连接、洗牌交换连接和网孔连接三种典型SIMD机器模型上并行求解(m,n)选择问题的双调选择算法,它们所需的数据比较交换次数均为O(logn logm),数据移动次数分别为O(logn·logm)、O(log~2n)和O(n)~(1/2)。  相似文献   

4.
基于SIMD机器的优化数据传输的并行循环分割   总被引:2,自引:1,他引:2  
本文提出一个基于分布式局存的SIMD机器的循环分割理论体系以优化运算中所需要的数据传输。该体系使用矩阵表示迭代空间、数据空间和数组存取式。我们引入数据传输概念,并建立一个简单有效的数据传输模型来评估数据在全局内存和局部内存之间的传输开销。最后,对于给定的循环嵌套,我们给出一个循环分割算法以获得优化循环块,使得循环嵌套中所需要的数据传输开销最小,并且大大减少了数据传输和计算的同步开销。实验结果证明了  相似文献   

5.
一个向量赋值语句,如A=B C,在任一台SIMD机器上实际执行的结果和通常‘向量运算’的概念有时并不相符。这种现象称为‘不一致性’。机器硬件对不一致性无能为力。在一类SIMD机器上把不确定性(相关冒险)留给软件和(或)用户是正常的处理。关于如何解决不一致性和不确定性问题,文中建议了一种切实可行的解决方案,并给出了编译程序检查一致性的算法。  相似文献   

6.
一、引言 并行处理是提高计算机性能的有效途径,已成为计算机系统结构研究的热点。IMD(单指令多数据流)计算机由M.J.Flynn,在1966年对计算机系  相似文献   

7.
一种快速SIMD浮点乘加器的设计与实现   总被引:2,自引:0,他引:2  
本文设计和实现了5级全流水SIMD浮点乘加器,支持双精度和双单精度浮点乘法、乘累加(减)操作,用Modelsim和NC Verilog测试和验证了RTL代码实现,基于65nm工艺采用Synopsys公司的Design Complier工具综合硬件实现,运行频率可达714.286MHz。结果表明,相比文献[3]中经典的低延迟乘加结构,在相同综合条件下性能提升了17.89%,面积增加了6.61%,功耗降低了25.08%。  相似文献   

8.
何军  黄永勤  朱英 《计算机科学》2013,40(12):15-18,51
如何减少四倍精度浮点运算的硬件开销和延迟是需要解决的重要问题。为减少四倍精度乘加器的硬件开销,基于支持64位×4的双精度浮点SIMD FMA部件,设计并实现了一种新的四倍精度浮点乘加器(QPFMA),来支持4种浮点乘加运算和乘法、加减法、比较运算,运算延迟为7拍。通过将四倍精度113位×113位尾数乘法器分解为4个57位×57位乘法器来共享双精度浮点SIMD FMA部件的53位×53位乘法器,显著减少了实现QPFMA的硬件开销。基于65nm工艺的逻辑综合结果表明,该QPFMA频率可达1.1GHz,面积是常规QPFMA设计的42.71%,仅与一个双精度浮点乘加器相当。与现有的QPFMA设计相比,相当工艺和频率下,其运算延迟减少了3拍,门数减少了65.96%。  相似文献   

9.
本详细地讨论了n-Pancake在栅去不超过2n-4个结点时的连通情况,并由此给出n-Pancake的条件连通度和条件直径,从本可以看出,n-Pancake是一种具有很强连通性的较好的并行网络拓扑结构。  相似文献   

10.
本文就互连网上的银行卡电子支付系统的安全性和完整性进行了探讨。  相似文献   

11.
多媒体处理器的SIMD代码生成   总被引:1,自引:0,他引:1  
通用处理器的SIMD(Single Instruction Multiple Data)多媒体扩展,为提高多媒体应用的性能提供了新的体系结构支持。但目前编译技术对这类指令不能提供很好的支持。本文提出了一个新的SIMD指令生成算法,基于把编译器前端的程序分析和编译器后端的机器信息相结合的思想,采用扩展的treeparsing技术,有效识别程序中的并行操作以生成SIMD指令。基于SUIF(Stanford University Intermediate Format)编译器框架的实验表明,针对一组多媒体kernel,本文提出的算法可平均减少其非SIMD代码47%的cycles。  相似文献   

12.
一种支持SIMD指令的流水化可拆分乘加器结构   总被引:1,自引:0,他引:1  
李东晓 《计算机工程》2006,32(7):264-266
乘加器是媒体数字信号处理器的关键运算部件。该文结合32位数字信号处理器芯片MD32开发(“863”计划)实践,提出了一种流水化可拆分的乘加器硬件实现结构,通过对乘法操作的流水处理实现了200MHz工作频率下的单周期吞吐量指标,通过构造可拆分的数据通道实现了对SIMD乘法指令的支持,支持4个通道16位媒体数据的并行乘法,大大提升了处理器的媒体处理性能。文中对所提出的乘加器体系结构,给出了理论依据和实验结果,通过MD32的流片实现得到了物理验证。  相似文献   

13.
14.
15.
16.
JavaScript是一种网络应用脚本语言,它使得工程师可以利用因特网上已有的服务来低成本地开发多功能的嵌入式设备。Google公司目前正积极地试图借助JavaScript进入嵌入式设备领域。尽管竞争十分激烈,Google仍表现出远超出其它竞争对手的速度。然而,互联网公司与嵌入式设备行业之间存在的巨大鸿沟,或许最终会被证明是这家公司未曾注意到的盲点。  相似文献   

17.
《互联网周刊》2012,(2):66-66
TM(Automatic Teller Maohine)自动柜员机,是一种高度精密的机电一体化装置,利用磁性代码卡或智能卡实现金融交易的自助服务,代替银行柜面人员的工作。持卡人可以使用信用卡或储蓄卡,根据密码办理提取现金、查询存款余额、进行账户之间资金划拨、余额查询等工作;还可以进行现金存款、支票存款、存折补登、中间业务等工作。  相似文献   

18.
归约通讯作为聚合通讯中的一类,是实现数值计算、进程控制的重要手段,在并行处理中应用很广泛。由于归约通讯中有多个源结点主动地发送消息,因此它具有与multicast通讯迥然不同的行为特点。此文即在对归约通讯的行为特点和通讯过程的分析基础上,结合作者于[6]中提出的SBMT广播算法,提出了针对归约通讯的RSBT路由算法,并进一步作出了性能分析。  相似文献   

19.
文章就因特网(INTERNER)互联网应用中的安全漏洞和防范作了简要介绍和讨论。根据网络入侵者(hacker)攻击网络系统的一些基本方法,给出一些建议。  相似文献   

20.
方正推出的基于 ISDN宽带技术的方正卓越 3000家用电脑和基于 ADSL宽带技术的方正卓越 6000家用电脑,为全面整合家用电脑的信息处理能力和 Internet通信能力做出了新的尝试。新一代方正卓越系列家用电脑具有强大的运算能力、完善的 Internet应用功能和高速数据交换技术。基于 ISDN的方正电脑卓越 3000- ISDN系列家用电脑可以帮助用户在普通的电话线上进行全数字通信业务,并且不需要再另外购买安装复杂的 ISDN专用设备,用户就能够实现高速上网、可视电话、网上教育、远程医疗等多种业务。通过一条电话线,用户可以同时打电话…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号