排序方式: 共有45条查询结果,搜索用时 15 毫秒
31.
32.
针对大尺度压缩感知重构算法实时性应用的需要,探讨了基于图形处理器(GPU)的正交匹配追踪算法(OMP)的加速方法及实现。为降低中央处理器与GPU之间传输的高延迟,将整个OMP算法的迭代过程转移到GPU上并行执行。其中,在GPU端根据全局存储器的访问特点,改进CUDA程序使存储访问满足合并访问条件,降低访问延迟。同时,根据流多处理器(SM)的资源条件,增加SM中共享存储器的分配,通过改进线程访问算法来降低bank conflict,提高访存速度。在NVIDIA Tesla K20Xm GPU和Intel(R) E5-2650 CPU上进行了测试,结果表明,算法中耗时长的投影模块、更新权值模块分别可获得32和46倍的加速比,算法整体可获得34倍的加速比。 相似文献
33.
逻辑程序设计语言具有潜在丰富的并行性,但是由于任务并行执行时所需调度、通讯、同步等开销,使得一部分并行执行反而降低了执行效率。本文给出一种粒度分析方法。该方法在静态时通过分析估价出各子目标在单机上运行所需的CPU时间TC,通过TC与基本粒度的比较产生该子句的最佳粒度执行流图BEG(N’,E’),进而在BEG(N’,E’)的基础上对子句CGE进行优化。优化后的并行执行图表达式CGE将具有最好的执行效率。 相似文献
34.
MIOS是一个面向大规模CCNUMA系统设计的新型高可扩展操作系统.MIOS创新地采用了多实例内核结构,每个内核实例执行相同代码,分别独立运行和管理一个处理器,多核间通过分布存储管理构成高可扩展的一致性系统映像空间,支持弱共享进程、线程并行模型.MIOS针对大规模CCNUMA系统特点和高性能并行科学计算应用的需求,采用了显式共享数据分布、层次式任务调度、自适应任务间通信以及寄存器锁等优化.在大规模CCNUMA体系结构的银河深度并行计算机上的测试表明,MIOS对MPI应用具有同传统操作系统类似的性能,并可以有效支持2048处理器规模的OMP应用高效运行,具有良好的系统可扩展性. 相似文献
35.
本文简要分析了当前典型的逻辑程序并行执行模型,提出了一个新的并行执行模型RAP/LOP。它基于OR树林描述,采用动靜相结合方法开发与并行,或并行开发受限处理机个数,以支持逻辑程序的与和或并行性。 相似文献
36.
并行执行方式是影响并行编译器效率的关键因素之一。本文首先介绍两种典型的并行执行方式:支持数据并行语言的SPMD方式和支持任务并行语言的MPMD方式,然后,分析这两种并行执行方式在实现多范式并行语言时所存在的问题。最后,提出一种并的并行执行方式:SPMT。 相似文献
37.
在DSP项目开发中,代码优化是非常重要的环节。本文针对TI公司C6000系列DSP处理芯片的结构特点,阐述了基于C6000硬件结构特点的C语言高效优化方法的原理,提出了展开复杂表达式以达到多指令并行的优化方法,并对其效果进行了对比分析。对语音增强算法项目中所用的一些实际的经验和技巧进行了概括和总结。 相似文献
38.
39.
《信息技术与标准化》2009,(6)
韩国知识经济局(MKE)于2009年5月12日宣布,将修订现行的KC标志认证制度,扩大其适用范围。涉及安全、卫生、环保和质量的13类法定强制认证,将统一采用KC标志认证。自2009年7月1日起,由韩国知识经济部管理的9种法定强制认证将统一为KC标志认证。此外,KC标志认证的适用范围将自2011年1月1日起扩展至其他政府部门管理的法定强制认证,现行认证制度将在KC认证制度实施后两年内与KC认证制度并行执行。 相似文献
40.
本文介绍以SES-PIM系统为工具,对三种不同的逻辑程序执行模型进行对此模拟实验研究的结果。实验表明:PSOF模型能有效地开发确定性和非确定性逻辑程序的AND和OR两种并行性;PSOT模型却只能开发逻辑程序中的OR并行性;而SSOT模型不能开发逻辑程序中的并行性。对于本文使用的五个典型问题,PSOF模型的平均并行度是PSOT模型的3至6倍,是SSOT模型的3至19倍;PSOF模型的搜索速度是PSOT模型的2至6倍,是SSOT模型的3至13倍。 相似文献