首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
为了充分利用多核处理器提供的多级并行和解决多核资源分配问题,提出了一种将多任务并行程序映射到多核处理器平台上的模型驱动的方法。该方法首先创建一个三维优化空间来表示资源分配配置,而后通过搜索该空间为应用生成多种并行机制,最后对各种并行机制进行静态评估从而找出最优的机制。该方法同时考虑了任务并行、数据并行以及通讯开销。在异构多核处理器Cell上利用一个图像处理应用对此方法进行了测试。实验表明,这种模型驱动的方法能够很好地评估性能并为应用确定有效的并行机制。  相似文献   

2.
为降低异构多核处理器芯片的能耗,为非精确异构多核平台提出了一种基于分层调节器的硬件抽象和搜索方法.该方法首先将异构多核硬件及其非精确参数抽象为树状结构,其次使用能效分数标定调节器树,最后在线搜索其路径,为程序的每个算法获得最佳的硬件及其参数配置.实验表明,该方法能够在满足用户精确度需求的前提下,相比于精确CPU核,平均降低40%的能耗,且能够很好地适应精确度需求的变化.  相似文献   

3.
根据国产申威异构众核处理器架构特点,提出了一种结构有限元模态分层通信并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下重大装备系统级模态分析的并行效率具有重要意义.该方法在分层通信策略和加速子空间迭代法的基础上构建了大规模模态分析并行计算体系,不仅实现了计算过程和数据通信的分层,有效提高了通信效率;而且实现了...  相似文献   

4.
根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newmark-HHT算法的基础上构建了大规模复杂结构系统的瞬态并行求解体系,不仅实现了计算过程中大量数据的分布式存储,显著改善了数据的内存访存效率;而且实现了计算过程的两层并行,有效改善了通信效率。因此,该计算方法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提升结构瞬态大规模并行计算效率。最后通过典型数值算例验证了该方法的正确性和有效性,并将其应用于某高层建筑,实现其上千万自由度、数万核的结构瞬态并行计算。  相似文献   

5.
马树青  蓝强  朱勋江  邱伟  颜冰 《声学技术》2023,42(5):588-593
海洋环境参数的时变特性给海洋环境参数进行直接测量带来了很多挑战,目前主流的方法是通过反演获得海洋环境参数。粒子滤波是一种重要的匹配反演方法。该方法基于贝叶斯定理,通过对海洋环境参数充分采样,能够较精确地计算出环境参数的后验概率,从而取得较好的反演性能。然而粒子滤波匹配反演方法随着粒子数的增大,计算量也急剧增大,为此,文章提出了基于水声模型的多层次并行方法,能够将粒子滤波算法高效映射到多核集群的硬件体系结构中。最后在天河2号超级计算平台进行了粒子滤波算法的并行性能测试,在单节点多核并行测试中取得了87.5%的并行效率,在多节点强扩展测试中,粒子数达到12 288个,在128个计算节点中取得了近110倍的加速性能。  相似文献   

6.
行人检测系统涉及交通安全问题,需要很高的鲁棒性,基于单特征结合单核支持向量机的方法效果有限,为解决这一问题,提出采用多特征和多核学习的方法来提升系统的鲁棒性,通过将积分信道特征、多层次导向边缘能量特征和CENTRIST特征分别与直方图交叉核、高斯核和多项式核进行线性组合,采用简单多核学习(Simple MKL)来分别计算核函数的权重系数,将多核学习方法与经典的梯度直方图特征/支持向量机、多尺度梯度直方图特征/直方图交叉核支持向量机和特征融合/直方图交叉核支持向量机的行人检测方法进行比较,实验表明所提出的行人检测算法的鲁棒性有明显提升。  相似文献   

7.
基于多核的OpenMp并行程序设计   总被引:1,自引:0,他引:1  
彭曦  顾炳根  李展涛 《硅谷》2010,(16):97-98
介绍多核计算的出现和一种面向共享存储器的多处理器多线程并行编程语言OpenMp,然后再以一个实例来说明OpenMp在多核下如何进行并行程序设计,通过计算加速比说明使用OpenMp编程后程序执行效率得到显著提高。  相似文献   

8.
针对传统基于SVM分类器的多核学习方法优化参数多、优化过程复杂、计算量大的缺点,本文提出基于Real Adaboost的多核学习方法解决通用目标分类与识别问题.该方法根据核函数能将高维特征映射到低维空间的特性,采用核函数空间上的线性平面分割构建弱分类器,并用Real Adaboost学习框架对弱分类器进行学习.先用分层...  相似文献   

9.
为提高网络入侵检测系统(NIDS)在互联网流量和网络攻击数量增长下的性能,进行了在多核处理器上利用并行结构提高NIDS处理能力的研究.首先实现了NIDS在TILERA-GX36众核处理器上的数据并行(RTC)和任务并行(SPL)这两种并行机构方法,实验结果表明众核处理器上丰富的计算资源支持大量并行的NIDS实例,但同时也带来严重的资源竞争和冲突,系统并行化开销大大增加.为此,提出了一种基于共享的RTC方法,即SRTC方法,和已有方法相比,SRTC方法解决了RTC模型内存占用线性增长的问题,同时避免了SPL模型中的线程间通信开销.以开源NIDS软件Snort为基础,在TILERA-GX36众核处理器上对SRTC方法进行了实现和验证,实验结果证明采用SRTC的并行系统获得了类似线性的加速比,当加载超过7000条NIDS真实规则条目时,系统能够处理包长为1K字节的10Gbps的网络流量.  相似文献   

10.
基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征方程规模的有效降低,大幅度减少了广义特征方程的求解时间。此外,它还利用计算任务和异构众核集群硬件体系结构映射实现了计算过程的多级并行,不仅有效改善了不同层级的负载均衡,而且通过通信分离有效提高了通信效率。因此,它能够充分利用异构众核分布式存储并行计算机的体系结构特点提升大规模有限元模态并行计算效率。数值算例表明,相比于传统的并行模态综合法,稀疏存储格式模态多级分层并行方法能够大幅度节省内存空间和提高计算效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号