共查询到10条相似文献,搜索用时 31 毫秒
1.
2.
3.
4.
根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newmark-HHT算法的基础上构建了大规模复杂结构系统的瞬态并行求解体系,不仅实现了计算过程中大量数据的分布式存储,显著改善了数据的内存访存效率;而且实现了计算过程的两层并行,有效改善了通信效率。因此,该计算方法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提升结构瞬态大规模并行计算效率。最后通过典型数值算例验证了该方法的正确性和有效性,并将其应用于某高层建筑,实现其上千万自由度、数万核的结构瞬态并行计算。 相似文献
5.
海洋环境参数的时变特性给海洋环境参数进行直接测量带来了很多挑战,目前主流的方法是通过反演获得海洋环境参数。粒子滤波是一种重要的匹配反演方法。该方法基于贝叶斯定理,通过对海洋环境参数充分采样,能够较精确地计算出环境参数的后验概率,从而取得较好的反演性能。然而粒子滤波匹配反演方法随着粒子数的增大,计算量也急剧增大,为此,文章提出了基于水声模型的多层次并行方法,能够将粒子滤波算法高效映射到多核集群的硬件体系结构中。最后在天河2号超级计算平台进行了粒子滤波算法的并行性能测试,在单节点多核并行测试中取得了87.5%的并行效率,在多节点强扩展测试中,粒子数达到12 288个,在128个计算节点中取得了近110倍的加速性能。 相似文献
6.
行人检测系统涉及交通安全问题,需要很高的鲁棒性,基于单特征结合单核支持向量机的方法效果有限,为解决这一问题,提出采用多特征和多核学习的方法来提升系统的鲁棒性,通过将积分信道特征、多层次导向边缘能量特征和CENTRIST特征分别与直方图交叉核、高斯核和多项式核进行线性组合,采用简单多核学习(Simple MKL)来分别计算核函数的权重系数,将多核学习方法与经典的梯度直方图特征/支持向量机、多尺度梯度直方图特征/直方图交叉核支持向量机和特征融合/直方图交叉核支持向量机的行人检测方法进行比较,实验表明所提出的行人检测算法的鲁棒性有明显提升。 相似文献
7.
8.
9.
为提高网络入侵检测系统(NIDS)在互联网流量和网络攻击数量增长下的性能,进行了在多核处理器上利用并行结构提高NIDS处理能力的研究.首先实现了NIDS在TILERA-GX36众核处理器上的数据并行(RTC)和任务并行(SPL)这两种并行机构方法,实验结果表明众核处理器上丰富的计算资源支持大量并行的NIDS实例,但同时也带来严重的资源竞争和冲突,系统并行化开销大大增加.为此,提出了一种基于共享的RTC方法,即SRTC方法,和已有方法相比,SRTC方法解决了RTC模型内存占用线性增长的问题,同时避免了SPL模型中的线程间通信开销.以开源NIDS软件Snort为基础,在TILERA-GX36众核处理器上对SRTC方法进行了实现和验证,实验结果证明采用SRTC的并行系统获得了类似线性的加速比,当加载超过7000条NIDS真实规则条目时,系统能够处理包长为1K字节的10Gbps的网络流量. 相似文献
10.
基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征方程规模的有效降低,大幅度减少了广义特征方程的求解时间。此外,它还利用计算任务和异构众核集群硬件体系结构映射实现了计算过程的多级并行,不仅有效改善了不同层级的负载均衡,而且通过通信分离有效提高了通信效率。因此,它能够充分利用异构众核分布式存储并行计算机的体系结构特点提升大规模有限元模态并行计算效率。数值算例表明,相比于传统的并行模态综合法,稀疏存储格式模态多级分层并行方法能够大幅度节省内存空间和提高计算效率。 相似文献