期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

贾迅李娟《湖南工业职业技术学院学报》2019,19(4)

相似文献

2.

贾迅《硅谷》2014,(5):38-38,43

目前,我国3G无线通信网络处于稳定发展时期,人们开始享受3G网络带宽高、速度快的新型服务。如何能够确保3G无线通信网络不受到安全威胁成为了信息安全领域关注的热点问题。文章在分析3G无线通信网络面临的安全风险基础上,提出了一系列安全防范策略,具有一定的理论参考意义。相似文献

3.

申威处理器硬件数据预取技术的实现

贾迅胡向东尹飞《计算机工程与科学》2015,37(11):2013-2017

硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是硬件预取技术实现中的主要难点。借鉴学术界对硬件预取技术的研究成果和工业界的应用现状,紧密结合申威处理器的结构特点,研究了申威处理器硬件预取技术的实现方法。以流预取为例,在处理器核心面积增加0.97%的情况下,硬件预取技术的应用可以将目前申威处理器的整数性能平均提升5.17%,最高提升28.88%;浮点性能平均提升6.39%,最高提升30.11%。相似文献

4.

矩阵乘协处理器上BLAS level-3运算的设计

贾迅钱磊原昊张昆吴东《计算机工程与科学》2020,42(11):1913-1921

BLAS level 3运算的计算复杂度较高,其往往成为应用的性能瓶颈。采用线性阵列结构的矩阵乘协处理器可实现高性能、高效的矩阵乘运算。在矩阵乘协处理器上高效实现BLAS level 3运算,对大规模科学与工程仿真应用的计算加速至关重要。以矩阵乘为核心运算,结合线性阵列的结构特点,提出了矩阵乘协处理器上BLAS level 3运算的设计,并构建了相应的性能分析模型。实验结果表明,矩阵乘协处理器上SYMM、SYRK和TRMM运算的计算效率分别达到了99%,98%和80%,与SW26010和NVIDIA V100 GPU上矩阵运算的计算效率相比,最高提升了31%。相似文献

5.

大规模三角线性方程的高效求解

贾迅邬贵明钱磊谢向辉吴东《计算机工程与科学》2019,41(2):240-245

大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至关重要。以矩阵乘计算效率较高的矩阵乘协处理器为计算平台,针对其结构特点提出了矩阵乘协处理器上大规模三角线性方程分块求解的实现方法和性能分析模型。实验结果表明,矩阵乘协处理器上大规模三角线性方程求解的计算效率最高可达85.9%,其实际性能和资源利用率分别为同等工艺下GPU的2.42倍和10.72倍。相似文献

6.

FPGA应用于高性能计算的研究现状和未来挑战

贾迅钱磊邬贵明吴东谢向辉《计算机科学》2019,46(11)

相似文献

7.

双精度浮点矩阵乘协处理器研究

贾迅邬贵明谢向辉吴东《计算机研究与发展》2019,56(2)

相似文献

8.

异构高性能计算系统Linpack效率受限因素分析

贾迅邬贵明谢向辉《计算机工程与科学》2018,40(2):224-230

能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。相似文献

9.

二元域大型稀疏矩阵向量乘的FPGA设计与实现

苏锦柱邬贵明贾迅《计算机工程与科学》2016,38(8):1530-1535

作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构。实验分析表明,提出的架构提高了Wiedemannn算法中稀疏矩阵向量乘的并行性,同时充分利用了FPGA的片内存储器和吉比特收发器,与目前性能最好的部分可重构计算PR模型相比,实现了2.65倍的加速性能。相似文献