期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

网络处理器中的高速缓冲机制及其有效性分析 总被引：1，自引：0，他引：1

刘祯刘斌郑凯陈善真《清华大学学报(自然科学版)》2008,48(1):113-116

高速缓冲机制(Cache)在网络处理器中的应用得到广泛的关注.为了指导新的网络处理器的设计,对cache机制的有效性进行系统化的研究.该文截取实际网络链路上的流量,对数据包处理过程进行模拟,并分析cache机制对网络处理器的各性能参数的影响.实验表明: cache机制可有效缓解数据包突发性的到达给数据处理带来的压力,提高网络处理器的吞吐量、降低丢包率和排队延迟、减少多线程机制对处理模式的敏感程度.因此, cache机制对网络处理器中已有的延迟隐藏机制是一个很好的补充. 相似文献

2.

三维众核片上处理器存储架构研究

李丽张宇昂傅玉祥潘红兵韩峰郑维山《南京大学学报(自然科学版)》2014,(3)

三维众核片上处理器的研究近年来逐渐引起了学术界的广泛关注.三维集成电路技术可以支持将不同工艺的存储器层集成到一颗芯片上,三维众核片上处理器可以集成更大的片上缓存以及主存储器.研究三维众核片上处理器存储架构,探索了集成SRAM L2cache层,DRAM主存储器层等,对三维众核片上处理器性能的影响.从仿真结果可知,相比集成1层L2cache,集成2层L2cache的三维众核片上处理器性能最大提高了55%,平均提高34%.将DRAM主存储器集成到片上最大可以提高三维众核片上处理器80%的系统性能,平均改善34.2%. 相似文献

3.

基于超标量处理器的高效FFT映射方法

高立宁朱亮刘腾飞刘峰《北京理工大学学报》2016,36(9):940-946

针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化的高效FFT映射方法,该方法将FFT进行拆分实现,充分发挥了cache的作用,进而提高了处理性能.最后在ADI公司的TS201数字信号处理器上,以该映射方法为指导实现了基2FFT算法,实验结果显示在处理点数超出cache容量时,本映射方法可以大幅度提高处理性能. 相似文献

4.

基于细粒度伪划分的多核私有Cache容量共享机制

黄安文 张承义宋超郭维李鹏张民选《湖南大学学报(自然科学版)》2013,40(Z1):30-36

针对多核私有Cache结构面临的容量失效问题,提出了一种基于细粒度伪划分的核间容量共享机制.通过在细粒度层次为每个Cache Bank设置加权饱和计数器阵列来统计和预测各线程的访存需求差异情况,控制各个处理器核在每个Cache Set上的私有域与共享域划分比例,并以此指导各处理器核上的牺牲块替换、溢出与接收决策,利用智能的核间容量借用机制来均衡处理器间访存需求差异,缓解多核私有Cache结构面临的容量失效问题.在体系结构级全系统模拟器上的实验结果表明,该机制能够有效改善多核私有Cache结构的容量失效问题,降低多线程应用程序的平均存储访问延迟. 相似文献

5.

用于低功耗的动态可重构cache结构

陈黎明邹雪城雷鑑铭刘政林《华中科技大学学报(自然科学版)》2008,36(9)

提出一种针对嵌入式应用的动态cache重构管理机制.根据应用程序的不同,它能在一定范围内自动搜索,并快速决定出与当前程序最佳匹配的cache结构,然后系统根据最佳匹配结果重新配置cache的3个典型参数:容量、块大小和关联度.实验证明:相对于传统结构,动态可重构cache在不损失性能的前提下,取得了很好的降低系统功耗的效果. 相似文献

6.

一种面向片上众核处理器的虚拟核资源分配算法

沈阳齐德昱周娜琴王新阳《华南理工大学学报(自然科学版)》2018,(1)

基于高效能大任务和多任务计算需求以及芯片技术的高速发展,多核处理器进入片上众核处理器时代,但如何将这种硬件能力转变成计算性能的提升,充分利用MPSo C的并行计算能力是该领域亟待解决的问题.文中研究设计了面向片上众核处理器的物理核到虚拟核分配算法(VPD),该算法通过识别任务执行时的阶段状态特征,动态重组物理核并配置成与任务计算需求相适应的虚拟核,在满足任务的计算资源需求的条件下,实现虚拟核最优分配.最后通过实验将VPD算法与不同的多核/众核处理器环境下的主流调度算法进行比较,结果表明:该算法可适用于多种环境,且效能比其他同类算法平均高5%~10%. 相似文献

7.

SM2签名算法flush-reload cache计时攻击

周平王韬张帆赵新杰《华中科技大学学报(自然科学版)》2018,(3):24-29

针对现有flush-reload cache计时攻击中监测地址选取方法不适用于SM2数字签名算法的问题,提出了一种新的监测地址选取方法,通过监测含有函数调用指令的cache块地址,利用函数调用导致的cache块多次访问特性提高了对cache访问行为监测的准确性,降低了恢复标量k的错误率,实现了对SM2数字签名算法的密钥恢复.实验结果表明:所提出的方法能够对SM2数字签名算法实施有效攻击,利用一次签名的旁路信息恢复256 bit标量k的比特错误率仅为1.09%,能在64次密钥搜索的代价下以59%的成功率完全破解签名者私钥. 相似文献

8.

两性表面活性剂复配构筑的高效抗老化黏弹性驱油体系研究

韩玉贵王业飞刘义刚王秋霞《西安石油大学学报(自然科学版)》2019,(4):37-42

在模拟高温高盐油藏(矿化度20 000 mg/L,钙镁离子总浓度500 mg/L,油藏温度85℃)条件下,利用新合成的2种不同链长(链长分别为22和16)的两性离子表面活性剂CTBB与DDBB复配制得新型黏弹性体系,研究了盐度和老化时间对体系黏度和界面活性的影响。结果表明,复配体系C5D1(CTBB与DDBB质量比为5∶1)在较低浓度(质量分数0.3%)条件下的表观黏度可以达到110.8 mPa·s,油水界面张力可以低至4.53×10~(-3) mN/m;在进一步提高盐度(矿化度50 000 mg/L,钙镁离子总浓度1 250 mg/L,油藏温度85℃)及老化90 d后,体系黏度和界面活性基本不变。在油砂吸附实验中,发现C5D1体系在模拟高温高盐油藏条件下的油砂吸附量仅为1.39 mg/g。室内模拟驱油实验进一步证实了C5D1体系具有良好的驱油性能,即使在老化90 d后体系仍能保持较高的驱油性能。相似文献

9.

新兴多核工作负载访存行为的定量分析

林隽民陈彧李文龙乔林汤志忠《清华大学学报(自然科学版)》2011,(8)

工作负载分析是片上多处理器末级缓存设计的关键先导工作。分析了一组访存密集型多线程RMS(recognition-mining-synthesis)工作负载工作集大小、数据共享行为和空间局部性等访存行为,研究了末级缓存的设计空间,探讨了未来片上多处理器的缓存体系结构设计。实验结果表明:大容量DRAM缓存有助于满足这组负载的大工作集对缓存容量的需求,使用128MB DRAM缓存比不使用时平均可以减少18%的L1缓存缺失延迟;共享缓存设计比私有设计性能更好,8MB的共享缓存可以比相同总容量的私有缓存提高25%的缓存性能;基于步长的硬件数据预取机制可以提高25%的性能。因此,对于访存密集型RMS负载,宜采用一个128MB的DRAM缓存、一个8MB片上SRAM缓存,结合一个8表项的流式预取器,构成缓存子系统。相似文献

10.

不同设计水文条件下颍河水环境容量计算研究

《三峡大学学报(自然科学版)》2020,(3)

针对水环境容量受水文条件影响的特征,本文以颍河(郑州段)为例,采用一维水环境容量模型探讨了3种不同设计水文条件下水环境容量的差异.结果表明:分水期设计条件较常规方法(多年平均流量)计算的COD和氨氮容量分别增加了7.15%和9.75%;月平均流量设计条件较常规方法计算的COD和氨氮容量分别增加了4.89%和6.35%;分水期与月平均流量设计条件水环境容量接近,COD和氨氮容量仅分别增加了2.14%和3.20%.比较3种设计水文条件下水环境容量的大小,发现在考虑河道动态特性的设计水文条件下计算的水环境容量更能真实有效地反映河流水环境容量的实际变化规律,从而实现水环境容量的总量分配和季节性利用. 相似文献

11.

支持大规模地震探测数据快速可视化的云端数据缓存技术

魏晓辉崔浩龙李洪亮白鑫《吉林大学学报(理学版)》2018,56(5):1147-1155

首先, 基于云计算应用模式, 提出一种能有效利用云存储架构的双层缓存技术. 通过在客户端和服务器端建立分布式缓存, 能有效避免用户频繁访问远端数据, 为用户构建轻量级的客户端, 解决了目前地学数据可视化软件大量占用用户本地存储容量的问题. 同时服务器端也避免了多次访问云存储文件系统, 减少了大量的数据检索与加载时间. 其次, 提出一种ARLS(association rule last successor)访问预测算法, 根据用户的历史访问记录, 利用关联规则挖掘用户的访问模式, 对其访问行为进行预测, 进而提前加载数据, 提高缓存命中率, 解决了用户在可视化过程中不断移动兴趣区域, 频繁更换渲染数据的问题, 能有效应对用户具有多种访问模式的情况, 提高了预测准确率. 实验结果表明, 该云存储架构显著减少了本地资源消耗, 访问预测算法的准确率在最差情形下可达47.59%, 平均准确率达91.3%, 分布式缓存的平均缓存命中率达95.61%, 可有效支持云端大规模地震数据的快速可视化. 相似文献

12.

基于多核处理器的动态共享缓存分配算法

周本海乔建忠林树宽《东北大学学报(自然科学版)》2011,32(1):44-47

对于具有共享缓存结构的多核处理器,存在并行应用对共享缓存冲突访问导致性能下降的现象.为合理地分配共享缓存以有效地解决这类问题,提出了一种共享缓存分配方法,通过将并行应用对共享缓存访问未命中的情况进行分类与追踪,并根据建立的性能增益模型在行的粒度上进行动态地分配共享缓存,使系统的整体性能得到改善.实验结果表明,新算法能合... 相似文献

13.

支持缓存划分的全局EDF实时系统调度策略

林宇晗严健王侃侃邓庆绪《东北大学学报(自然科学版)》2021,42(12):1673-1680

由于多核处理器争用共享缓存导致的不确定性为实时系统带来极大的挑战.为解决这个问题,现代处理器引入了缓存划分技术,通过隔离处理器核对缓存的访问从而提高了时间可预测性.但是,这种隔离技术可能导致实时任务因缓存分区的数量不足而被阻塞,而传统的实时调度算法与分析方法无法有效应对这种情况.因此,提出了支持缓存划分的可抢占全局最早截止期优先(EDF)实时调度算法gEDFca,并结合最新的缓存敏感调度理论针对这种调度算法进行了可调度性分析,提出了一种基于线性规划的可调度性判定条件.还提出了一种具有线性时间复杂度的优化算法,进一步提高了分析方法的性能.随机生成任务的仿真实验表明,提出的可调度性判定方法具有较高的效率.同时,优化算法提高了算法可调度性. 相似文献

14.

面向按序执行处理器的预执行机制设计空间探索

王箫音佟冬党向磊陆俊林程旭《北京大学学报(自然科学版)》2011,47(1):35-44

面向按序执行处理器开展预执行机制的设计空间探索, 并对预执行机制的优化效果随 Cache 容量和访存延时的变化趋势进行了量化分析。实验结果表明, 对于按序执行处理器, 保存并复用预执行期间的有效结果和在预执行访存指令之间进行数据传递都能够有效地提升处理器性能, 前者还能够有效地降低能耗开销。将两者相结合使用, 在平均情况下将基础处理器的性能提升 24. 07% , 而能耗仅增加 4. 93% 。进一步发现, 在 Cache 容量较大的情况下, 预执行仍然能够带来较大幅度的性能提升。并且, 随着访存延时的增加, 预执行在提高按序执行处理器性能和能效性方面的优势都将更加显著。相似文献

15.

多核系统上任意2序列公共元素的并行查找

蔡德霞钟诚韦兴柳林孔升《合肥工业大学学报(自然科学版)》2012,(2):172-175,246

文章依据多核系统共享二级缓存和私有一级缓存的容量,采用数据多级分块技术、数据局部性原理和循环并行优化方法,设计了多核系统上存储高效、线程级并行、扩展性好的任意2序列公共元素的并行查找算法。结果表明,该文所给算法充分发挥了多核系统的软硬件特性,获得了良好的加速比和可扩展性。相似文献

16.

分离Cache的一种容量联合分配算法

彭蔓蔓郝玉艳任小西《湖南大学学报(自然科学版)》2009,36(12)

在嵌入式处理器中,Cache的功耗所占的比重越来越大.针对不同类型的应用程序对指令Cache和数据Cache的容量实时需求不同,提出了一种新的容量联合分配算法,该算法可以均衡考虑程序运行时对指令 Cache和数据Cache的实时需求,动态调整一级Cache的容量和配置,从而更有效地利用Cache资源.Mibench仿真结果表明,采用容量联合分配算法的分离Cache与传统分离Cache相比,平均能量消耗降低了29.10%,平均能量延迟积降低了33.38%. 相似文献

17.

高性能并行计算机的发展及其在石油勘探中的应用

李敏《科技导报(北京)》2014,32(2):80-83

高性能计算机是推动工业发展的重要工具和手段。本文综述高性能计算机发展的几个关键问题,阐明处理器的发展趋势正在过渡到新一代多核心异构并行计算系统过程中,其中多核心缓存设计和多核心异构编程模型设计是关键因素,云计算技术可能成为将来高性能计算的重要推动因素。最后,结合石油勘探中对计算机的需求,以CPU+GPU 的异构计算系统为例,阐明高性能计算的重要推动作用。并行算法的开发平台和程序设计方法是影响石油勘探中的高性能计算应用的主要瓶颈;磁盘I/O、高速网络和并行文件系统是制约高性能计算的重要因素。相似文献

18.

采用数据驱动机制的多核处理器

毕卓徐云川王镇《上海交通大学学报》2013,47(1):81-85

摘要：
针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中：通用处理器核用于执行常规程序;数据驱动模块用于检测数据的完备性;片内路由器则可提供处理器核之间及簇之间的通信.实验结果表明,所设计的多核处理器能够支持C语言“函数式语言”风格的编程模板.每个C代码段执行纯函数的操作,消除了函数间的共享变量,使得并行编程的复杂度有所降低.同时,所采用的数据驱动机制没有执行顺序的严格限制,充分挖掘了算法潜在的并行性.经测试,数据驱动多核处理器的加速比随着计算资源的增加而增大,从而验证了数据流计算机的加速倍数随处理器数目增加而线性增长的结论.
关键词：
数据驱动; 并行编程模型; 数据流机; 多核处理器
中图分类号： TP 338
文献标志码： A 相似文献

19.

High-Performance Packet Classification on Multi-Core Network Processing Platforms

亓亚烜薛一波李军《清华大学学报》2011,16(4):432-439

Packet classification is crucial to the implementation of advanced network services that require the capability to distinguish traffic in different flows, such as access control in firewalls and protocol analysis in intrusion detection systems. This paper proposes a novel packet classification algorithm optimized for multi-core network processors. The proposed algorithm, AggreCuts, has an explicit worst-case search time with modest memory usage. The data structure of AggreCuts is flexible and well-adapted to different types of multi-core platforms. The algorithm on both Intel IXP2850 32-bit and Cavium OCTEON3860 64-bit multi-core platforms was implemented to evaluate the performance of AggreCuts. The experimental results show that AggreCuts outperforms the best-known existing algorithm in terms of memory usage and classification speed. 相似文献