期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	32篇
免费	21篇
国内免费	5篇

学科分类

工业技术

58篇

出版年

2024年	1篇
2021年	1篇
2018年	1篇
2017年	1篇
2014年	2篇
2012年	6篇
2011年	12篇
2010年	6篇
2009年	2篇
2008年	9篇
2007年	5篇
2006年	3篇
2005年	1篇
2004年	1篇
2001年	2篇
2000年	3篇
1999年	1篇
1998年	1篇

排序方式： 共有58条查询结果，搜索用时 0 毫秒

1 [2] [3] [4] [5] [6] 下一页 » 末页»

结合PVT模拟和排队模型的系统级主存性能分析

林桦佟冬黄侃王克义程旭《计算机辅助设计与图形学学报》2010,22(12)

由于主存系统的性能受到多种因素的影响,现有方法不能快速地得到可靠的分析结果,从而影响芯片质量和上市时机.为解决此问题,提出将带时序的程序员视图(PVT)模拟和排队论相结合的方法--ComPQ.首先从PVT模拟中提取与访存相关的系统级实时参数,然后将主存系统抽象为非抢占优先的M/G/1排队模型,再结合实时参数进行性能分析,得到平均访存延迟结果.由于PVT的建模和模拟代价小,从中得到的实时参数弥补了静态理论分析的不足;同时,排队论也提高了纯PVT模拟的精度.实验结果表明,ComPQ与周期精确级模拟相比平均误差为6. 38%,最后用主存系统设计空间探索的实例验证了ComPQ的有效性. 相似文献

A General Low-Cost Indirect Branch Prediction Using Target Address Pointers

下载免费PDF全文

谢子超佟冬黄明凯《计算机科学技术学报》2014,29(6):929-946

Nowadays energy-efficiency becomes the first design metric in chip development. To pursue higher energy efficiency, the processor architects should reduce or eliminate those unnecessary energy dissipations. Indirect-branch pre- diction has become a performance bottleneck, especially for the applications written in object-oriented languages. Previous hardware-based indirect-branch predictors are generally inefficient, for they either require significant hardware storage or predict indirect-branch targets slowly. In this paper, we propose an energy-efficient indirect-branch prediction technique called TAP （target address pointer） prediction. Its key idea includes two parts： utilizing specific hardware pointers to accelerate the indirect branch prediction flow and reusing the existing processor components to reduce additional hardware costs and power consumption. When fetching an indirect branch, TAP prediction first gets the specific pointers called target address pointers from the conditional branch predictor, and then uses such pointers to generate virtual addresses which index the indirect-branch targets. This technique spends similar time compared to the dedicated storage techniques without requiring additional large amounts of storage. Our evaluation shows that TAP prediction with some representative state-of-the-art branch predictors can improve performance significantly over the baseline processor. Compared with those hardware-based indirect-branch predictors, the TAP-Perceptron scheme achieves performance improvement equivalent to that provided by an 8 K-entry TTC predictor, and also outperforms the VPC predictor. 相似文献

基于簇的寄存器堆功耗管理方法 总被引：1，自引：1，他引：0

孙含欣佟冬袁鹏程旭《电子学报》2008,36(2):278-284

本文采用软硬件协同设计技术,提出以寄存器簇为粒度对嵌入式处理器寄存器堆进行功耗管理的方法.在软件方面,面向寄存器簇的编译优化使循环程序段中寄存器的编号尽可能相邻;在硬件方面,采用寄存器簇缓冲器过滤对寄存器堆的访问并降低其动态功耗,采用基于寄存器簇的动态电压调节电路和门控预充电路降低存储单元和位线的泄漏功耗.实验结果表明,本文方法将寄存器堆的总功耗降低约44.7%,比传统方法达到了功耗、面积和延迟的更优折衷. 相似文献

部分并行的蒙哥马利模乘法器实现研究

下载免费PDF全文

刘强佟冬程旭《电子学报》2006,34(8):1537-1541

通讯技术的高速发展需要更高性能的密码处理设备.本文系统的研究了利用部分并行的脉动阵列结构实现模乘法器的问题,在分析了各类结构的性能结果的基础上,找到性能最高的和性能-代价比最高的结构配置.结果表明,如果以关键路径延迟×单元面积作为时间-面积代价指标,那么每个运算单元处理一位数据的设计,在0.18 μ m工艺和0.25 μ m工艺条件下,具有最高的运算性能,同时也是性价比最高的设计之一. 相似文献

一种面向Microsoft Windows的AMBA设备PCI虚拟化机制

下载免费PDF全文

庞九凤陆俊林李皓佟冬程旭《电子学报》2011,39(5):1013-1019

PKUnity-86是基于x86处理器和AMBA开放总线架构的系统芯片,既能快速集成各种标准IP核,又支持Microsoft Windows和x86应用程序.如何使AMBA设备支持工业标准的PCI设备枚举和访问,是支持Microsoft Windows 的首要问题.本文提出一种硬件VPCI机制,通过为AMBA设备实现虚... 相似文献

动态翻译系统中的间接转移关联软件预测算法

贾宁杨春佟冬王克义《计算机研究与发展》2014,51(3):661-671

动态翻译系统每执行一次间接转移指令均需进行一次地址转换,该过程是翻译系统性能开销的主要来源之一.无特殊硬件支持的翻译系统常采用软件预测法来降低地址转换开销,而软件预测法的预测准确率较低,制约其对翻译系统整体性能的提升.低开销关联软件预测算法(low-overhead correlated software prediction, LOCSP)可利用代码副本区分待预测指令的不同转移场景,将到达该指令的多条动态执行路径分离为多个互不重合的代码缓存副本,并为各个副本提供独立的预测链.从而在不增加动态指令数的前提下实现关联预测,显著提升软件预测的预测准确率.同时,LOCSP算法基于动态剖析的结果,仅对部分难预测的热点间接转移指令进行关联软件预测,进一步降低预测开销.实验表明,相比软件预测法,LOCSP算法可将平均预测准确率从58.9%提升至82.2%,将翻译系统的整体性能开销平均降低19.3%,最高降低41.9%,而平均静态代码数量仅增加2.4%. 相似文献

VSF:CMOS组合电路的静态功耗评估模型

赵晓莺佟冬程旭《半导体学报》2007,28(5):789-795

为了解决利用晶体管级电路模拟分析CMOS电路静态功耗时模拟时间随电路规模增大迅速增加的问题,在分析晶体管堆叠效应对标准单元泄漏电流影响的基础上,定义了归一化堆叠系数和电路等效堆叠系数的概念,提出了基于电路有效堆叠系数的静态功耗评估模型.该模型可用于CMOS组合电路静态功耗估算和优化.实验结果表明使用该模型进行静态功耗估算时,不需要进行Hspice模拟.针对ISCAS85基准电路的静态功耗优化结果表明,利用该模型能够取得令人满意的静态功耗优化效果,优化速度大大提高. 相似文献

面向按序执行处理器的预执行机制设计空间探索

王箫音佟冬党向磊陆俊林程旭《Canadian Metallurgical Quarterly》2011,47(1)

面向按序执行处理器开展预执行机制的设计空间探索,并对预执行机制的优化效果随Cache容量和访存延时的变化趋势进行了量化分析.实验结果表明,对于按序执行处理器,保存并复用预执行期间的有效结果和在预执行访存指令之间进行数据传递都能够有效地提升处理器性能,前者还能够有效地降低能耗开销.将两者相结合使用,在平均情况下将基础处理器的性能提升24.07%,而能耗仅增加4.93%.进一步发现,在Cache容量较大的情况下,预执行仍然能够带来较大幅度的性能提升.并且,随着访存延时的增加,预执行在提高按序执行处理器性能和能效性方面的优势都将更加显著. 相似文献

基于FPID的动态可重构的多级互联网络

佟冬胡铭曾《哈尔滨工业大学学报》2001,33(1):82-85

在许多MIMD和SIMD计算机中,采用多级互联网络实现处理机之间的数据通信。各种互联网络的区别在于所用的开关模块和级间连接（ISC）模块以及控制方式不同,这种判别导致计算机所适用的应用的不同。提出一种基于FPID的动态可重构的多级互联网络,将开关模块相同的多种多级互联网络的功能合并,以适应多种应用算法。相似文献

10.

Active Store Window: Enabling Far Store-Load Forwarding with Scalability and Complexity-Efficiency

下载免费PDF全文

张栚滈王箫音佟冬易江芳陆俊林王克义《计算机科学技术学报》2012,27(4):769-780

Conventional dynamically scheduled processors often use fully associative structures named load/store queue (LSQ) to implement the value communication between loads and the older in-flight stores and to detect the store-load order violation.But this in-flight forwarding only occupies about 15% of all store-load communications,which makes the CAM-based micro-architecture the major bottleneck to scale store-load communication further.This paper presents a new micro-architecture named ASW (short for active store window).It provides a new structure named speculative active store window to implement more aggressively speculative store-load forwarding than conventional LSQ.This structure could forward the data of committed stores to the executing loads without accessing to L1 data cache,which is referred to as far forwarding in this paper.At the back-end of the pipeline,it uses in-order load re-execution filtered by the tagged SSBF (short for store sequence bloom filter) to verify the correctness of the store-load forwarding.The speculative active store window and tagged store sequence bloom filter are all set-associate structures that are more efficient and scalable than fully associative structures.Experiments show that this simpler and faster design outperforms a conventional load/store queue based design and the NoSQ design on most benchmarks by 10.22% and 8.71% respectively. 相似文献

1 [2] [3] [4] [5] [6] 下一页 » 末页»