排序方式: 共有158条查询结果,搜索用时 15 毫秒
141.
浮点数求和与点积计算在科学计算,信号处理,图像处理等领域中广泛应用.对浮点和与点积计算的硬件结构进行了研究.在只有一次舍入误差的前提下,提出一种通用的浮点数求和算法和结构,利用重对阶方法,解决了多个粘贴位和尾数过抵消所产生的精度损失问题.然后将这种算法移植到浮点点积计算中.为了增加结构的通用性,将提出的结构和常用的SIMD计算单元进行结合.根据提出的算法,设计实现了FADD4和FDP4的硬件结构,和使用离散的加法器和乘法器来实现求和与点积的方法相比,计算速度分别提高了20.4%和42.1%. 相似文献
142.
Alti Vec技术是Motorola为了在其PowerPC架构的通用处理器上实现多媒体处理功能而采用的短向量技术,Longtium R微处理器是西北工业大学航空微电子中心自主研发的高性能32位PowerPC架构微处理器;提出了一种利用Tomasulo算法实现支持Alti Vec技术的短向量双发射调度机制,研究了该短向量的发射策略,重命名寄存器和保留站的设计等,并进行了仿真;结果显示,该双发射短向量单元的IPC平均可达1.2,提高了指令的并行执行效率。 相似文献
143.
随着VLSI技术的发展,在单芯片上集成若干个处理器核的思想成为现实,现代GPU就是一个典型的多核处理器设备;由于面向计算密集型的应用发展非常迅速,当前的GPU又具有了较强的通用计算能力;全文首先介绍了CUDA和稀疏矩阵的相关知识;基于矩阵的CSR表示格式,文章提出了三种CUDA模型下的程序优化方法;论文分析并实现了这三种程序优化方法,在Geforce 9600GT上的实验结果表明,最大可以实现4倍左右的加速比. 相似文献
144.
32位RISC微处理器"龙腾(R)R2"是西北工业大学航空微电子中心2005年设计的一敖自主知识产权的嵌入式微处理器,采用PowerPC体系结构,六级流水线,具有独立的数据Cache和指令Cache.文章介绍"龙腾(R)R2"处理器流水线的设计思想以及优化方案,重点介绍流水线中相关的解决方案、精确异常的实现以及流水线中指令预取级的设计与实现等. 相似文献
145.
基于数据切片的系统芯片测试控制技术研究 总被引:1,自引:0,他引:1
在基于总线结构的系统芯片测试中, 提出了在考虑扫描控制信号的条件下, 采用测试数据切片的测试控制方式来降低测试调度的粒度, 从而提高测试访问机制带宽的利用率. 并给出了在这种控制方式下测试时间的下限值. 最后采用 VCS 仿真器在 Benchmark ITC'02 中若干电路上对提出的测试控制方法进行仿真实验, 结果显示: 相对于文献[Kumar S, Marinssen E J. Control-Aware Test Architecture Design for Modular SoC Testing[C]. IEEE Proceedings of 8th European Test Workshop, Maastricht, The Netherlands: IEEE CS, 2003:57-62.]中考虑了测试控制的最优结果, 测试时间要缩短约 12.00%~21.90%;另外, 相对于其它文献中不考虑测试控制的结果, 测试时间还要缩短大约 1.82%~30.40%. 相似文献
146.
现代微处理器中最为重要的一种工作模式为保护模式。对于复杂的保护模式,如果用硬件状态机实现需要花费较大的硬件代价;如果用软件实现则花费的周期数目较多。论文提出了一种采用静态指令翻译技术的保护测试单元来实现保护测试。由于保护测试单元提取了保护测试的共性,可以在一条保护测试指令中完成一次保护测试,因而可以在硬件增加不多的情况下高效率地实现保护测试。文中最后设计了一种保护测试指令的格式和保护测试单元的数据通路,并列举了一段保护测试程序说明了静态指令翻译的使用方法。 相似文献
147.
148.
根据实际科研工作的需要,进行浮点部件NRS FPU中基本算术运算算法的研究与实现,对完成指数和尾数加减的回绕进位法器算法进行了详细分析。同时,对尾数乘运算的改进BOOTH算法进行改造,改进了BOOTH的译码表,在BOOTH译码过程中省掉了数据符号位的保存和参与,简化了乘运算实现的逻辑复杂度。最后,提出了新的扩展GOLDSCHMIDT算法,有效减少GOLDSCHMIDT算法的乘运算次数,提高了运算速 相似文献
149.
AltiVec技术是PowerPC体系结构处理器采用的多媒体向量处理技术。研究和设计了支持该技术的128位可分裂式加法器。该加法器可分裂实现16个字节、8个半字、4个字的并行加法操作。从时序、面积以及验证的复杂度等方面对三种设计方法进行了分析比较。 相似文献
150.
龙腾C1微处理器的功能验证 总被引:1,自引:0,他引:1
微处理器的功能验证是一项复杂而重要的工作。文章在进行龙腾C1微处理器的功能验证时,针对其指令集的特点,将指令集分为运算类和非运算类两种。根据两种指令各自不同的特点,文章分别提出了使用嵌入汇编语言的C语言参照模型和使用基于真实处理器执行结果的TRACE文件参照模型。在参照模型基础之上,实现了仿真结果的自动检查和基于覆盖率的分析。同时,为了加速仿真验证的速度,使用了FPGA验证平台进行功能验证,可以运行操作系统级的测试程序。 相似文献