排序方式: 共有71条查询结果,搜索用时 15 毫秒
1.
2.
为提高卷积神经网络(CNN)的计算效率和能效,以8 bit定点数据作为输入,设计一个支持激活、批标准化以及池化等CNN网络中常见计算类型的卷积加速器,优化循环计算顺序并将其与数据复用技术相结合,以提高卷积计算的效率。基于软硬件协同设计思想,构建包含RISC-V处理器和卷积加速器的SoC系统,RISC-V处理器基于开源的指令集标准,可以根据具体的设计需求扩展指令功能。将该SoC系统部署在Xilinx ZCU102开发板上,RISC-V处理器和卷积加速器分别工作在100 MHz和300 MHz频率下,测试结果表明,该加速器的算力达到153.6 GOP/s,运行VGG16网络进行图片推理计算时加速效果较好。 相似文献
3.
4.
采用由Ag-Cu-Ti+Mo钎料、铜箔和Ag-Cu钎料组成的多层复合钎料,对Ti(C,N)基金属陶瓷和45钢在不同温度(890,920,950℃)和不同时间(10,20,30min)下进行了真空钎焊,根据接头截面形貌和剪切强度确定了最佳钎焊温度和保温时间,并分析了最佳工艺下钎焊接头的显微组织。结果表明:随钎焊温度的升高或保温时间的延长,Ag-Cu-Ti+Mo钎料与金属陶瓷间的界面反应层厚度增大,铜钛金属间化合物增多,两侧钎料区中的铜基固溶体增多,接头的剪切强度先增后降;最佳钎焊工艺为钎焊温度920℃、保温时间20min,此时接头剪切强度最大,从金属陶瓷向45钢,接头组织依次为Cu3Ti2+Ni3Ti金属间化合物,银基固溶体+铜基固溶体+钼+铜钛金属间化合物,铜,银基固溶体+铜基固溶体。 相似文献
5.
江汉油田重组改制后 ,物资仓储部门在新形势下要想提升服务水平 ,必须在心态、行为、方式上实现突破 ,立足基础 ,强化管理 ,靠质量与价格取信用户 ,用真诚和“零距离”配送服务 ,塑造“优质服务”品牌形象 ,在汹涌澎湃的市场大潮中赢得一席之地 相似文献
6.
为了以最小代价开发出超长指令字(VLIW)数字信号处理器(DSP)的指令级精度的模拟器,缩短开发周期,提出了一种基于开源模拟器(gem5)的开发方法.对gem5模拟器和VLIW DSP的指令执行流程分别进行分析,指出指令在gem5模拟器上以纯32位指令环境顺序执行和指令在VLIW DSP上以16/32位混合指令环境并行执行之间的矛盾是开发的难点.在gem5的顺序执行模型的基础上,通过加入并行的判决、执行机制和16/32位混合指令的取指机制建立了VLIWDSP的模型,并具体实现了一款VLIW DSP的模拟器.通过一组针对每条指令的测试程序和一组DSP典型应用程序验证了该方法的正确性和可行性. 相似文献
7.
系统地介绍了SSJ-3060计算机监控系统,说明了系统的结构、功能、特点,并着重介绍了该系统在宝珠寺电站运行情况及使用效果。 相似文献
8.
为提高循环神经网络(RNN)推理速度,分析了循环神经网络(RNN)在CPU的运行时间瓶颈、输入向量稀疏性和参数规模.设计RNN加速器核实现矩阵-稀疏向量乘并行计算,并同时将多个输入向量完整存储于片上SRAM,以复用部分权重从而降低DDR带宽需求.通过Verilog HDL对RNN加速器核进行RTL描述,并搭建仿真环境,将语音识别算法DeepSpeech2的网络参数输入RNN加速器核进行功能仿真.基于FPGA,将MicroBlaze处理器与RNN加速器核搭建SoC,由MicroBlaze实现激活函数、向量逐元素相乘等其它计算.实现了DeepSpeech2中RNN部分推理计算,与只使用MicroBlaze处理器相比,速度提高23倍,能量消耗降低9.4倍. 相似文献
9.
10.
使用脉冲序列进行数据处理的脉冲神经网络具有优异的低功耗特性,但由于学习算法不成熟,多层网络训练存在收敛困难的问题。利用反向传播网络具有学习算法成熟和训练速度快的特点,设计一种迁移学习算法。基于反向传播网络完成训练过程,并通过脉冲编码规则和自适应的权值映射关系,将训练结果迁移至脉冲神经网络。实验结果表明,在多层脉冲神经网络中,迁移学习算法能够有效解决训练过程中收敛困难的问题,在MNIST数据集和CIFAR-10数据集上的识别准确率分别达到98.56%和56.00%,且具有微瓦级别的低功耗特性。 相似文献