排序方式: 共有305条查询结果,搜索用时 24 毫秒
1.
对绝缘栅双极型晶体管进行参数预测可以有效地避免因其失效带来的经济损失和安全问题。对绝缘栅双极型晶体管参数进行分析,设计了一个基于LSTM网络的绝缘栅双极型晶体管参数预测SoC硬件系统。该系统使用ARM处理器作为总控制器,控制各个子模块的调用和数据的传输, FPGA内通过对矩阵向量内积算法进行优化提高LSTM网络内部的数据运算速度,并且采用多项式近似的方法降低了激活函数所占用的资源。实验结果表明,系统的预测平均准确率为92.6%,计算速度相比于CPU快了3.74倍,同时具有低功耗的特点。 相似文献
2.
针对TINY YOLO车辆检测算法计算量过大,且在小型嵌入式系统中难以达到实时检测要求的问题。利用小型Zynq SoC系统的架构优势以及TINY YOLO的网络权值中存在大量接近零的权值参数这一特点,提出硬件并行加速的改进算法,称为浓缩小型深度网络(Xerantic-TINY YOLO,X-TINY YOLO)车辆检测算法。首先对TINY YOLO中网络结构进行压缩;其次采用高效多级流水线、流水线内全并行的方式对卷积计算部分进行算法加速;最后提出与网络结构相配合的数据切割和传输方案。实验结果表明,X-TINY YOLO仅消耗50%的片内硬件资源,可在相对于GPU和CPU性价比更高更适合嵌入式场景的Zynq SoC系统上实现,且其检测速度达到24帧/s,满足车辆检测的实时性要求。 相似文献
3.
《Planning》2018,(1)
针对目前液晶触摸屏控制技术存在帧率有限、处理器负担重以及可移植性差等问题,提出了一种基于微处理器(ARM)和现场可编程门阵列(FPGA)的液晶触摸屏控制器的设计方案。该控制器采用ARM实现对液晶触摸屏的输入输出控制,基于FPGA构建同步动态随机存储器(SDRAM)控制器和液晶显示模块,实现系统的硬件加速功能及不同分辨率液晶显示屏的实时显示。实验结果表明:该控制器的数据传输率能达到31MB/s,可适应多种分辨率的液晶屏,同时能完成触摸操作。 相似文献
4.
5.
随着深度学习技术的发展和图像场景理解需求的提升,基于现场可编程门阵列(field programmable gate array, FPGA)部署语义分割网络,为用户提供低延迟、高能效的边缘端智能服务成为研究热点。针对语义分割网络结构中计算和存储密集型特点,构建基于FPGA的定制计算结构是研究的重点问题。鉴于此,本文在归纳总结语义分割网络基本原理和计算结构特点的基础上,分别从面向硬件资源约束的模型压缩方法和定制硬件架构设计两个角度阐述基于FPGA的语义分割网络加速计算方法,并重点对硬件架构设计中的计算结构设计和内存访问优化的典型方法进行总结。最后,展望了语义分割网络FPGA加速计算方法的发展趋势,以期为语义分割、边缘计算、定制高能效计算以及其他相关领域的研究者提供设计参考。 相似文献
6.
7.
8.
9.
DirectX开发小组的负责人Bachus说微软正准备在近期发布DirectX7.0第一个beta版本,而最终版将在今年夏天的中末期发布。下面是DirectX新版本的技术改进:1.DirectX70的两个最大的改进一在于支持光源硬件加速,支持变形的硬件加速和扩展。现在,DirectX的直接模式(讪mediatemode)将渲染工作交给图形芯片完成,而几何光源以及变形仍然由主CPU完成。支持变形加速的好处更大,硬件光源效果的光源数量通常被限制在8个或更少。但是象Messiah这样的游戏也许含有32或更多个光源。而相对顶点变形方面能得到的好处就多的多,但是需要小心的… 相似文献
10.
《Planning》2019,(12)
本文设计了一种基于ALTERA的FPGA的自定义四点灰度卷积指令,使用NIOSⅡ软核添自定义指令,使用VHDL硬件描述语言设计四像素点卷积的硬件,并挂载到ALU上,通过硬件方法处理四个灰度像素点和对应卷积核的卷积运算,实现SOPC对图像处理的卷积部分的加速。并在软件中配合该指令进行C语言程序的调用。该模块可以灵活的运用到其他NIOSⅡ的系统上。使用时间戳记录时间,测试该软硬件结合的自定义指令处理方法针对不同大小的卷积核,相较于C语言软件处理卷积运算可以节省70%以上的运行时间。 相似文献