首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
针对网络丢包条件下的H.264实时解码问题,设计了基于DM6467处理器的自适应的实时错误掩盖算法,该算法根据场景切换和相邻宏块的运动特征分别进行时域错误掩盖和空域错误掩盖,而不增加解码器的时空复杂度。在DM6467处理器上进行了错误掩盖解码并行算法的流水线设计和优化。实验结果表明,与现有方法相比,采用该方法后视频重建图像质量最大提高了1.87 dB,并且可以达到1080P30实时掩盖的效率。  相似文献   

2.
基于一款ARM big.LITTLE架构8核嵌入式处理器,设计了一种波前并行解码优化方法,主要包括像素重构并行、去方块滤波并行、样点自适应补偿并行等内容,突破了模块设计的边界限制,改善了Cache命中率,提升了解码效率.在Exynos5 Octa处理器平台上的运行测试达到了较好的解码效果.  相似文献   

3.
实现基于多核处理器构架的JPEG解码算法;通过将JPEG算法并行化,在多个处理器核上并行处理,并针对多核处理器构架进行内存读取等方面的优化,可极大地提高JPEG解码算法的解码速度。实测表明,在4核集成的多核处理器上,JPEG图像的平均解码周期为单核处理器上的28%左右。  相似文献   

4.
杨娟  曾苗祥  徐晶  许炜 《计算机科学》2015,42(3):266-270, 295
目前基于普通架构的视频检测速度较慢,难以满足网络视频实时监测的要求,为此提出一个基于众核处理器和图形处理单元(GPU)的视频检测方案。该方案基于众核处理器实现视频解码,基于GPU实现SURF(Speed Up Robust Features)和SVM(Support Vector Machine)的图像检测算法。与基于普通PC架构的视频检测方案相比,该方案的视频检测性能提升了10倍以上。  相似文献   

5.
求解全源最短路径的Floyd算法是许多实际应用基础上的关键构建块,由于其时间复杂度较高,串行Floyd算法不适用于大规模输入图计算,针对不同平台的并行Floyd算法设计可为解决现实问题提供有效帮助.针对Floyd算法与国产自主研发处理器匹配滞后的问题,首次提出基于神威平台的Floyd并行算法的实现和优化.根据SW26010处理器主-从核架构的特点,采用主从加速编程模型进行并行实现,并分析了影响该算法性能的关键因素,通过算法优化、数组划分和双缓冲技术进行优化,逐步提升算法性能.测试结果表明,与主核上串行算法相比,基于神威平台的Floyd并行算法在单个SW26010处理器上可以获得106倍的最高加速.  相似文献   

6.
基于规则格网的数字高程模型( DEM)相对于不规则三角网( TIN)具有结构简单,便于存储、管理和分析等优点。针对TIN向规则格网转换的串行算法效率较低的问题,利用图形处理器( GPU)并行编程对一种串行算法进行实现;然后从GPU 全局内存和共享内存的访问方面对算法进行优化;最后用C++语言和统一计算设备架构( CUDA)开发了实验系统,对优化前后算法的效率进行对比。结果表明,优化后的算法效率较优化前最大提高了72倍。  相似文献   

7.
AES专用指令处理器的研究与实现   总被引:1,自引:0,他引:1  
随着加密算法在嵌入式可信计算领域的广泛应用,如何提高其执行效率成为研究的热点问题.高级加密标准(AES)凭借其在安全性、费用开销和可执行性等方面的内在优势,成为使用最为广泛的对称密钥加密算法.采用指令集架构(ISA)扩展优化的方法对AES算法进行指令扩展优化.基于电子系统级(ESL)方法设计流程,使用基于LISA语言的处理器生成工具构建了一个高效AES专用指令处理器(AES_ASIP)模型,最终实现于FPGA中.经过一系列的仿真和验证,对比ARM处理器指令集架构,实验结果显示AES_ASIP以增加少许硬件资源为代价,提高了算法58.4x%的执行效率并节省了47.4x%的指令代码存储空间.  相似文献   

8.
针对并行处理H.264标准视频流解码问题,提出基于CPU/GPU的协同运算算法。以统一设备计算架构(CUDA)语言作为GPU编程模型,实现DCT逆变换与帧内预测在GPU中的加速运算。在保持较高计算精度的前提下,结合CUDA混合编程,提高系统的计算性能。利用NIVIDIA提供的CUDA语言,在解码过程中使DCT逆变换和帧内预测在GPU上并行实现,将并行算法与CPU单机实现进行比较,并用不同数量的视频流验证并行解码算法的加速效果。实验结果表明,该算法可大幅提高视频流的编解码效率,比CPU单机的平均计算加速比提高10倍。  相似文献   

9.
邱荣太 《微计算机信息》2012,(9):486-487,233
基于Map-reduce,提出了面向多核处理器应用于大规模集群的并行编程方法,应用该方法运行数据挖掘算法Canopy和K-means。针对K-means算法对初始聚类中心敏感,提出了基于Canopy的K-means优化算法。基于实际数据集的实验结果表明,多核Canopy-K-means聚类算法的准确度和执行效率随着核数的增多呈线性增长。  相似文献   

10.
基于多核处理器的并行编程模型   总被引:3,自引:3,他引:0  
为解决传统编程模型与并行架构间存在的矛盾,针对多媒体和网络应用程序的特点,提出一种基于多核处理器的并行编程模型,该模型采用节点化的并行程序描述方式,将并行编译器划分到多个核上运行。实验结果表明,这种新的并行编程模型能有效提高程序的执行效率。  相似文献   

11.
基于TTA的嵌入式ASIP设计   总被引:4,自引:1,他引:4  
在嵌入式微处理器设计中,采用ASIP(application specific instruction processor)处理器设计方法,可以在满足功能和性能要求的同时,缩短嵌入式微处理器产品的研制时间.当前ASIP处理器设计方法还面临着许多问题,如体系结构优化、软件代码的可重定向编译等,这些都阻碍了ASIP处理器设计方法的广泛应用.因此,提出了一种基于传输触发体系结构(transport triggered architecture,TTA)的嵌入式ASIP设计方法,对其设计关键技术进行了详细的讨论,并通过两个目标应用的ASIP微处理器设计实例说明了该方法可以有效解决上述问题,快速开发出满足目标应用程序要求的嵌入式处理器。  相似文献   

12.
13.
卡内应用执行效率较低是制约Java Card发展的瓶颈。为此,研究Java Card虚拟机(JCVM)解释器的运行原理,针对其执行架构提出一种基于反馈的JCVM指令预调度方案。通过收集反馈应用的运行指令流统计信息,设计解释器加权控制流图(WCFG),利用基于WCFG的代码编排技术实现解释器的指令预调度。在目标体系架构中,将热点指令处理函数的布局按照反馈应用的统计信息进行重新编排。实验结果表明,该方案可使JCVM解释器的应用执行效率提高15.29%,并且不依赖额外系统资源,对基于解释器架构且资源受限的嵌入式设备性能优化具有指导意义。  相似文献   

14.
MX1体系结构采用ARM920T内核,针对它构建嵌入式Linux平台,把Gameboy模拟器(以下统一称为Gnuboy)移植过去;对Gnuboy的源代码进行修改,在宿主平台上交叉编译,编译好的可执行文件烧入测试板上运行,这是移植的过程;Gnuboy在嵌入式环境下面临速度慢的问题,可以对原先的一些C函数用ARM汇编改写来加快速度,这里用到基于图着色技术的寄存器分配算法的一种简化方法,用这种方法对Gnuboy源代码中的几个函数进行了优化处理,优化效果可用相应的工具软件进行测试;这些移植和优化研究工作,目的是为了把Gnuboy应用到基于ARM Linux的嵌入式产品中,同时对研究该平台下一般的虚拟机技术应用也有相应的价值.  相似文献   

15.
雷蕾  成瑾 《微计算机信息》2006,22(30):186-188
Intel公司推出的XScale微架构以其高性能低功耗的特点,被广泛的应用到各种嵌入式应用领域。本文深入的分析了XScale架构中与性能有关的硬件单元的特点,并以此为依据,详细论述了基于XScale的应用程序开发过程中代码级优化的策略和技术。  相似文献   

16.
嵌入式系统编程中的代码优化   总被引:2,自引:0,他引:2  
从嵌入式系统的特点出发 ,阐述了嵌入式系统编程语言的选择以及代码优化的方法。首先分析了嵌入式系统特点和嵌入式系统编程的要求 ,以及嵌入式实时程序设计中语言的选择。接着结合嵌入式软件开发的实践 ,阐述了嵌入式软件开发中代码优化的方法。最后作出总结 ,提出综合利用各种方法和必要性  相似文献   

17.
嵌入式系统往往对实时性、系统功耗和程序代码长度有特殊的要求,本文从程序设计的角度讨论满足这些要求的程序代码优化方法。文中首先讨论了程序执行时间的优化方法,随后讨论了程序代码长度的优化方法,最后讨论了程序功耗的优化方法。  相似文献   

18.
多核处理器已经成为主流,并且被广泛应用于嵌入式设备中.在操作系统如何有效支持多核处理器方面的研究中,目前国内外大多基于常见的紧耦合共享存储架构的多核处理器,而对一些特殊存储架构的多核处理器研究并不多.本文针对内存受限的多级存储架构的多核处理器,提出一种单代码多数据的嵌入式多核操作系统模型.实验表明,该模型应用在具有多级存储架构的八核DSP上,比AMP模型减少约80%的代码空间开销;与SMP模型相比,与实时性紧密相关的时间开销减少约10倍.  相似文献   

19.
结构分析和设计语言AADL研究   总被引:4,自引:0,他引:4       下载免费PDF全文
随着嵌入式系统规模、复杂度和性能需求的提升,嵌入式系统开发的重点从代码级提前到模型级,模型驱动体系结构成为嵌入式系统开发的主流。结构分析和设计语言(AADL)是一种模型驱动系统工程的新标准,从过程、方法和工具三个方面对其进行研究,讨论模型分析、模型转换和代码生成等相关技术,并将其与OMG的标准建模语言UML进行比较。  相似文献   

20.
随着嵌入式系统规模、复杂度和性能需求的提升,嵌入式系统开发的重点从代码级提前到模型级,模型驱动体系结构成为嵌入式系统开发的主流。统一建模语言(UML)和结构分析和设计语言(AADL)是模型驱动系统工程的标准,从方法、扩展机制和应用领域三个方面对两者进行研究和比较,讨论模型分析、模型转换等相关技术。最后,探讨了UML和AADL的发展与研究方向  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号