首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
针对HEVC帧内预测角度模式算法的特点,提出实现角度预测模式的并行化方法.该方法基于BWDSP1041仿真平台通过分析角度模式算法的可并行性,提出了适合多乘法器并行计算的数据分配方式,结合处理器所搭载的硬件资源,设计了多运算部件并行工作的算法程序.实验结果表明角度预测模式20和垂直模式26在BWDSP1041上利用硬件资源的并行化实现,并行加速比分别达到161.68和344.65.该并行化算法减少了视频编码的时间,其数据分配方案对于帧内预测算法在多核和多运算部件结构上的并行化研究也具有一定的参考价值.  相似文献   

2.
目标跟踪中的伺服系统需要极低的跟踪延时,由于粒子滤波跟踪算法固有的庞大计算量使得目标跟踪的精度大受影响。提出了一种粒子滤波跟踪算法在多核DSP 系统中的快速实现方法。首先,利用DSP 片上的包加速器来降低以太网相机的采集延时以及CPU 占用率,CPU 占用率从31%降低到10%;其次,通过手动操作高速缓存的刷新和实效,解决了多核同时共享图像数据带来的存储器一致性问题,多个核能通过高速缓存快速获取图像数据;最后,通过在多核核心上设置代理任务的方法,建立了一种多核并行计算的机制。粒子滤波算法中计算复杂度高的运算阶段被分配到多个核心上同时运算,实现了算法的低延时。实验结果显示8 核加速比达到7 倍以上,优于开放多处理标准 OpenMP 的并行优化效果。  相似文献   

3.
距离多普勒算法是合成孔径雷达成像的一种经典方法。随着信号处理性能需求的逐步提高,多核并行处理器已经逐步发展起来,如TI的C6678处理器为8核DSP。在多核DSP实现成像算法时,多核多线程设计、多核任务分配、计算传输平衡等问题是影响性能的关键问题。采用数据并行的方式实现并行设计框架。针对距离多普勒算法的特点,设计收数同时脉压、8核协同处理大点数脉压,以及每个核独立处理小点数任务等多种并行方式。通过基于多核DSP的并行设计,大大提高了距离多普勒算法的处理性能。  相似文献   

4.
探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+~粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD程序中进行了验证。该并行算法取得了较其他并行FDTD算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常好的加速比和效率。  相似文献   

5.
针对多核环境中高速无线信号的加扰、解扰,提出了一种基于稀疏矩阵的多核并行扰码方法。首先对输入信号进行串/并转换,并将各路信号分别送入对应的处理器核;考虑基于稀疏矩阵的并行扰码生成器,在单个处理器核内,将其生成的伪随机码与输入信号进行模二加运算,得到单路信号的扰码输出;最后将多路并行的扰码输出变换为串行输出。运算量分析结果表明,采用IEEE 802.11n中的扰码生成多项式,与普通矩阵乘法实现的多核并行扰码方法相比,基于稀疏矩阵的多核并行扰码方法,其运算量降低了一个数量级。  相似文献   

6.
针对监控视频中运动目标实时特征提取的需求,在目标检测与特征提取串行算法的基础上,提出了基于OpenMP和多核CPU平台的三层并行优化算法。首先,在算法顶层,将串行算法抽象为两个模块组成的流水线,提出了流水线并行优化算法和相应的缓存管理策略;接着,在算法中层,考虑到特征提取模块中各子模块的功能独立性,设计了功能划分并行优化算法;最后,在算法底层,利用纹理特征提取模块的数据独立性,提出了数据划分并行优化算法。实验结果表明,该三层双模块并行优化算法在四核CPU平台上获得了接近Amdahl极限的加速比,基本实现了实际监控视频中运动目标检测与特征提取的实时处理。该多层次多模块并行优化方法普遍适用于串行算法在多核平台上进行并行优化的分析。  相似文献   

7.
王磊 《信息技术》2012,(7):184-187
提出了一种新的混合并行蚁群算法,在单机多核机及多核集群机下分别实现了MPI并行蚁群算法及MPI+TBB并行蚁群算法,应用于真实路网车辆路径问题(Vehicle Routing Problem,VRP),对两者进行了实验对比,实验结果表明MPI并行蚁群算法具有较高的加速比,和问题规模关系不大,刚开始呈现线性加速比。较MPI并行蚁群算法,MPI+TBB混合并行蚁群算法具有更好的可扩展性,在进程数较多时仍具有较高的加速比。  相似文献   

8.
如何提高时域有限差分算法(FDTD)的运算效率一直是FDTD数值运算研究的核心问题之一.针对近年来图形处理器(GPU)运算能力的高速增长及GPU通用运算概念提出的背景,对GPU加速FDTD运算的潜力与研究现状进行了总结,并对GPU加速FDTD运算的并行实现原理进行了阐述,通过将其与其他典型硬件加速方式进行比较,指出了G...  相似文献   

9.
金玮  孙甲松 《电声技术》2010,34(8):49-52
研究了汉语语音识别中语言模型的并行优化问题,在已有汉语语音识别有调拼音模型和多核体系结构的基础上,对其算法进行了并行优化,并优化了查询机制和前后向算法。试验表明,该方法取得了很好的效果,识别速度有了很大改进。  相似文献   

10.
在通用处理器上进行信号处理是软件无线电发展的方向之一,现有的共享存储并行编程(OpenMP)和直接线程并行法难以对信号处理进行并行加速。针对串行算法的并行化问题,引入多核流水线方法,对传统串行方法和多核流水线的实时性进行了分析对比。针对多核流水线的同步问题,研究了一种分布式的自适应线程同步方法。结合信号处理实例,对串行方法和多核流水线的实时性进行测试,结果表明多核流水线的吞吐率是串行方法的2.1倍,处理能力大大提高。  相似文献   

11.
Parallel implementation and optimization of the Sebvhos algorithm   总被引:1,自引:0,他引:1  
In this paper, a parallel Surface Extraction from Binary Volumes with Higher-Order Smoothness (SEBVHOS) algorithm is proposed to accelerate the SEBVHOS execution. The original SEBVHOS algorithm is parallelized first, and then several performance optimization techniques which are loop optimization, cache optimization, false sharing optimization, synchronization overhead optimization, and thread affinity optimization, are used to improve the implementation’s performance on multi-core systems. The performance of the parallel SEBVHOS algorithm is analyzed on a dual-core system. The experimental results show that the parallel SEBVHOS algorithm achieves an average of 1.86x speedup. More importantly, our method does not come with additional aliasing artifacts, comparing to the original SEBVHOS algorithm.  相似文献   

12.
LK(Lukas-Kanade)光流法在运动目标检测和跟踪领域具有广泛应用,但其计算复杂、速度慢,难以适应异构硬件平台。为实现LK光流法在不同平台上的高效运行,设计了一种基于开放式计算语言(OpenCL)的LK光流法并行算法。该算法通过将二维图像上像素点上的稠密计算映射到多线程上实现数据并行,并基于OpenCL平台的共享内存等优化方法减小了主机内存与设备内存数据传输。实验测试表明,该算法相比于多核CPU下的基础OpenCV函数库中的LK算法获得了最高31倍的加速比,同时在速度上与统一计算设备体系结构(CUDA)加速的LK光流法相近。此外,还在多种不同设备下验证了加速算法的平台通用性。  相似文献   

13.
高性能多核 DSP 的通信以及并行执行是多核系统设计的关键.文章分析了视频目标跟踪算法各模块的资源消耗,对各部分算法提出了并行计算的思路;提出改进的二值化掩膜法提取背景图像;提出辅助并行结构以使负载均衡;研究了 DSP多核通信的进程间通信(IPC)同步机制,运用流水线并行结构,实现三核同步并行处理系统.通过实验,测试了通信延迟时间,并把目标跟踪程序合理地划分到3个 DSP核中,实现并行处理,达到了实时性要求.  相似文献   

14.
针对Image Quilting纹理合成算法的新旧纹理块拼接特点,研究了一种创建多任务实现纹理块切割拼接的并行编程模式.设计了重叠区域缝合路径计算的多任务模块函数iq(),利用MATLAB多核集群中创建的调度器将子任务分配到各个节点上并行执行计算.实验结果表明,该算法获得了较好的加速比,提高了多核CPU的使用效率,有效地提升了多核计算机资源的利用率.  相似文献   

15.
为了减少激光半主动武器中测量光学器件光斑点坐标时噪声和干扰对探测精度影响、增加脉冲信号的测量带宽、提取信号的有效值,同时克服串行快速傅里叶变换(FFT)运算耗时及时间复杂度较大的问题,基于多核和并行架构的SoC-FPGA平台以及OpenCL软件,提出了实现并行FFT的计算方法。结果表明,利用该方法可使FFT(1-D)的时间复杂度下降到原来的1/Q,得到了较好的加速效果;通过3种平台(先进精简指令集微处理器、数字信号处理器和片上系统现场可编程门阵列)的运算耗时实验对比,该算法运算耗时为6.0449ms(1-D 4096点),要比同点数其它两种平台运算耗时少。并行FFT算法不仅满足激光半主动导引头信号实时性的要求,而且可以达到去噪的效果,能有效地降低噪声和背景光的影响。  相似文献   

16.
构建了一种适用于多核集群的混合并行编程模型.该模型融合了共享内存的面向任务的TBB编程和基于消息传递的MPI编程两种模式.结合两者的优势,实现进程到处理节点和进程内线程到处理器核的两级并行.相对于单一编程方式下的程序性能,采用这种混合并行编程模型的算法不但可以减少程序执行时间,获得更好的加速比和执行效率,而且明显地提高了集群性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号