期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

毛飞龙焦义文马宏韩久江高泽夫李超李冬《系统工程与电子技术》2023,(8):2383-2394

针对天线组阵合成系统对于宽带、高速、并行信号的实时合成需求，设计了基于图形处理器(graphic processing unit, GPU)的天线组阵信号时延补偿方法。首先，分析了典型的整数时延补偿方法在GPU平台上实现的可行性，设计了基于数据块重叠保留的整数时延补偿方法。然后，对比了典型的小数时延补偿方法的优劣，设计了适合于GPU并行加速的频域小数时延补偿方法。最后，对基于GPU的天线组阵信号时延补偿方法进行了实验验证。多次实验测试结果表明，在确保时延补偿正确性的基础上，基于GPU的时延补偿方法相比传统串行CPU时延补偿方法加速比提升了约18倍，采用基于GPU的时延补偿方法可实现对多天线信号的实时合成。相似文献

2.

基于GPU的北斗B1宽带复合信号实时发生器设计

王子涵巴晓辉姜维蔡伯根王剑文韬《系统工程与电子技术》2024,(3):795-804

为了实现北斗B1C+B1I信号的联合生成,提出一种基于软件无线电和图形处理器(graphics processing unit, GPU)加速的北斗B1宽带复合信号的实时生成方法,该方法针对单边带复数二进制偏移载波(single-sideband complex binary offset carrier, SCBOC)调制方式的信号体制进行设计,系统根据用户配置的接收机运动轨迹和星历文件,生成中频信号并通过射频端发射。为了进一步提升GPU并行运算速度,从优化设备内存结构、设计并行线程架构和统一计算设备架构流(compute unified device architecture stream, CUDA)加速3个方面,设计了基于异步运算的加速采样点数据计算的CUDA优化实现方案。测试结果证明,优化后的算法可以基于SCBOC调制实时生成北斗B1I+B1C信号,基于GTX3060的GPU平台,信号90 M采样率下能实现8颗卫星复合信号的实时生成。相似文献

3.

多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 总被引：1，自引：0，他引：1

王维平余文广侯洪涛李群《系统工程与电子技术》2012,34(11):2366-2373

多核中央处理器（central processing unit, CPU）图形处理器（graphic processing unit, GPU）异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。相似文献

4.

基于GPU的SAR回波仿真高效实现方法

景国彬张云骥李震宇孙光才邢孟道保铮《系统工程与电子技术》2016,38(11):2493-2498

针对合成孔径雷达(synthetic aperture radar,SAR)分布式场景回波仿真计算量巨大的问题,提出了一种结合改进的同心圆算法与图形处理器(graphics processing unit, GPU)技术的高效SAR回波仿真方法。首先,针对常规同心圆算法精度较低造成的图像信噪比低的问题,提出了一种改进的同心圆算法。其次,为了充分发挥GPU处理核之间的并行优势,对该算法的GPU并行处理进行了深度优化,进一步提升了仿真速度。具体方法是,根据并行度的高低设计核函数,确定了先采用“线程外推”实现部分目标回波的同心圆累加,再用“归约相加”实现所有目标回波的累加。最后,与常规GPU方法进行了实验对比,验证了所提方法的精确性和高效性。相似文献

5.

基于多核CPU-GPU异构平台的并行Agent仿真

余文广王维平侯洪涛李群《系统工程与电子技术》2012,34(8):1716-1722

多核中央处理器（central processing units,CPU）-图形处理器（graphics processing units,GPU）异构平台为提高并行Agent仿真(parallel Agent-based simulation, PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU GPU的并行Agent仿真性能进行了实验分析。相似文献

6.

空中复杂目标对背景红外辐射的散射的并行计算 总被引：1，自引：0，他引：1

李良超牛武斌吴振森《系统工程与电子技术》2011,33(12):2573-2576

提出一种快速计算非朗伯面空中复杂目标对背景辐射的散射的方法。使用Modtran软件计算天地背景红外辐射亮度。将复杂目标表面划分成三角面元并在探测方向进行遮挡消隐处理,在图形处理器（graphic processing unit, GPU）内按背景光入射方向划分计算线程,线程内利用五参数双向反射分布函数（bidirectional reflectance distribution function, BRDF）模型计算可见面元对一个方向入射的红外辐射的散射亮度。把所有可见面元的计算结果加权平均获得复杂目标对背景辐射的散射亮度。通过对某飞机目标的计算结果对比发现,基于GPU的并行算法计算速度比中央处理器(central processing unit, CPU)提高了百倍以上。相似文献

7.

基于PSO的ML-PDA算法及其并行实现

高林唐续魏平《系统工程与电子技术》2015,37(12):2677-2682

针对密集杂波条件下的目标检测与跟踪问题,开展极大似然概率数据关联(maximum likelihood probabilistic data association, ML-PDA)算法优化与实时计算问题研究。在算法层面,通过在极大化对数似然比(log likelihood ratio, LLR)过程中引入粒子群优化(particle swarm optimization, PSO)方法,并进一步提出基于观测引导的PSO播撒粒子方式,提升算法的计算效率;在实现层面,提出基于图形处理器(graphic processing unit, GPU)的PSO实现策略。仿真实验结果说明了基于观测引导PSO算法搜索的有效性。在GPU平台上实现该算法获得显著的加速比,验证了所提出方法具有工程实时性。相似文献

8.

从SSE到OpenCL:多核CPU上骨骼动画并行算法对比研究

刘寿生陈戈马纯永韩勇《系统仿真学报》2015,(2):336-343,351

拥有高精度蒙皮和复杂骨骼绑定关系的骨骼动画,渲染时存在很大的性能瓶颈。以往研究采用GPU加速动画,但高端GPU成本过高,而中低端GPU的通用计算性能有时不如高端CPU。为充分挖掘算法在多核CPU上的执行性能,弥补中低端GPU通用计算性能的不足,提出了基于Open CL的针对指令和线程的新兴集成并行方案,并与基于SSE结合Open MP针对指令和线程的传统独立并行方案展开对比。实验结果表明,在多数CPU和多种复杂度的数据上,基于Open CL的新兴并行方案的性能明显高于基于SSE的传统并行方案,并且性能优势随着数据复杂度的增加而提升。相似文献

9.

基于GPU的地形遮挡剔除算法 总被引：3，自引：1，他引：3

达来曾亮李思昆《系统仿真学报》2006,18(11):3165-3167,3171

针对大规模地形场景，以GPU提供的遮挡查询功能为基础，提出了一种基于GPU的遮挡剔除算法。根据增量水平线原理，利用模板缓冲区进行重叠测试，并采用查询列表方法避免了CPU和GPU互相等待造成的延迟。实验结果表明，该算法有效地减少了送入图形流水线的几何数据，并在贴地漫游的情况下，显著提高了场景绘制速度。相似文献

10.

机载雷达通用并行信号处理系统设计

徐俊毅彭应宁王秀坛蔡晨曦《系统工程与电子技术》2001,23(6):16-18

针对机载雷达的高速大容量实时信号处理任务，为了提高系统的通用性，提出一种基于DSP芯片的机载雷达通用并行信号处理系统(AUPSPS)设计方案。该系统以DSP芯片为核心处理节点，采用各节点独立存储及数据流水方式实现多DSP的完全并行处理。系统具有通用性和可扩展性好，数据吞吐量大，并行处理效率高，系统结构简单清晰，硬件资源节省，设计开发简便等优点，不但可以灵活适应于机载雷达的各种数据处理算法，而且可应用于其它平台的雷达信号处理机中，实现雷达信号的高速实时并行处理。相似文献

11.

面向CPU、GPU多目标机的混合求解器设计与实现

马琳张雪松雷新丽包铁《系统仿真学报》2022,34(4):670-678

传统常微分方程的并行求解方法主要包括面向任务的并行和面向方法的并行,但是这两种求解算法,只能利用CPU,或者只能面向同质形式的ODE(ordinary differential equations)簇,存在严重不足.以 RIDC(revisionist integral deferred correction)算法为基... 相似文献

12.

基于GPU的外辐射源雷达信号处理实时实现方法

李晓波关欣仲利华胡东辉丁赤飚《系统工程与电子技术》2014,36(11):2192-2198

随着外辐射源雷达技术的发展,实时处理能力成为制约外辐射源雷达系统性能的重要因素。现有的处理手段仅适用于较小采样率信号以及低速目标的情况,对于数字电视信号等大带宽高采样率的外辐射源雷达信号以及高速小目标的情况很难满足实时性的要求。提出了一种基于图形处理器的外辐射源雷达信号处理实时实现方法,能够提高分块最小均方误差算法和Keystone算法的并行处理能力。通过真实数据验证表明基于所提结构的实现方法能够满足外辐射源雷达信号处理实时性的需求。相似文献

13.

基于SSC-tree流聚类的入侵检测算法

程春玲余志虎张登银徐小龙《系统工程与电子技术》2012,34(3):625-630

由于数据流具有快速、无限、突发等特性,实现高速网络下的实时入侵检测已成为一个难题。设计一种维持数据流概要特征的相似搜索聚类树(similarity search cluster-tree, SSC-tree)结构,在此基础上提出一种基于SSC-tree的流聚类算法用于高速网络的入侵检测。为适应高速、突发到达的数据流,算法采用了链式缓存、捎带处理和局部聚类策略。SSC-tree中的链式缓存区用于临时存放数据流突发时算法不能及时处理的数据对象,缓冲区中的内容随后被捎带处理。在高速数据流未插入SSC-tree参与全局聚类之前,利用局部聚类产生微簇来适应高速流的到达。实验结果表明,该算法具有良好的适用性,能够在高速网络环境下产生较好的聚类精度,有效实现高速网络环境下的入侵检测。相似文献

14.

基于无锚框的红外多类别多目标实时跟踪网络

宋子壮杨嘉伟张东方王诗强张硕《系统工程与电子技术》2022,44(2):401-409

本文提出一种改进的红外多类别多目标实时跟踪网络, 在确保跟踪精度的同时, 重新设计无锚框网络结构, 进一步降低网络的参数量与推理时间。通过优化目标特征向量, 进一步提高识别精度, 同时简化与改进跟踪流程。此外, 通过细化分析相关流程执行时间, 选用GPU与CPU分别执行最优运算, 提升跟踪整体运行速度。上述方法被应用于低空海面红外目标跟踪数据集中。结果表明, 在本文所提的综合评价指标下, 所设计的网络相较其他轻量级网络评分提高1.78, 且运行速度在NVIDIA Jetson Xavier NX中达到52.37 FPS, 满足边缘端实时运行需求。相似文献

15.

一种基于顶点纹理的LOD地形渲染算法 总被引：5，自引：0，他引：5

张桀宁 LI Shuai 《系统仿真学报》2008,20(7):1758-1764

Shader Mode 3.0引入的Vertex Shader Fetch是GPU可编程图形渲染技术发展的又一重要进展,基于该技术提出了一种新的地形渲染算法.算法主要特点是将地形高程数据组织成单通道纹理存放于显存,用于支持视点跟随的LOD地形渲染.绘制阶段,CPU端只需输入平坦的嵌套状的网格,GPU端首先根据当前视点参数计算该网格顶点的实际二维位置坐标,使用该坐标从地形纹理中采样出该顶点的高程值,这样平坦网格的顶点获取到实际的三维坐标值,图形渲染管线将继续处理直至输出显示.如此安排绘制流程可以彻底消减CPU计算负载,转而充分运用GPU高数据处理能力和可编程特性.实验表明,使用本算法绘制地形,效果逼真、绘制效率大大高于传统LOD地形绘制算法. 相似文献

16.

基于生物模型和GPU加速的实时鱼类运动仿真

李建明刘志轩迟忠先何荣盛《系统仿真学报》2007,19(16):3838-3842

针对目前鱼类运动实时模拟系统计算量大、复杂度高、很难在普通PC上进行实时模拟等问题,提出了一种基于生物模型和硬件加速的鱼类运动实时模拟方法,该方法在对鱼类生物模型和运动进行分析的基础上,对鱼类进行模块化建模,同时对鱼的运动进行分解并设计了统一的鱼类运动函数,通过GPU进行并行加速处理,提高了算法的运算速度,实现了在普通PC上的鱼类实时运动模拟,并取得了较好的效果。相似文献

17.

基于GPU的大规模多阶段任务系统可靠性并行计算方法

闫华汪贻生王锐淇刘波郭立卿肖骅《系统工程与电子技术》2019,41(1):215-222

针对大规模多阶段任务系统(phased-mission system, PMS)的可靠性求解,引入并行计算思想,通过分析传统的一致化方法(uniformization method, UM),基于Nvidia提出的CUDA(compute unified device architecture)架构,实现了基于图形处理器(graphics processing unit, GPU)的UM并行算法(GPU-UM),并采用合并访问和共享内存技术,提高了GPU中数据负载的利用率;PMS中不同阶段参与任务的设备及其数量通常会发生变化,导致阶段间依赖性处理困难。通过对新设备加入、已有设备暂时退出任务或完全退出任务等3种基本情况的分析,提出了阶段间状态映射机制,实际中的阶段变化情况更加复杂,可综合上述3种基本情况进行处理。通过算例对比了GPU-UM、CUDA-UM、传统UM和Krylov子空间等4种算法的计算时间和可靠性结果,分析表明GPU-UM算法的计算耗时优于其他方法,且结果精度也能满足可靠性计算需求;同时,通过对比分析UM算法和Krylov子空间算法与仿真方法的结果误差,表明提出的阶段间映射机制能够正确处理PMS中阶段间的复杂依赖关系。相似文献