首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
高性能多核 DSP 的通信以及并行执行是多核系统设计的关键.文章分析了视频目标跟踪算法各模块的资源消耗,对各部分算法提出了并行计算的思路;提出改进的二值化掩膜法提取背景图像;提出辅助并行结构以使负载均衡;研究了 DSP多核通信的进程间通信(IPC)同步机制,运用流水线并行结构,实现三核同步并行处理系统.通过实验,测试了通信延迟时间,并把目标跟踪程序合理地划分到3个 DSP核中,实现并行处理,达到了实时性要求.  相似文献   

2.
在通用处理器上进行信号处理是软件无线电发展的方向之一,现有的共享存储并行编程(OpenMP)和直接线程并行法难以对信号处理进行并行加速。针对串行算法的并行化问题,引入多核流水线方法,对传统串行方法和多核流水线的实时性进行了分析对比。针对多核流水线的同步问题,研究了一种分布式的自适应线程同步方法。结合信号处理实例,对串行方法和多核流水线的实时性进行测试,结果表明多核流水线的吞吐率是串行方法的2.1倍,处理能力大大提高。  相似文献   

3.
雷达信号数据处理平台发展趋势探讨   总被引:2,自引:1,他引:1  
针对不断提高的雷达系统功能需求,提出了雷达信号数据处理的技术需求和特征,即雷达系统的功能拓展到电子对抗和通信等领域,算法和软件是研发雷达信号数据处理的关键.结合嵌入式数据互连技术、FPGA技术、DSP/CPU技术和处理平台系统架构技术发展,如高速串行数据传输技术、高性能FPGA芯片、并行多核CPU及DSP、基于交换网络的可重构平台及技术,分析和探讨了雷达信号处理平台的发展趋势.  相似文献   

4.
针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可采用的并行加速方法,同时结合SIFT的特点提出了并行优化加速的方案。采用基于数据划分的并行方法对遥感图像的几何校正和SIFT特征提取算法进行加速。最后利用CUDA环境,在CPU+GPU异构系统下,设计试验对两个算法优化并行提速,试验结果表明,提出的加速方案和优化算法能大幅提高遥感图像的前期处理效率。  相似文献   

5.
运动目标检测技术作为计算机视觉领域的研究热点之一,在智能安防、重点场所监控等领域应用广泛。为了在PYNQ-Z2开发平台上实现运动目标检测系统,基于软硬件协同设计的思想进行了系统功能划分。在可编程逻辑PL部分,使用Xilinx Vitis HLS工具进行图像处理模块硬件加速IP核的开发和整合。在处理系统PS端,通过Jupyter Notebook平台使用Python语言进行视频数据的读取以及硬件的调用。实验结果表明,在PYNQ-Z2平台上实现了运动目标检测系统,可同时对多个运动目标进行检测,在输入视频分辨率为800×600时的处理速度为14.3帧/秒,基本能满足实时性要求。  相似文献   

6.
为解决实际交通智能监控系统中视频传感器平台因移动或外部因素的影响发生晃动,导致视频运动目标检测跟踪性能下降的问题,文章提出了基于改进SIFT算法的精确配准动目标检测跟踪方法。该算法采用经典SIFT特征对图像配准,以此为基础实现高效、高精度的图像帧间差分运动目标检测,并采用自适应阈值分割算法完成对差分图像的分割,且通过区域合并策略解决分割产生的断裂及空洞问题,同时采用目标局部邻域特征和置信度判定准则,实现对运动目标的检测和持续稳定的跟踪。最后,基于多核DSP处理平台,通过实验验证了该算法应用于智能交通视频动目标检测跟踪的有效性。  相似文献   

7.
罗茜  赵睿  庄慧珊  罗宏刚 《信号处理》2022,38(12):2628-2638
针对无人机平台下小目标检测性能差、目标尺度变化较大、复杂背景干扰等导致跟踪失败的问题,该文提出一种联合优化检测器YOLOv5(You Only Look Once)和Deep-SORT(Simple Online and Realtime Tracking with a Deep Association Metric)的无人机多目标跟踪算法。该算法使用改进的CSPDarknet53(Cross Stage Paritial Darknet53)骨干网络重新构建检测器中的特征提取模块,同时通过自顶向下和自底向上的双向融合网络设计小目标检测层,采用无人机航拍数据集训练更新优化后的目标检测网络模型,解决小目标检测性能差问题;在跟踪模块中,提出结合时空注意力模块的残差网络作为特征提取网络,加强网络感知微小外观特征及抗干扰的能力,最后采用三元组损失函数加强神经网络区分类内差异的能力。实验结果表明,优化后的目标检测的平均检测精度相比于原始YOLOv5提升了11%,在UAVDT数据集上相较于原始跟踪算法准确率与精度分别提高了13.288%、3.968%,有效减少目标身份切换频次。  相似文献   

8.
章剑  仰枫帆 《电子科技》2012,25(10):106-108,113
运动估计是H.264/AVC视频编码标准中计算量最大、耗时最多的模块。为加速编码过程,基于NVIDIA公司提出的统一计算设备架构(CUDA)组成的异构系统,设计了一种并行运动估计算法。该算法采用顺序运动搜索方式,并且使用合成的方式得到宏块在不同划分模式下的绝对帧差和(SAD)值。将运动估计分为3个步骤:小宏块SAD值计算,合成其他形状块SAD值,归约获取最佳结果。各个步骤串行执行,而每个步骤内并行执行大量的线程。实验结果表明,在GTS450硬件平台上,与传统的基于CPU算法相比获得了平均超过50倍的加速比。  相似文献   

9.
LK(Lukas-Kanade)光流法在运动目标检测和跟踪领域具有广泛应用,但其计算复杂、速度慢,难以适应异构硬件平台。为实现LK光流法在不同平台上的高效运行,设计了一种基于开放式计算语言(OpenCL)的LK光流法并行算法。该算法通过将二维图像上像素点上的稠密计算映射到多线程上实现数据并行,并基于OpenCL平台的共享内存等优化方法减小了主机内存与设备内存数据传输。实验测试表明,该算法相比于多核CPU下的基础OpenCV函数库中的LK算法获得了最高31倍的加速比,同时在速度上与统一计算设备体系结构(CUDA)加速的LK光流法相近。此外,还在多种不同设备下验证了加速算法的平台通用性。  相似文献   

10.
针对视频监控系统智能化的要求,提出了一种基于嵌入式视频监控的人脸检测设计方案。采用在ARM-Linux操作平台上建立Servfox流媒体服务器,实现USB摄像头的视频采集和传输。在客户端首先采用帧间差分更新背景模型的改进算法获取运动目标,减少视频中运动目标对背景模型的影响,且为人脸目标的检测缩小了范围。在运动目标区域内,通过Ada-Boost人脸检测算法,最终获得人脸位置。结果表明,系统对人脸检测效果良好,准确率可达95.2%,检测时间22~27 ms/frame,满足视频监控的实时性要求。  相似文献   

11.
为有效定位识别和提取网络流量序列的暂态性异常特征,针对网络异常流量特征扰动性和暂态性特点,提出一种基于小波分解的二叉分类回归决策树主分量特征优化跟踪特征提取算法。利用训练集建立决策树模型,采用二叉分类回归决策树模型进行主分量特征优化跟踪建模,利用双正交提升小波分解得到的各层细节信号对暂态性扰动特征的敏感性,通过小波分解得到各层细节信号,将提取的小波分层细节信号的奇异值分解特征再返回到决策树主分量特征优化跟踪模型中,实现网络流量异常特征的定位提取和识别。仿真实验表明,改进算法的抗干扰能力和分辨率提高显著,暂态性异常特征谱图分辨能力提高,异常特征分布谱清晰可见,展示了较好的特征提取和状态识别性能。  相似文献   

12.
Automatic recognition of the communication signals plays an important role for various applications. This paper presents a novel intelligent system for recognition of digital communication signals. This system includes three main modules: feature extraction module, classifier module and optimization module. In the feature extraction module, multi-resolution wavelet analysis is proposed for extraction the suitable features. In the classifier module, a multi-class support vector machine (SVM) based classifier is proposed as the multi-class classifier. For optimization module, a particle swarm optimization algorithm is proposed to improve the generalization performance of the recognizer. In this module, it is optimized the SVM classifier design by searching for the best value of the parameters that tune its discriminant function, and upstream by looking for the best subset of features that feed the classifier. Simulation results show that the proposed hybrid intelligent system has high performance even at very low signal to noise ratios (SNRs).  相似文献   

13.
8mm战场侦察雷达信号处理系统的实现   总被引:1,自引:1,他引:0  
论述了8mm战场侦察雷达信号处理系统的距离估算、参数计算、硬件结构等问题。在距离估算中提出了综合相参积累和非相参积累的雷达距离公式。信号处理算法采用流水线结构,根据这一特点,整个硬件系统采用6片ADSP21060数字信号处理芯片,通过巧妙的连接组合实现了系统所要求完成的算法。通过扩展的串口和并口实现了和天控、计算机有效连接。  相似文献   

14.
Underground pipeline network surveillance system attracts increasingly attentions recently due to severe breakages caused by external excavation equipments in the mainland of China. In this paper, we study excavation equipments classification algorithm based on acoustic signal processing and machine learning algorithms. A cross-layer microphone array with four elements is designed to collect the acoustic database of representative excavation equipments on real construction sites. The generalized sidelobe canceller algorithm is employed for background noise reduction. The improved spectrum dynamic feature extraction algorithm is then implemented for the benchmark acoustic feature database construction of excavation equipments. To perform classification and background noise identification, the single hidden layer feedforward neural network is employed as the classifier. An improved algorithm based on the popular extreme learning machine (ELM) is proposed for classifier learning. The leave-one-out cross validation strategy is adopted for the regularization parameter optimization in ELM. Comprehensive experiments are conducted to test the effectiveness of the proposed algorithm. Comparisons with state-of-art classifiers and the Mel-frequency cepstrual coefficients acoustic features are also provided to demonstrate the superiority of our approach.  相似文献   

15.
夏攀  马飞  王中任 《激光与红外》2022,52(8):1259-1264
针对基于激光视觉自动焊接过程中,出现焊缝特征占比失衡,焊接偏移的问题,提出一种改进U Net模型,在U Net网络模型的基础上融合可学习的调整器模块,在编码块中接入特征增强模块,减少了弧光干扰,提升了焊缝特征提取的精度。以管道自动焊接机器人作为图像采集平台,设计了网络训练模型,同时辅以数据增强防止网络过拟合,实验结果表明,改进型U Net算法的像素分割准确率(acc)、平均交并比(mIou)、平均像素精确度(mpa)分别为9934%、8936%、9562%,与传统阈值分割算法、FCN算法、U Net算法、PSPNet算法相比,本文的精度指标最优,在强弧光干扰环境下能准确提取出焊缝特征,具有抗噪能力强,识别准确率高的优点。  相似文献   

16.
The pipeline form of the serial/parallel multiplier for constant numbers, which operates without insertion of zero words between successive data, is presented. The constant number is in Canonical Signed Digit (CSD) form and the other factor in two's complement form. The CSD form was chosen because it yields significant hardware reduction. Also, for the above data forms the Lyon's serial pipeline multiplier is examined. For these designs, a special algorithm for the multiplication of two's complement numbers with constant numbers in CSD representation was developed. The proposed serial pipeline multipliers are compared with the existing schemes from the point of hardware complexity.  相似文献   

17.
MS-UNet++:基于改进UNet++的视网膜血管分割   总被引:1,自引:0,他引:1  
本文针对视网膜图像中细微血管特征提取困难导致其分割难度高等问题,提出了一种 基于端到端的神经网络嵌套视网膜血管分割模型算法(简称MS-UNet++),该算法选取了深度监督网络UNet++作为分割网络模型,提升特征的使用效率;引入MulitRes模块,改善低对比度环境下细小血管的特征学习效果,并在特征提取后加上SENet模块进行挤压和激励操作,从而增强特征提取阶段的感受野,提高目标相关特征通道的权重。基于DRIVE图像数据集的实验结果表明,该算法分割结果与真实结果之间的重叠率DICE值为83.64%,并交比IOU为94.83%,准确度ACC为96.79%,灵敏度SE为81.78%,较现有模型有一定的提升,可用于视网膜图像血管分割,为临床诊断提供辅助信息。  相似文献   

18.
High-speed real-time digital frequency analysis is one major field of Fast Fourier Transform (FFT) application, such as Synthetic Aperture Radar(SAR) processing and medical imaging. In SAR processing, the image size could be 4 k×4 k in normal and it has become larger over the years. In the view of real-time, extensibility and reusable characteristics, an Field Programmable Gate Array(FPGA) based multi-channel variable-length FFT architecture which adopts radix-2 butterfly algorithm is proposed in this paper. The hardware implementation of FFT is partially reconfigurable architecture. Firstly, the proposed architecture in the paper has flexibility in terms of chip area, speed, resource utilization and power consumption. Secondly, the proposed architecture combines serial and parallel methods in its butterfly computations. Furthermore, on system-level issue, the proposed architecture takes advantage of state processing in serial mode and data processing in parallel mode. In case of sufficient FPGA resources, state processing of serial mode mentioned above is converted to pipeline mode. State processing of pipeline mode achieves high throughput.  相似文献   

19.
针对移动P2P流媒体系统中存在多视频源的特点,提出了多视频源串行和并行调度算法。串行调度算法,接收Peer通过实时侦测的QoS变化触发视频源的更换,并通过流序列时间模型来同步各个视频源。并行调度算法,多个视频源同时提供服务,并通过帧位分配算法分配各视频源的传输任务。帧位分配算法首先将视频序列分成包含固定帧数的块系列,然后进行块级位分配以充分考虑帧间效应。对于单个帧块位分配问题,算法将其建模成了非线性规划问题,通过引入分段线性R-D模型将该问题进一步转换成了普通的线性规划问题,并提出了一个贪婪实现策略。实验结果显示流分配算法能获得高效、平稳的视频质量,而且时间效率也非常高,能较好的满足移动P2P视频流媒体系统的实时性。  相似文献   

20.
张运超  陈靖  王涌天 《电子学报》2014,42(8):1503-1508
基于位置服务的移动增强现实以虚实融合的方式呈现用户周围环境.本文采用C/S架构实现基于视觉的移动增强现实系统,解决手机处理速度以及存储空间不足的问题.服务器端采用基于分布式聚类的词汇树算法进行城市级海量场景识别;手机端采用BRISK特征提取与光流算法相结合的6自由度跟踪注册方式.本文在UKbench以及SUN397数据库进行实验测试,实验结果表明,文中提出的分布式聚类算法能快速构建词汇树并有效解决单PC计算内存瓶颈;移动终端通过BRISK特征提取以及并行流水线设计,系统跟踪实时性良好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号