期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵晓红张发存王忠沈绪榜《微电子学与计算机》2003,20(Z1):4-7

基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积.对于N×N的图像和M×M(M＜N)的模板,卷积算法在单处理机上用传统的方法实现需要O(N2M2)时间.显然它应当采用数据并行的处理方法来实现.本文较详细地讨论了卷积算法在局部寄存器个数受限与不受限情况下的两维处理元阵列的数据并行实现方法,提出了一种适用于具有有限局部寄存器的-维处理元阵列的卷积并行算法,并对算法的复杂度进行了分析. 相似文献

2.

Sousuo:基于异构芯片架构的卷积神经网络在线调度算法

胥凌《长江信息通信》2022,(3):77-80

Chiplets已成为现代芯片设计中的常用方法。Chiplets提高了产量并实现了核心、内存子系统和互连级别的异构性。卷积神经网络(CNN)由于权重越来越大,其对计算、带宽及存储能力都有很高的要求。为了开发基于chiplet的芯片架构,CNN必须在计算资源的调度和工作负载分配方面进行优化。文章提出了一种在线方法Sousuo在chiplet芯片架构上生成和调度并行CNN流水线,Sousuo以计算性能和内存带宽的异构性为目标,通过快速网络探索技术调整流水线调度。比较了模拟退火、爬山优化和Pipe-Search。与其他算法相比,Sousuo的收敛时间平均提高了约35倍。不仅算法速度很快,Sousuo的解决方案通常也优于其他启发式探索算法。相似文献

3.

基于GPU的PCA图像融合算法研究

方民权周海芳姚天问申小龙《中国电子商情》2013,(2)

遥感图像融合技术是有效利用多传感器、多平台、多光谱、多时相遥感数据的主要途径.针对经典的主成分分析(PCA)融合串行算法,提出一种新的基于CPU/GPU异构系统的并行PCA融合算法.实验结果表明,基于CPU/GPU异构系统CUDA架构的并行PCA融合算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理4096×4096图像数据时,最高能获得将近134倍的加速速率,极大的提高了PCA融合算法在实际应用中的实时性. 相似文献

4.

基于开放运算语言加速的数字全息卷积重建算法实现

罗洪艳周珞一赵震郭洪冯晓波《电子与信息学报》2022,44(9):3258-3265

针对数字全息重建算法计算速度慢、实时应用能力弱以及现有GPU加速策略跨平台移植性差等问题，该文提出一种利用开放运算语言(OpenCL)架构提高数字全息重建算法执行效率的方案。该方案充分利用OpenCL架构的异构协同计算能力，对数字全息卷积重建算法进行CPU+GPU的异构运行设计，并采用数据并行模式编程实现。针对不同分辨率数字全息图、不同GPU加速平台的测试结果表明，该加速策略的平均执行时间均比CPU低1个数量级，最高总加速比达到54.2，并行运算加速比甚至高达94.7，且具有规模增长性及良好的跨平台特性，加速效率显著，更加适用于数字全息技术的工程化实现及实时性应用场合。相似文献

5.

基于多维度特征遥感图像分类方法的研究北大核心CSCD

王佳鑫任彦王盛越高晓文叶玉伟《光电子．激光》2022,(8):807-814

为了解决传统高光谱图像分类方法精度低、计算成本高及未能充分利用空-谱信息的问题,本文提出一种基于多维度并行卷积神经网络(multidimensional parallel convolutional neural network,3D-2D-1D PCNN)的高光谱图像分类方法。首先,该算法利用不同维度卷积神经网络(convolutional neural network,CNN)提取高光谱图像信息中的空-谱特征、空间特征及光谱特征;之后,采用相同并行卷积层将组合后的空-谱特征、空间特征及光谱特征进行特征融合;最后,通过线性分类器对高光谱图像信息进行精准分类。本文所提方法不仅可以提取高光谱图像中更深层次的空间特征和光谱特征信息,同时能够将光谱图像不同维度的特征进行融合,减小计算成本。在Indian Pines、Pavia Center和Pavia University数据集上对本文算法和4种传统算法进行对比实验,结果表明,本文算法均得到最优结果,分类精度分别达到了99.210%、99.755%和99.770%。相似文献

6.

基于异构多核平台的Caffe框架物体分类算法实现与加速

谢达周道逵季振凯戴新宇武睿《电子与封装》2019,19(5):16-21

随着深度学习的快速发展,神经网络和深度学习算法已经广泛应用于图像处理。基于FPGA的神经网络加速设计,搭建了以快速特征嵌入的卷积结构(Caffe)框架、卷积神经网络为核心的物体识别系统,该系统使用Zynq-7000系列异构多核架构芯片实现。完成了神经网络模型与参数的移植、多层结构的神经网络构建、计算密集度分析以及硬件加速设计。结果表明,设计的基于异构多核平台的Caffe框架物体分类系统实现了物体的识别和分类,且识别速度远超传统CPU架构的识别速度,从而为后续的深入研究提供一种新思路。相似文献

7.

基于深度卷积神经网络的自适应图像去雾算法

何宜鸿李彦锋黄树恺谭万钏《电子科技》2020,33(8):70-73

室外拍摄图像由于受雾气、雾霾、沙尘等大气颗粒杂质的影响呈现出图像灰白化,而现有的图像去雾算法存在过度依赖先验信息、透射率计算不精确的问题。针对上述问题,文中提出了一种基于深度卷积神经网络的自适应图像去雾算法。该算法基于大气散射模型实现了有雾图像的去雾,设计浅层提取、并行提取和深度融合共3个全卷积网络实现图像浅层特征与深层特征的融合,大幅提高了透射率图的准确性。去雾实验测试结果表明,文中所提出的算法对室外露天雾图具有良好的去雾效果,且去雾细节效果更加理想。相似文献

8.

基于递进卷积神经网络的台标识别及其并行化

许子立姚剑敏郭太良《电视技术》2016,40(5):67-73

针对台标的视觉特征,提出一种基于递进卷积神经网络的台标识别算法.该网络不仅有对图像特征进行隐性提取的卷积层和采样层,还包括识别常规台标的泛化模块和识别偏差台标的特异模块.针对串行卷积神经网络训练耗时长的缺点,提出基于Spark的并行递进卷积神经网络算法,采用数据共享及批处理方式对算法模型进行并行化处理.实验证明,递进卷积神经网络算法对台标进行识别能达到98％的正确率,多节点并行化卷积神经网络相比于单节点模型能有效缩短80％以上训练所需的时间. 相似文献

9.

基于异构多核原型芯片的NCS算法并行化

钱禹潘红兵何书专《微电子学与计算机》2014,(4):87-91

NCS算法(nonlinear chirp scaling,非线性调频变标)可以处理大耦合SAR(Synthetic Aperture Radar)回波,实现精确聚焦,但串行NCS算法的成像时间很难达到实时成像要求.为了提高算法效率,采用子孔径结构的NCS改进算法,在自主设计的NoC(Network on Chip)异构多核原型芯片上并行实现了实时NCS成像算法.与串行算法相比,并行化后可以大大缩短成像时间,通过与单次子孔径的理论计算值对比,得出实际并行效率达到90.06%. 相似文献

10.

基于级联码的信道编译码设计与FPGA实现 总被引：1，自引：0，他引：1

丁欢李生红《信息技术》2008,32(11)

介绍了RS(255,223)码级联卷积(4,3,3)码编译码器的实现,对于编码和译码端不同的结构特点.分别采用并行和串行结构实现.其中RS译码采用欧几里德算法,卷积译码采用维特比算法.同时给出了该编译码器的FPGA实现,按照自上而下的设计流程,在保证速度的同时最大限度地减少了资源占用. 相似文献