期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

韦文斐卓豫鑫建晓鹏《长江信息通信》2021,34(4):26-28

老式水表的人工抄表模式需要耗费大量的人工和时间成本。而当前计算机算力飞速增长,深度学习理论取得不断突破,利用神经网络和深度学习理论来实现水表读数的自动识别成为可能。为提高水表读数识别率,文章通过偏转和加噪实现数据集扩增,采用灰度化、二值化等操作对数据集进行预处理,在Tensor Flow框架下搭建卷积神经网络,选取3×3的卷积核组成三层卷积神经网络。试验结果表明,该方法的单个字符识别准确率能够达到99%,水表整体识别率稳定在97%。相似文献

2.

基于ZYNQ的可重构卷积神经网络加速器

刘杰葛一凡田明马力强《电子学报》2021,49(4):729-735

针对卷积神经网络中卷积运算复杂度高、计算量大及算法在CPU和GPU上计算时存在延时及功耗限制问题,从提高现有硬件平台计算速率、降低功耗角度出发,设计了一种基于ZYNQ的具有高吞吐率和低功耗的可重构神经网络加速系统.为充分利用运算资源,探索了一种卷积运算循环优化电路;为降低带宽访问量,设计了一种数据在内存中的特殊排列方式.以VGG16网络为例,利用ZYNQ对系统进行加速,在计算性能上达到62.00GPOS的有效算力,分别是GPU和CPU的2.58倍和6.88倍,其MAC利用率高达98.20％,逼近Roofline模型理论值.加速器的计算功耗为2.0W,能效比为31.00GOPS/W,是GPU的112.77倍和CPU的334.41倍. 相似文献

3.

基于FPGA的Winograd算法卷积神经网络加速器设计与实现

牛朝旭孙海江《液晶与显示》2023,(11):1521-1530

为实现卷积神经网络在低功耗、边缘计算等场景中的加速计算，设计了一种基于现场可编程门阵列（FPGA）的Winograd算法卷积神经网络加速器。首先，将图像数据和权重数据量化为8位定点数，并设计了硬件卷积计算过程中的量化流程，提升了数据传输速度和计算速度。接着，设计了输入数据缓存复用模块，将多输入通道数据融合后传输，复用了行重叠数据。然后设计了Winograd流水线卷积模块，实现列数据的组合复用，从而最大化重用了片上数据，降低了片上数据存储的占用和带宽压力。最后将加速器在Xilinx的ZCU104开发板上部署。经过实验验证，加速器的卷积层计算性能达到354.5 GOPS，片上DSP计算效率达到0.69，与相关研究相比，实现了1.6倍以上的提升。该加速器能够以高能效比完成基于VGG-16网络的遥感图像分类任务。相似文献

4.

基于深度卷积神经网络的飞机识别研究

唐小佩杨小冈刘云峰任世杰《电光与控制》2018,(5)

为快速准确识别机场遥感图像飞机目标,提出了一种深度卷积神经网络与边缘轮廓特征提取技术结合的识别算法。利用深度卷积神经网络对机场遥感图像中飞机目标进行深度特征提取,针对飞机停机位置存在阴影的问题,结合优化后的Canny算子得到目标轮廓,经由支持向量机给飞机分类。算法主要有两个阶段。第一阶段为训练阶段,主要对深度卷积神经网络进行训练,将获得的特征归一化;利用Canny算子得到边缘特征,通过主成分分析法得到飞机主轴,求解主轴两侧边缘点欧氏距离作为特征向量;接着完成支持向量机分类器训练。第二阶段为测试阶段,主要对算法进行验证并测试准确性。实验结果证明,算法识别的正确率高达94.39%,能够较好地识别飞机目标。相似文献

5.

基于轻量型卷积神经网络的图像识别

潘兵冯燕燕周悦曾上游杨远飞《电视技术》2018,(3):40-44

针对卷积神经网络参数数量多并且分类精度不高的问题,提出了基于轻量型的卷积神经网络模型.该模型是把上层输出先通过数量较少的卷积核,再通过并行操作得到与原模型相同维度的输出.并行处理时,通过不同的卷积核大小增加特征的多样性,最后采用级联或融合的方式把并行输出整合在一起.和同规模的模型相比,该模型在减少参数的同时增加了网络的深度.在实验阶段用该网络在caltech256和I01 food数据集上进行测试,实验结果表明该模型性能更优. 相似文献

6.

基于FPGA的CNN应用加速技术

《信息技术》2019,(12):110-115

FPGA(现场可编程门阵列)作为人工智能应用的新加速载体,可替GPU对人工智能应用推理阶段进行加速。文中提出了一种新的人工智能应用加速方案,利用定点、矩阵压缩等方法对卷积神经网络(CNN)模型进行处理,优化CNN网络模型,并设计开发一套驱动软件框架以适配国产平台。该技术在飞腾1500A国产服务器上对卷积神经网络中的人脸识别与目标检测应用进行加速,运算性能较目前国产服务器运算能力提升30倍以上,实现自主可控的人工智能应用加速。相似文献

7.

一种双向脉动数据流的全卷积神经网络加速器

涂凯杰朱宜炳许达文《微电子学与计算机》2020,(1):33-37

全卷积神经网络近年来被应用于深度学习中的多个领域,其不仅能处理简单的图像分类任务,还能应用于例如物体检测、语义/图像分割以及基于生成式对抗网络的生成型任务.典型的全卷积神经网络中不仅包括了传统的卷积层,还有反卷积层,它们都是计算密集型的.现在大多数研究者大都关注卷积层的设计优化,而反卷积的加速优化很少.本文提出了一种双向脉动数据流的全卷积神经网络加速器,可以同时高效地处理普通卷积层以及反卷积层.实验中选取了多个具有代表性的全卷积神经网络模型,例如DCGAN,Cascaded-FCN等.相较于以往传统的未优化的加速方案,本文所设计的加速器平均可以达到2.8倍的加速比,并且能耗降低了46.3%. 相似文献

8.

基于卷积神经网络的砂石骨料分类方法研究

鄢然廖记登吴小勇谢长江夏磊《激光与光电子学进展》2021,58(20):203-210

针对目前在检测商用砂石骨料的过程中,人工检测的效率低下且受到主观因素的影响较大以及检测的准确率不理想,提出一种基于卷积神经网络(Convolutional Neural Network,CNN)的砂石骨料图像分类模型CNN13,该分类模型参考经典卷积神经网络VGG16(Visual Geometry Group 16)模型进行网络结构的改进和参数优化,利用TensorFlow深度学习框架搭建一个13层的卷积神经网络结构.实验数据集采集于某商用混凝土生产企业日常生产中的砂石骨料,共5000幅数字图像,模型在训练过程中采用GPU进行高速计算.相比于VGG16模型,CNN13模型的卷积层和参数量较少,对GPU内存的要求更低,训练速度更快,分类的准确率更高,每个等级的砂石骨料的分类准确率都达到99％以上. 相似文献

9.

基于快速滤波算法的卷积神经网络加速器设计

王巍周凯利王伊昌王广袁军《电子与信息学报》2019,41(11):2578-2584

为减少卷积神经网络(CNN)的计算量,该文将2维快速滤波算法引入到卷积神经网络,并提出一种在FPGA上实现CNN逐层加速的硬件架构。首先,采用循环变换方法设计行缓存循环控制单元,用于有效地管理不同卷积窗口以及不同层之间的输入特征图数据,并通过标志信号启动卷积计算加速单元来实现逐层加速;其次,设计了基于4并行快速滤波算法的卷积计算加速单元,该单元采用若干小滤波器组成的复杂度较低的并行滤波结构来实现。利用手写数字集MNIST对所设计的CNN加速器电路进行测试,结果表明:在xilinx kintex7平台上,输入时钟为100 MHz时,电路的计算性能达到了20.49 GOPS,识别率为98.68%。可见通过减少CNN的计算量,能够提高电路的计算性能。相似文献

10.

基于上下文聚合网络的图像去噪性能分析

刘丽玲陶温霖邓天存李双钰郭婧王耀珩《长江信息通信》2021,34(3):24-29

近年来,随着神经网络理论的拓展,神经网络模型在图像处理领域得到了广泛的应用。利用上下文聚合网络实现双边滤波器算子逼近,分析其图像去噪性能。结果表明,逼近双边滤波算子的上下文聚合网络能够实现图像降噪,改善图像质量,且处理效果优于传统的双边滤波器。此外,对比分析了上下文聚合网络和去噪卷积神经网络的图像去噪性能。相比于去噪卷积神经网络,逼近双边滤波运算的上下文聚合网络处理多幅图像的速度更快,时效性更好,且随着处理图片数量增多,性能越优。相反,去噪卷积神经网络的去噪性能更优,但处理速度慢。相似文献

11.

基于稀疏卷积核的卷积神经网络研究及其应用

《信息技术》2017,(10):5-9

针对卷积神经网络训练图像数据时,其学习到的卷积核是杂乱无章,没有规则的,提出了基于稀疏卷积核的卷积神经网络算法。该方法通过对平方误差代价函数加入稀疏约束项,在反向传播中修正卷积核时,使其学习到的部分卷积核近似于一阶微分梯度算子,即学习到的卷积核中部分值是0或者趋于0,可更好地来提取图像边缘特征。通过对手语图像数据及车牌图像数据进行训练的实验结果显示,其学习到的部分卷积核具有近似一阶微分的模板形式;并且相对经典卷积神经网络,该算法的识别正确率有所提高。相似文献

12.

面向移动端的单阶段端到端目标检测压缩算法

下载免费PDF全文

童鸣何楚何博琨王文伟《信号处理》2019,35(12):2017-2028

近30年间,深度学习异军突起。它在各项计算机视觉任务中都取得了令人瞩目的进步,加之大量高质多样化数据的出现,使得各种依赖数据的目标检测方法重现曙光。然而,这些深度网络算法通常需要大量数据来支持数百亿参数的计算,其运行效率较低并且对存储空间的要求越来越高,使得在小型设备或移动端中无法嵌入大型神经网络。因此,本文提出优化目标检测算法以适应移动端环境,利用CNN卷积核多样性和可分离的原理,应用深度可分离卷积（Depthwise Separable Convolution）结构的理论,提出单阶段-端到端目标检测压缩网络DW-YOLOv3。最后,在带有详细标注的地面观测实况大规模基准数据集VisDrone2018数据集上的结果表明,本文提出的改进单阶段-可分离卷积目标检测压缩网络算法可以将网络参数压缩8-9倍,由于其增加了整体网络的深度,在对网络整体性能影响较小的同时提升了对无人机视角图像中小目标物体的识别性能。相似文献

13.

基于深度谱卷积神经网络的高效视觉目标跟踪算法

下载免费PDF全文

郭强芦晓红谢英红孙鹏《红外与激光工程》2018,47(6):626005-0626005(6)

提出了一种基于深度频谱卷积神经网络的视觉目标跟踪算法。该算法在深度模型训练阶段采用谱池化替代深度卷积神经网络中的最大池化过程,用贝叶斯分类器替代softmax损失层计算最大分类值,并将其整合到深度神经网络跟踪框架中,通过新网络计算输入正负样本的概率分布预测目标位置。该算法充分利用谱池化在频域下降维到任意维度且计算高效的优点,克服了最大池化采样造成大量空间信息丢失的不足,提升了计算速度。在权威多场景视频标准测试库上对所提算法进行验证,结果验证了该算法兼顾了效率和跟踪精度,有效提高跟踪器的性能,在相同测试条件下,文中算法性能优于同类对比算法。相似文献

14.

一种支持稀疏卷积的深度神经网络加速器的设计

周国飞《电子技术与软件工程》2020,(4):109-112

本论文针对深度升级网络中的卷积计算的循环特征,分析了当前已有的神经网络加速对于卷积计算的权重做二维并行和三维并行的实现方式,提出了一种新的神经网络加速器(DNNA)设计。本文DNNA合并二维并行和三维并行,并可根据卷积计算的参数特征灵活选择数据流,优化卷积计算的并行效率。本文DNNA对稀疏卷积可以既省略权重零值的计算,还可以均衡MAC算力。本文DNNA通过仿真和FPGA测试验证卷积计算正确性,在Xilinx ZYNQ-7000 FPGA板上,按256个MAC单元+256KByte Buffer实现,约需要27000 LUTs。相似文献

15.

基于深度卷积生成对抗网络的图像识别算法

《液晶与显示》2020,(4)

针对传统深度卷积生成网络收敛速度慢、稳定性较差的问题,本文在传统深度卷积生成对抗网络的基础上,提出了深度卷积生成对抗网络的优化算法。首先在预处理部分,融合了Canny算子和Prewitt算子的多个方向的卷积核来初始化输入图片参数,同时训练模块。为了减少训练时间,将训练分为3个阶段,每个阶段都采用不同的损失函数,从而提升网络的收敛速度及识别效果。最后再将训练后的判别网络中的卷积神经网络用来提取图像特征。LFW和CIFAR-100的实验证明,本文提出的算法具有很高的可行性和有效性,比传统生成对抗网络、CNN等图像识别具有更高的识别成功率,达到89.5%,为生成对抗网络在计算机视觉领域的应用提供了有益的参考。相似文献

16.

一种可配置的CNN协加速器的FPGA实现方法

下载免费PDF全文

蹇强张培勇王雪洁《电子学报》2019,47(7):1525-1531

针对卷积神经网络中卷积运算复杂度高而导致计算时间过长的问题,本文提出了一种八级流水线结构的可配置CNN协加速器FPGA实现方法.通过在卷积运算控制器中嵌入池化采样控制器的复用手段使计算模块获得更多资源,利用mirror-tree结构来提高并行度,并采用Map算法来提高计算密度,同时加快了计算速度.实验结果表明,当精度为32位定点数/浮点数时,该实现方法的计算性能达到22.74GOPS.对比MAPLE加速器,计算密度提高283.3%,计算速度提高了224.9%,对比MCA（Memory-Centric Accelerator）加速器,计算密度提高了14.47%,计算速度提高了33.76%,当精度为8-16位定点数时,计算性能达到58.3GOPS,对比LBA（Layer-Based Accelerator）计算密度提高了8.5%. 相似文献

17.

基于Wavelet-CNN网络的人类活动识别技术

张琳易卿武黄璐于乃文《无线电工程》2022,(4):590-597

针对传统的识别方法不能满足人类活动识别(Human Activity Recognition,HAR)技术研究需求的现状,提出了一种基于小波变换和卷积神经网络(Convolutional Neural Networks,CNN)相结合的深度学习模型.将多通道传感器的波形数据通过小波变换分解并重组作为输入.利用不同卷积核... 相似文献

18.

基于可变形和深度可分离卷积的立体匹配

高会敏徐志京《光电子．激光》2021,32(11):1180-1187

针对传统卷积神经网络(convolutional neural network, CNN)在立体匹配过程中存在信息损失和耗时等问题,提出了基于可变形和深度可分离卷积的立体匹配算法。在特征提取过程中,利用可变形卷积和可变形卷积核构建残差网络,完成自适应学习,扩大有效感受野,从而适应物体的不同形变,获取更详细的特征,减少信息损失, 提高了匹配精度。在特征聚合阶段,采用深度可分离卷积构建深度可分离聚合网络,在空间维度和通道维度分别进行卷积运算,以降低参数量和计算复杂度,保证了匹配实时性。在相关的数据集上进行测试,实验结果表明, 算法的网络运行时间缩短为1.60 s,在KITTI 2015和 KITTI 2012数据集上三像素错误率分别为2.84%和 2.79%,在SceneFlow数据集上端点误差为1.59 %。相比其他基准网络,减少了网络模型的运算量同时算法精度有很大提升。相似文献

19.

基于异构多核平台的Caffe框架物体分类算法实现与加速

谢达周道逵季振凯戴新宇武睿《电子与封装》2019,19(5):16-21

随着深度学习的快速发展,神经网络和深度学习算法已经广泛应用于图像处理。基于FPGA的神经网络加速设计,搭建了以快速特征嵌入的卷积结构(Caffe)框架、卷积神经网络为核心的物体识别系统,该系统使用Zynq-7000系列异构多核架构芯片实现。完成了神经网络模型与参数的移植、多层结构的神经网络构建、计算密集度分析以及硬件加速设计。结果表明,设计的基于异构多核平台的Caffe框架物体分类系统实现了物体的识别和分类,且识别速度远超传统CPU架构的识别速度,从而为后续的深入研究提供一种新思路。相似文献

20.

基于TensorFlow的手写数字识别系统

《信息通信》2018,(3)

为制作脱机手写数字识别系统,运用机器学习理论,在Tensor Flow平台下对K最近邻挖掘、循环神经网络、卷积神经网络等诸多算法进行了比对测试,最后以测试精度达到99.36%的卷积神经网络为核心算法制作了操作简便的手写数字识别系统。相似文献