首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
吴鹏  林国强  郭玉荣  赵振兵 《信号处理》2019,35(10):1747-1752
通道剪枝是深度模型压缩的主要方法之一。针对密集连接卷积神经网络中,每一层都接收其前部所有卷积层的输出特征图作为输入,但并非每个后部层都需要所有先前层的特征,网络中存在很大冗余的缺点。本文提出一种自学习剪枝密集连接网络中冗余通道的方法,得到稀疏密集连接卷积神经网络。首先,提出了一种衡量每个卷积层中每个输入特征图对输出特征图贡献度大小的方法,贡献度小的输入特征图即为冗余特征图;其次,介绍了通过自学习,网络分阶段剪枝冗余通道的训练过程,得到了稀疏密集连接卷积神经网络,该网络剪枝了密集连接网络中的冗余通道,减少了网络参数,降低了存储和计算量;最后,为了验证本文方法的有效性,在图像分类数据集CIFAR-10/100上进行了实验,在不牺牲准确率的前提下减小了模型冗余。   相似文献   

2.
尽管深度卷积神经网络在多种应用中取得了极大的成功,但其结构的冗余性导致模型过大的存储容量和过高的计算代价,难以部署到资源受限的边缘设备中。网络剪枝是消除网络冗余的一种有效途径,为了找到在有限资源下最佳的神经网络模型架构,提出了一种高效的柔性剪枝策略。一方面,通过计算通道贡献量,兼顾通道缩放系数的分布情况;另一方面,通过对剪枝结果的合理估计及预先模拟,提高剪枝过程的效率。基于VGG16与ResNet56在CIFAR-10的实验结果表明,柔性剪枝策略分别降低了71.3%和54.3%的浮点运算量,而准确率仅分别下降0.15个百分点和0.20个百分点。  相似文献   

3.
徐云飞  张笃周  王立  华宝成 《红外与激光工程》2020,49(7):20200170-1-20200170-7
给出一种基于轻量化卷积神经网络的空间非合作目标局部特征检测网络,即NCDN模型。在SSD模型中引入特征融合策略以适应不同距离下的检测需求,提高模型对图像尺度变换引起局部特征分辨率降低的鲁棒性;并采用不同压缩比例对MobileNetV2内部卷积通道数量做压缩,从而得到轻量化特征提取网络;对SPEED数据集进行局部特征标注与训练以验证NCDN适用的距离范围。实验结果表明,该模型能够在45 m内距离范围保证mAP达到0.90,同时通道压缩节省75%计算量后模型精度损失仅为5%。满足在轨检测精度和计算量需求。  相似文献   

4.
选取目标检测领域中常见的城市道路车辆作为识别目标,针对如今日益增长的目标检测网络模型计算量与移动端设备匮乏的计算资源相冲突的问题,提出了一种将Shuffl enet-V2轻量级神经网络模型融合进Yolov5目标检测框架中的方法,修改网络头部卷积层,加入注意力机制SE-Layer层,并将激活函数修改为H-Swish函数。实验选取UA-DETRAC公开数据集,结果表明,模型大小达到了1.53 M,在同等平均准确率的模型中达到最低,为目标检测模型在计算资源有限的移动端设备中的应用与部署提供了有效的参考。  相似文献   

5.
三维卷积神经网络比二维卷积神经网络具有更优越的时空特征提取能力,但运算量却显著增加。针对如何有效减少模型参数量、解决准确率随着计算复杂度降低而降低的问题,提出基于端到端的通道可分离卷积神经网络。通过分离通道交互作用和时空交互作用来分解三维卷积,其中分别利用3×3×3 Depthwise卷积和1×1×1常规卷积进行分离通道交互作用和时空交互作用。与传统三维卷积神经网络相比,通道可分离卷积神经网络加入模型正则化,通过降低训练精度同时提高测试精度,降低了模型的过度拟合。在UCF-101和HMDB-51数据集上的实验分别达到92.7%和64.5%的准确率。结果表明,通道可分离卷积神经网络可以提高准确率并降低计算复杂度。   相似文献   

6.
针对特殊材料能伪造手指静脉从而欺骗识别系统,以及利用卷积神经网络进行手指静脉识别计算量大的问题,设计了具有活体检测功能和轻量化卷积神经网络结构的手指静脉识别系统。采用光容积法检测手指脉搏波的变化,从而判断被采集对象是否为活体;利用剪枝及通道恢复方法改进了ResNet-18卷积神经网络,并结合L1正则化增加卷积神经网络的特征选择能力,在提升算法准确率的基础上,能有效地降低计算资源的消耗。实验表明,使用改进的剪枝及通道恢复优化结构,参数量降低了75.6%,计算量降低了25.6%,在山东大学和香港理工大学手指静脉数据库上得到的等误率分别为0.025%、0.085%,远低于ResNet-18得到的等误率(0.117%、0.213%)。  相似文献   

7.
针对卷积神经网络处理图像分类任务时提取特征不充分以及提取到的特征不区分贡献度的问题,提出了一种融合张量合成注意力的改进ResNet-101 (RTSA Net-101)网络模型。首先,利用ResNet-101骨干网络提取图像特征,并在残差网络卷积结构后嵌入张量合成注意力模块,对获取的特征进行三张量积计算,得到注意力特征矩阵;然后,使用Softmax函数对注意力特征矩阵进行归一化,从而为特征分配权重,以区分特征的贡献度;最后,将得到的权重和对应的键值加权求和,获取最终图像完整特征,以提升模型的图像分类精度。在自然图像数据集CIFAR-10、CIFAR-100和街牌号数据集SVHN上进行了对比实验,模型分类准确率分别为96.12%、81.60%、96.67%,图像平均测试运行时间分别为0.0258 s、0.0260 s、0.0262 s。实验结果表明:相比于其他7种先进图像分类模型,RTSA Net-101模型可以获得更高的分类准确率和更短的测试运行时间,且能够有效地增强网络的特征学习能力,具有一定的创新性、高效性。  相似文献   

8.
姚艺莲  裴东  蒲向荣 《光电子.激光》2023,34(11):1150-1157
针对火焰检测模型小目标检测能力差、模型体积大、计算复杂、难以部署到移动端设备的问题,提出了一种轻量化的DGC_YOLOv5 (you only look once v5)算法。本文首先调用k-means计算函数,计算出适合本文数据集的锚框尺寸;其次引入卷积块注意力机制(convolutional block attention module, CBAM),提高算法对小目标的检测能力;然后利用轻量型的Ghost模块对主干网络中的C3模块进行改进;最后利用深度可分离卷积(depthwise separable convolution, DS_Conv),用简单的线性计算代替复杂计算,降低模型复杂度,减小模型体积。实验表明,相比原始的YOLOv5算法,本文算法在测试集上的平均精度均值(mean average precision,mAP)可达到94.4%,比原始算法提高1.7个百分点,在视频测试集上平均检测速度可达到71 FPS,可以满足实时检测的要求,参数量和计算量分别减少为原来的41.2%和34.8%,模型大小减少8.4 M,便于后续移动设备端的部署。  相似文献   

9.
3维卷积神经网络(3D CNN)与双流卷积神经网络(two-stream CNN)是视频中人体行为识别研究的常用架构,且各有优势。该文旨在研究结合两种架构且复杂度低、识别精度高的人体行为识别模型。具体地,该文提出基于通道剪枝的双流-非局部时空残差卷积神经网络(TPNLST-ResCNN),该网络采用双流架构,分别在时间流子网络和空间流子网络采用时空残差卷积神经网络(ST-ResCNN),并采用均值融合算法融合两个子网络的识别结果。进一步地,为了降低网络的复杂度,该文提出了针对时空残差卷积神经网络的通道剪枝方案,在实现模型压缩的同时,可基本保持模型的识别精度;为了使得压缩后网络能更好地学习到输入视频中人体行为变化的长距离时空依赖关系,提高网络的识别精度,该文提出在剪枝后网络的首个残差型时空卷积块前引入一个非局部模块。实验结果表明,该文提出的人体行为识别模型在公共数据集UCF101和HMDB51上的识别准确率分别为98.33%和74.63%。与现有方法相比,该文模型具有参数量小、识别精度高的优点。  相似文献   

10.
迟凯  魏书伟 《电子测试》2022,(8):58-59+57
为解决传统的卷积神经网络的卷积结构单一、分类精度不佳且模型参数和计算量较大等问题,本文对经典的传统网络Alexnet进行网络结构优化进行多通道改进,构建了Tra-net、Mynet v1、Mynet v2三条不同的网络。将三种不同的卷积神经网络在公开数据集Caltech256上进行识别性能测试,其中Mynet v2网络最高识别准确率可达59.56%,且模型缩小至25MB左右。实验结果表明改进后网络Mynet v1、Mynet v2的识别性能均优于传统的神经网络Tra-net,使用瓶颈结构卷积模块的网络在提高识别准确率的同时大幅度降低了网络模型参数。  相似文献   

11.
本文针对处理图像分类的卷积神经网络(CNN)模型,设计并应用修正的三项PRP共轭梯度法(M-PRPCG)训练模型以提高图像分类的准确率。首先,基于CIFAR-10图像分类数据集构建ResNet18和VGG16卷积神经网络(CNN)模型;然后在训练集上,采用修正的三项PRP共轭梯度法(M-PRPCG)训练模型;最后在测试集上进行验证。实验结果表明,修正的三项PRP共轭梯度法(M-PRPCG)训练的ResNet18和VGG16模型相比于Adam算法训练的模型在图像分类准确率上分别提高了3.46%和1.97%。  相似文献   

12.
针对目前大多数人脸识别算法参数多、计算量大,难以部署到移动端和嵌入式设备中的问题,提出了一种基于改进MobileFaceNet的人脸识别方法。通过对MobileFaceNet模型结构的调整,将bottleneck模块优化为sandglass模块,改良深度卷积和逐点卷积的相对位置,适当增大sandglass模块的输出通道数,从而减少特征压缩时的信息丢失,增强人脸空间特征的提取。实验结果表明:改进后的方法在LFW测试数据集上准确率达99.15%,模型大小和计算量分别仅为原算法的61%和45%,验证了所提方法的有效性。  相似文献   

13.
协作智能是一种实现深度神经网络(Deep Neural Network,DNN)分布式部署的新范式,广泛适用于物联网系统视觉场景感知应用。在该范式中,DNN模型被划分为边缘子模型和云端子模型两部分,分别部署在移动边缘设备和云服务器上,由两者协作完成推理任务。协作推理过程中需要对边缘子模型生成的深度特征进行压缩,通过无线信道传输给云端子模型,以降低传输延迟和传输能耗。为了提高深度特征的压缩率,提出了一种基于轻量级卷积神经网络的深度特征压缩方法(LCFC)。该方法设计了一种简单高效的深度特征压缩器,它利用轻量级卷积神经网络和均匀量化器对深度特征进行通道维度压缩、空间维度压缩和量化,能显著提升深度特征的压缩率,减少用于传输深度特征所需的比特数。所提出的方法在CIFAR-100图像分类任务上进行了充分实验,实验结果表明,在保证推理精度退化小于1%的情况下,与基线方法相比,该方法将深度特征压缩率最高提升了31.5%。  相似文献   

14.
传统卷积神经网络大量的计算及内存需求使嵌入式设备智能应用的开发成为挑战,为尝试将高度复杂的深度学习应用与性能有限的低成本嵌入式平台相结合,设计了一款小型嵌入式图像分类系统。实验基于结构化稀疏学习算法在Caffe框架下构建结构稀疏卷积神经网络模型,将其部署在工业派(IndustriPi)最小化系统上,通过测试得到了85.5%的准确率和处理实时影像时不小于8帧/s的运行速度。与经典模型相比,通过稀疏学习后的网络模型很大程度上减少了计算量和内存占用率,提高了低成本嵌入式设备的运行速度。  相似文献   

15.
针对目标检测网络部署在嵌入式端受硬件资源、算法模型规模等因素限制的问题,提出一种基于国产嵌入式芯片与轻量级目标检测网络结合,实现低成本、高性能的离线实时目标检测的轻量化系统设计方案。该系统硬件部分采用海思Hi3516D作为网络部署的主控芯片,其内部集成了高性能的卷积神经网络加速引擎,成本也远低于国外的硬件加速方案。软件部分采用YOLO-Fastest-XL作为目标检测网络,其在VOC2007数据集平均准确率为69.43%,模型大小为3.5 MB,与轻量级目标检测网络MobileNet-SSD相比,准确率仅低2.77%,模型大小却只有MobileNet-SSD的15%。结果表明,该系统的目标检测通过逐帧处理的方式可达33 f/s,通过抽帧处理的方式可达59 f/s,均满足实时检测的效果。  相似文献   

16.
基于自注意力机制的干扰信号检测识别   总被引:2,自引:0,他引:2  
为了解决卫星通信系统在对抗电磁环境中的干扰实时检测识别问题,提出了一种基于自注意力(Self-attention,SA)机制的高效轻量化网络模型。通过采用DenseNet加速对原始IQ信号的特征提取,并引入自注意力模块代替参数量较大的多重卷积层,实现对卫星通信系统中常见的干扰样式进行分类识别。仿真结果表明,在识别准确率方面达到常规的神经网络模型和算法性能水平的条件下,所提模型在网络复杂度和运算时延方面得到有效压缩。  相似文献   

17.
为了解决自然场景包裹破损检测中由于目标形态与尺度多样、模型耗时过长造成的检测难题,设计了一种基于通道注意力机制与快速空间金字塔池化(Space Pyramid Pool-Fast, SPPF)的轻量级包裹破损检测算法。在YOLOv5s的基础上,使用改进的ShuffleNetV2网络模型对其主干结构进行轻量级优化,降低模型计算量,提高检测速度;在模型的主干网络部分引入通道注意力机制——Squeeze Excitation(SE),减少了卷积神经网络对图像相关特征的重复提取,提高信息的表征能力;利用SPPF有效避免了对图像区域裁剪、缩放操作导致的图像失真,有效减少误检与漏检。在数据集上的测试结果表明,该方法对包裹图像的检测速度达到了68.5帧/秒,模型计算量仅为2.5 GFLOPs,与YOLOv5s相比,检测速度提升了105.7%,模型计算量下降了84.2%,利于边缘计算设备部署。  相似文献   

18.
黄赟  张帆  郭威  陈立  羊光 《电子学报》2023,(3):639-647
当前卷积神经网络模型存在规模过大且运算复杂的问题,难以应用部署在资源受限的计算平台.针对此问题,本文基于数据标准差提出了一种适合部署在现场可编程门阵列(Field Programmable Gate Array, FPGA)上的对数量化方法 .首先,依据FPGA的特性提出对数量化方法,将32 bit浮点乘法运算转换为整数乘法及移位运算,提高了运算效率.然后通过研究数据分布特点,提出基于数据标准差的输入量化及权值混合bit量化方法,能够有效减少量化损失.通过对RepVGG、EfficientNet等网络进行效率与精度对比实验,8 bit量化使得大型神经网络精度仅下降1%左右;输入量化为8 bit,权重量化为10 bit场景下,模型精度损失小于0.2%,达到浮点模型几乎相同的准确率.实验表明,所提量化方法能够使得模型大小减少75%左右,在基本保持原有模型准确率的同时有效地降低功耗损失、提高运算效率.  相似文献   

19.
由于自然条件下拍摄的花卉图像背景复杂,而且其存在类内差异性大和类间相似性高的问题,现有主流方法仅依靠卷积模块提取花卉的局部特征难以实现准确的细粒度分类。针对上述问题,本文提出了1种高精度、轻量化的花卉分类方法(ConvTrans-ResMLP),通过结合Transformer模块和残差MLP(multi-layer perceptron)模块实现对花卉图像的全局特征提取,并在Transformer模块中加入卷积计算使得模型仍保留提取局部特征的能力;同时,为了进一步将花卉分类模型部署到边缘设备中,本研究基于知识蒸馏技术实现对模型的压缩与优化。实验结果表明,本文所提出的方法在Oxford 17、Oxford 102和自制的Flowers 32数据集上的准确率分别达98.62%、97.61%和98.40%;知识蒸馏后本文的轻量化模型的大小约为原来的1/18,而准确率仅下降2%左右。因此,本研究能较好地提升边缘设备下花卉细粒度分类的效率,对促进花卉培育的自动化发展具有切实意义。  相似文献   

20.
刘芳  韩笑 《电子学报》2021,49(11):2171-2176
针对无人机着陆地貌图像场景复杂、纹理特征丰富等问题,提出一种基于小波变换和深度网络的无人机着陆地貌图像分类算法.利用非下采样小波变换(Non-Subsampled Wavelet Transform,NSWT)的快速压缩能力,将小波变换后的前两层子图系数引入到卷积神经网络(CNN)中,压缩数据量.根据无人机着陆地貌图像的特点,采用轻量化卷积模块设计了15层卷积神经网络.通过支持向量机(SVM)实现复杂地貌场景的正确分类.实验结果表明:所提算法具有良好的特征表达能力,提升了着陆地貌图像的分类准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号