首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 191 毫秒
1.
传统的花卉图像分类都是基于人工手动选择单一特征或者多特征融合再分类,这种方法普遍存在精度低、成本高、泛化能力弱等缺陷,针对目前深度学习在细粒度图像分类中的应用,提出一种基于残差网络、实现端到端的花卉图像分类方法。首先以ResNet18为基础模型,其次将全卷积结构的思想应用于网络模型中,将ResNet18的全连接层替换成卷积层以优化网络模型,最后在优化后的ResNet18中融入混合域注意力机制,由Softmax层进行分类。本文选取了Oxford17flowers和Oxford102flowers两个花卉图像数据集做对比试验,与前人的花卉图像分类方法对比,本文的方法取得了理想的效果,在Oxford17和Oxford102上分别取得了99.26% 以及99.02%的正确率,提出了一种基于注意力的残差结构改进方法,相较于前人的花卉图像分类方法,该方法能够更有效地提取关键信息的特征,抑制干扰区域的信息,对花卉图像分类具有显著性效果,适用于细粒度图像分类。  相似文献   

2.
在基于视频图像的动作识别中,由于固定视角相机所获取的不同动作视频存在视角差异,会造成识别准确率降低等问题。使用多视角视频图像是提高识别准确率的方法之一,提出基于三维残差网络(3D Residual Network,3D ResNet)和长短时记忆(Long Short-term Memory,LSTM)网络的多视角人体动作识别算法,通过3D ResNet学习各视角动作序列的融合时空特征,利用多层LSTM网络继续学习视频流中的长期活动序列表示并深度挖掘视频帧序列之间的时序信息。在NTU RGB+D 120数据集上的实验结果表明,该模型对多视角视频序列动作识别的准确率可达83.2%。  相似文献   

3.
提出一种基于卷积神经网络中残差网络的遥感图像场景分类方法。本文方法在原网络模型中嵌入了跳跃连接和协方差池化两个模块,用于连接多分辨率特征映射和融合不同层次的多分辨率特征信息,并在3个公开的经典遥感数据集上进行了实验。结果证明,本文方法不仅可以将残差网络中不同层次的多分辨率特征信息融合在一起,还可以利用高阶信息来实现更具代表性的特征学习。与已有的分类方法相比,本文方法在场景分类问题上拥有更高的分类精度。  相似文献   

4.
唐宏  朱龙娇  范森  刘红梅 《信号处理》2022,38(5):1075-1087
微表情是一种动态变化的面部表情,具有复杂的时空特征,给其识别带来了极大的困难。本文提出一种基于光流法与伪三维残差网络(P3D ResNet)的微表情识别方法,通过光流法对微表情运动信息建模,为网络提供关键信息的同时丰富数据空间维度,采用伪三维残差网络进一步学习微表情的时间和空间特征。首先,将三个主流的微表情数据集进行融合,并对融合的数据集进行预处理;然后使用TVL1光流法提取表征微表情运动信息的光流特征序列,将得到的光流特征序列与微表情灰度图像序列进行通道连接,形成一个新的三通道微表情图像序列;最后将获得的微表情数据进行数据增强送入伪三维残差网络同时提取微表情的时空特征以实现微表情的识别。其中,P3D ResNet是在残差网络的框架中采用二维卷积滤波器提取微表情的空间特征,一维卷积滤波器提取微表情的时间特征来模拟三维卷积滤波器。在融合数据集上的实验表明,本文方法的性能相对基准方法有了显著的改进,UF1和UAR分别提高了14.71%、14.58%。本文提出的方法在融合数据集及三个独立数据集上的识别性能优于现有较先进的方法,从而证明了本文的微表情识别方法的先进性和鲁棒性。   相似文献   

5.
高分辨率合成孔径雷达(Synthetic Aperture Radar,SAR)图像中不同目标的尺寸区别较大,这使得小目标的特征不明显,为目标检测带来了极大的挑战。针对这一问题,提出了SAR YOLO 960算法。该算法首先改进了图像输入大小的限制,将输入图像提升到960×960像素;进而改善了YOLOv3(You Only Look Once v3)网络的整体结构,修改并添加了卷积层和残差层,整体采用64倍降采样,使其速度大大提升;最后,根据SAR图像目标的特点,改进了损失函数,从而得到了SAR YOLO 960算法。在手工制作的高分辨率SAR图像数据集中的目标检测结果表明,相对于当前主流的检测算法,该算法性能显著提高;检测速度达32.8帧/秒,准确率达95.7%,召回率达94.5%。  相似文献   

6.
残差神经网络及其在医学图像处理中的应用研究   总被引:2,自引:0,他引:2       下载免费PDF全文
周涛  霍兵强  陆惠玲  任海玲 《电子学报》2020,48(7):1436-1447
残差神经网络(ResNet)是近几年来深度学习研究中的热点,在计算机视觉领域取得较好成就.本文对残差神经网络从以下几个方面进行总结:第一,阐述残差神经网络的基本结构和工作原理;第二,在模型发展方面,以时间为顺序总结了残差神经网络的8种网络模型;第三,在结构优化方面,从残差神经网络的卷积层、池化层、残差单元、全连接层以及整个网络5个方面进行总结;最后,将ResNet应用到医学图像处理领域,主要从图像识别和图像分割2个方面探讨.本文对残差神经网络的原理、模型、结构进行了系统地总结,对残差神经网络的研究发展具有一定的积极意义.  相似文献   

7.
针对深度学习中残差网络ResNet50存在的信息丢失、特征提取不充分、网络过拟合和训练困难等问题,文中提出一种基于改进ResNet50的图像分类算法。针对残差网络ResNet50在提取特征时存在丢失输入特征映射情况,造成信息丢失的问题,对主干网络中Stage4的下采样块添加平均池化层,进一步提高网络特征提取能力;针对ResNet50训练过程中存在网络过拟合以及泛化能力差的问题,使用标签平滑方法对交叉熵损失函数进行修改,有效缓解网络损失值震荡幅度;针对ResNet50计算量大、训练困难的问题,使用混合精度和余弦退火衰减方法对模型进行训练,在加快网络收敛速度的同时提高模型的分类精度。实验结果表明,与原ResNet50网络相比,文中算法在ImageNet-1k数据集上Top1和Top5的精度分别提升3.2%和1.6%,能够更好地应用于图像分类任务。  相似文献   

8.
针对通信信号调制识别的特征提取问题,为进一步提高识别准确率,提出了一种基于嵌套式跳跃连接结构的残差网络(ResNet of Nested Shortcut Connection Structure,ResNet_NSCS)调制识别算法。该算法在残差神经网络(Residual Neural Network,ResNet)基础上,通过借鉴ResNet多通路选择思路,引入嵌套式恒等跳跃连接结构,利用提取的特征实现不同调制方式的分类。仿真结果表明,面向RadioML2016.10a数据集,较卷积神经网络(Convolutional Neural Network,CNN)算法和卷积神经网络_长短时记忆网络(Convolutional Neural Network_Long Short Term Memory Network,CNN_LSTM)算法,以增加网络复杂度为代价,ResNet_NSCS算法收敛速度快,识别准确率高。  相似文献   

9.
陈禾  李灿  庄胤  杜海琳  龙腾 《信号处理》2021,37(3):317-327
合成孔径雷达(Synthetic Aperture Radar, SAR)对地观测具有覆盖面积广、多极化、多分辨率、全天时全天候观测的特点,被广泛应用于智能化监测系统。随着SAR遥感图像分辨率的提升,目标型谱级识别成为了一项挑战。本文使用聚束成像模式下10种型号车辆的0.3米分辨率、HH极化、多方位角的观测数据,针对型号类间差异小而导致的传统分类算法性能较差的问题,提出了多尺度特征提取残差结构,并结合高阶特征表示提升了深度卷积网络的分类性能,实现了高精度的SAR遥感图像车辆型谱级识别。所提出的方法在公开的MSTAR数据集上开展了详细的实验验证,结果表明本文提出的方法优于现有的智能化分类算法,对10种型号车辆目标识别的总体精度(Overall Accuracy, OA)达到了99.88%。   相似文献   

10.
基于扩张残差网络的雷达辐射源信号识别   总被引:1,自引:0,他引:1       下载免费PDF全文
秦鑫  黄洁  查雄  骆丽萍  胡德秀 《电子学报》2020,48(3):456-462
针对低信噪比条件下,复杂多类雷达辐射源信号识别存在特征提取困难,识别正确率低的问题,本文提出了一种基于时频分析和扩张残差网络的辐射源信号自动识别方法.首先通过时频分析将信号时域波形转换成二维时频图像以反映信号本质特征;然后进行时频图像预处理以保留时频图像完备信息,适应深度学习模型输入;最后构建扩张残差网络以自动提取信号时频图像特征,实现雷达辐射源信号分类识别.实验结果表明,信噪比为-6dB时,该方法对16类雷达辐射源信号的整体识别正确率能够达到98.2%,对时频图像特征相似的类LFM(Linear Frequency Modulation)信号的整体识别正确率超过95%.本文提供了一种新的雷达辐射源信号智能识别方法,具有较好的工程应用前景.  相似文献   

11.
深度学习技术的应用给SAR图像目标识别带来了大幅度的性能提升,但其对实际应用中车辆目标局部部件的变化适应能力仍有待加强。利用数据内在先验知识,在高维语义特征中学习其内在的低维子空间结构,可以提升分类模型在车辆目标变体条件下的泛化性能。本文基于目标特征的稀疏性,提出了一种稀疏先验引导卷积神经网络(Convolution Neural Network,CNN)学习的SAR目标识别方法(CNN-TDDL)。首先,该方法利用CNN提取SAR图像目标的高维语义特征。其次,通过稀疏先验引导模块,利用特征稀疏性,对目标特征内在的低维子空间结构进行学习。分类任务驱动的字典学习层(Task-Driven Dictionary Learning,TDDL)将目标特征的低维子空间以稀疏编码的形式表示,再利用非负弹性正则网增强了稀疏编码的稳定性,使稀疏编码不仅有效地表征目标的低维子空间结构,并且能够提取更具判别性的类别特征。基于运动和静止目标获取与识别(Moving and Stationary Target Acquisition and Recognition,MSTAR)数据集以及仿真和实测配对和标记实验 (Synthetic and Measured Paired and Labeled Experiment,SAMPLE) 数据集的实验表明,相比于传统字典学习方法和典型深度学习方法,CNN-TDDL在MSTAR标准操作条件(Standard Operating Conditions, SOC)下识别精度提升0.85%~5.28%,型号识别精度提升3.97%以上,表现出更好的泛化性能。特征可视化分析表明稀疏先验引导模块显著提升了异类目标特征表示的可分性。   相似文献   

12.
针对目前石化危险品装车过程中海量监控视频图像人为处理效率低下、模糊图像识别率低等问题,提出一种基于生成式对抗网络(GAN)和卷积神经网络(CNN)与极限学习机(ELM)相结合的监控模糊图像智能修复及检测方法.首先,使用深度学习网络作为 目标检测框架,利用GAN网络中生成器与判别器间的零和博弈对模糊图像进行复原,得到清晰完整的作业图像;其次,利用CNN自适应学习图像特征的能力,对修复后的图像进行自主特征提取;最后,将提取的图像特征输入ELM分类器中进行目标识别与分类,判断作业过程是否存在违规行为.试验结果表明:所提方法图像修复速度快,视觉效果自然,且目标识别准确率高,具有很好的泛化能力.  相似文献   

13.
基于合成孔径雷达(synthetic aperture radar,SAR)在图像目标识别领域中识别精度低的问题,设计一种利用并联卷积神经网络(convolutional neural network,CNN)来提取SAR图像特征的目标识别方法.首先利用改进的ELU激活函数代替常规的ReLU激活函数,建立与二次代价函数相结合的深度学习模型.其次采用均方根支柱(root mean square Prop,RMSProp)与Nesterov动量结合的优化算法执行代价函数参数迭代更新的任务,利用Nesterov引入动量改变梯度,从两方面改进更新方式,有效地提高网络的收敛速度与精度.通过对美国国防研究规划局(DARPA)和空军研究实验室(AFRL)共同推出的MSTAR数据集进行实验,实验表明,该文提出的算法能充分提取出SAR图像中各类目标所蕴含的信息,具有较好的识别性能,是一种有效的目标识别算法.  相似文献   

14.
李汪华  张贞凯 《电讯技术》2023,63(12):1918-1924
针对合成孔径雷达(Synthetic Aperture Radar, SAR)图像目标识别问题,提出了一种基于集成卷积神经网络(Convolutional Neural Network, CNN)的SAR图像目标识别方法。首先对原始数据集进行数据增强的预处理操作,以扩充训练样本;接着通过重采样的方法从训练样本中获取不同的训练子集,并在训练各基分类器时引入Dropout和Padding操作,有效增强了网络泛化能力;然后采用Adadelta算法与Nesterov动量法结合的思想来优化网络,提高了网络的收敛速度和识别精度;最后采用相对多数投票法对基分类器的分类结果进行集成。在MSTAR数据集上进行的实验结果表明,集成后的模型识别准确率达到99.30%,识别性能优于单个卷积神经网络,具有较强的泛化能力和较好的稳健性。  相似文献   

15.
Deep learning has recently been progressively introduced into the field of modulation classification due to its wide application in image, vision, and other areas. Modulation classification is not only the priority of cognitive radio and spectrum sensing, but also the link during signal demodulation. Combining the advantages of convolutional neural network (CNN), long short-term memory (LSTM), and residual network (ResNet), a modulation classification method based on dual-channel CNN-LSTM and ResNet is proposed to automatically classify the modulation signal more accurately. Specifically, CNN and LSTM are initially used to form a dual-channel structure to effectively explore the spatial and temporal features of the original complex signal. It solves the problem of only focusing on temporal or spatial aspects, and increases the diversity of features. Secondly, the features extracted from CNN and LSTM are fused, making the extracted features richer and conducive to signal classification. In addition, a convolutional layer is added within the residual unit to deepen the network depth. As a result, more representative features are extracted, improving the classification performance. Finally, simulation results on the radio machine learning (RadioML) 2018.01A dataset signify that the network's classification performance is superior to many classifiers in the literature.  相似文献   

16.
岳冰莹  陈亮  师皓  盛青青 《信号处理》2022,38(1):128-136
近年来,深度学习方法在合成孔径雷达(SAR)图像目标检测中得到了广泛的应用.船舶出现在近海、港口、岛礁、远洋等各种场景中,同时海洋环境复杂多变,使得船舶目标检测很难排除混乱背景的干扰.对于大纵横比、任意方向、密集分布的目标,精确定位变得更加复杂.本文基于深度学习的方法提出用于SAR图像目标检测的改进RetinaNet模...  相似文献   

17.
王哲昊  简涛  王海鹏  张健 《信号处理》2021,37(6):932-940
针对低信噪比条件下海面目标分类识别精度差的问题,该文提出了一种基于去噪卷积神经网络(Denoising convolutional neural network,DnCNN)的海面目标高分辨一维距离像(High Resolution Range Profile,HRRP)识别方法。所提方法设计了一个海面目标分类识别模型,该模型通过其中的降噪模块提高信噪比。首先,分析了HRRP和二维图像的相似特性,将HRRP降噪转变为二维图像降噪。其次,利用深层次卷积层与批归一化层相结合的结构,提取图像深层次的噪声特征,最后采用残差学习技术,减轻深层次网络的学习负担的同时重构图像进行分类识别。实验结果表明,该模型可以有效提升低信噪比条件下的海面目标分类识别正确率,在不同信噪比条件下其识别性能均优于对比模型,具有良好的识别性能和鲁棒性。   相似文献   

18.
为了实现对采摘后的果实进行快速、精确的外观品质分类,并配合分拣生产线完成果实大规模集中分拣,该研究提出了一种基于改进ResNet的果实分类方法。首先,将深度残差神经网络(deep residual neural network,ResNet)网络中的残差模块与双通道SE模块(dual channel squeeze-and-excitation block,DC-SE Block)结合,增强有效的通道特征并抑制低效或无效的通道特征,提高特征图的表达能力,从而提升识别精度;其次,在原始ResNet模型中加入Inception模块,将果实不同尺度的特征进行融合,增强对较小缺陷的识别能力;最后,对收集到的4类不同外观品质的果实图像进行数据增强并利用迁移学习的方法对模型进行初始化。以苹果为例进行的试验结果表明:经过数据集训练之后的改进模型,在测试集下的准确率达到99.7%,高于原模型的98.5%;精确率达到99.7%,高于原模型的98.3%;召回率达到99.7%,高于原模型的98.7%;在图形处理器(graphic processing unit,GPU)下的平均检测速度达到32.3帧/s,略低于原模型的35.7帧/s。与GoogleNet、MobileNet等几种目前先进的分类方法进行比较并对不同改进模型进行对比试验的结果表明,该方法具有良好的分类性能,对解决果实外观品质的精准分级问题具有重要参考价值。  相似文献   

19.
为了满足目标检测任务实时性的要求,基于轻量级深度学习目标检测网络SSD_Mobilenetv1,通过改进其网络结构,以及增加更细粒特征图参与位置回归和分类来综合网络的上下文信息及引入反残差模块提升网络提取特征的能力,实验表明在保证实时检测速度的同时提高了检测精度,并在KITTI数据集上进行训练验证,取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号