首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
盛家川  陈雅琦  王君  韩亚洪 《红外与激光工程》2020,49(11):20200269-1-20200269-10
自然图像情感分类在分析用户需求、监控网络舆情等方面具有重要意义。然而基于深度学习的分类算法存在训练过程难以控制、分类结果缺乏解释的问题。为此提出一种人类知识驱动的深度学习结构优化算法。首先通过特征可视化显示卷积神经网络提取的情感特征;其次结合人类对图像情感可视化结果的感知来优化网络结构,利用人类知识驱动网络,重点学习情感信息更明显的特征;最后对所构建网络的参数进行微调,使其更适用于自然图像情感分类任务。在Twitter情感图像数据集上与其他分类方法的对比实验表明,所提出的算法获得了88.1%的分类准确率,优于其他方法。消融实验证明网络优化结果比未优化提高了8.1%。类激活图、空间位置和神经元组特征可视化直观解释了模型运作的过程与原因,进一步证实算法识别自然图像情感的能力。  相似文献   

2.
侯坤  李晨 《信息技术》2023,(10):44-51
针对现有深度学习图像去模糊方法依赖大量训练数据的问题,从图像先验信息出发,提出一种联合深度先验图像去模糊方法。用自编码-自解码网络和全连接网络,分别对潜像和模糊核的深度先验进行建模,在去模糊模型中加入TV(Total Variation)正则化和冲击滤波进行改进,从而提高方法的抗噪性能,增强复原图像细节,最后通过联合优化得到清晰图像。实验结果表明,该方法可以在不依赖大量训练数据的基础上进行图像去模糊,在公开数据集上获得的峰值信噪比值为29.24dB,结构相似度值为0.862,与其他方法相比在真实模糊图像上去模糊效果更好。  相似文献   

3.
随着深度学习概念的提出,深层神经网络成为机器学习的一个研究方向。在众多的神经网络模型中,卷积神经网络由于具有权值共享、局部感受野、降维等特点,取得了较好的应用成果。卷积神经网络结构包括输入层、卷积层、下采样层、全连接层、输出层,当前层的输出经过激活函数作用后成为下一层的输入。文章对卷积网络的数学模型进行详细推理,采用Python编码实现了深层卷积网络,分别在MNIST和CIFAR-10数据集上进行了测试。实验结果表明,无论是灰度图像还是彩色图像,卷积神经网络都具有较好的识别效果。  相似文献   

4.
王丽华  任磊  李斌  王枭雄 《现代导航》2020,11(3):218-221
本文提出了一种基于深度学习的雷达目标航迹起始方法,将目标航迹起始问题转化为深度神经网络模型二分类问题—“真实航迹”类和“虚假航迹”类。首先对空间配准后的目标点迹进行环形波门粗关联,得到粗关联暂时航迹;对粗关联暂时航迹进行特征向量建模,获得深度神经网络模型输入向量;利用仿真系统雷达数据,提取神经网络模型训练样本,设计深度全连接神经网络结构,训练网络模型得到优化的模型参数;使用训练好的模型参数实时计算目标起始航迹。仿真试验证明了该算法的有效性。  相似文献   

5.
端到端的梯度提升网络是由多个基学习器集合而成的神经网络.它与残差网络结构上有相似之处,二者后面的网络单元(学习器或残差块)都在前面网络单元的基础上继续学习,以逐渐逼近目标函数.端到端的梯度提升网络其网络结构较为复杂,我们对其工作机制的理解还不足.可视化技术有助于我们直观地理解网络内部的工作机制.本文着眼于探究端到端的梯...  相似文献   

6.
为了解决传统卷积神经网络用于人脸表情识别准确率不高的问题,提出了一种基于改进深度AlexNet卷积神经网络的表情识别方法。该方法基于AlexNet网络的基本结构,采用单图形处理单元(Graphics Processing Unit,GPU)进行训练,减少了两层卷积层和一层全连接层,在每层卷积层后加上批标准化(Batch Normalization,BN)代替原来的局部归一化,并在全连接层后加上Dropout正则化进一步防止过拟合。与AlexNet模型相比,改进的网络结构更简单、复杂度低、参数量少,可以节省大量模型训练时间进行快速预测,且更不易过拟合,同时加快了模型收敛速度,提高了网络泛化能力。在Fer2013数据集以及CK+数据集上进行实验,结果表明,所提方法分别得到了68.85%和97.46%的识别率,较其他人脸表情识别方法的识别率有一定提高。  相似文献   

7.
张伟  钱沄涛 《信号处理》2019,35(3):507-515
人脸关键点检测是计算机视觉中的典型问题之一,对于人脸三维重建、表情识别、头部姿态估计、人脸跟踪等有重要影响。目前基于深度神经网络的模型在人脸关键点检测性能表现最为突出,已被广泛采用。但是现有关键点检测深度神经网络结构设计越来越复杂,对于训练和测试需要的计算和存储资源要求越来越高。本文提出一种新的精简的关键点检测网络结构以代替现有的网络结构。相对其他网络结构,精简网络只包含一个特征提取模块,以及由几层反卷积层组成的上采样模块。此外我们在网络结构中加入对人脸所有关键点的全局约束,以减少预测离群点的产生。实验表明引入全局约束的精简网络结构在300-W数据集上取得的检测性能超出了目前典型深度神经网络检测模型。   相似文献   

8.
时文华  张雄伟  邹霞  孙蒙 《信号处理》2019,35(4):631-640
针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法。在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声。解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音。跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征。 对特征融合和特征拼接两种跳跃连接方式、基于L1和 L2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性。   相似文献   

9.
针对传统卷积神经网络(CNN)频谱感知方法提取特征能力受限于网络结构简单,增加网络结构又容易出现梯度消失等问题,该文通过在传统卷积神经网络中添加捷径连接,实现输入层恒等映射更深的网络,提出一种基于深度卷积神经网络(DCNN)的协作频谱感知方法.该方法将频谱感知问题转化为图像二分类问题,对正交相移键控(QPSK)信号的协方差矩阵进行归一化灰度处理,并作为深度卷积神经网络的输入,通过残差学习训练深度卷积神经网络模型,提取2维灰度图像的深层特征,将测试数据输入到训练好的模型中,完成基于图像分类的频谱感知.实验结果表明:与传统的频谱感知方法相比,在低信噪比(SNR)下、多用户协作感知时,所提方法具有更高的检测概率和更低的虚警概率.  相似文献   

10.
针对传统卷积神经网络(CNN)频谱感知方法提取特征能力受限于网络结构简单,增加网络结构又容易出现梯度消失等问题,该文通过在传统卷积神经网络中添加捷径连接,实现输入层恒等映射更深的网络,提出一种基于深度卷积神经网络(DCNN)的协作频谱感知方法。该方法将频谱感知问题转化为图像二分类问题,对正交相移键控(QPSK)信号的协方差矩阵进行归一化灰度处理,并作为深度卷积神经网络的输入,通过残差学习训练深度卷积神经网络模型,提取2维灰度图像的深层特征,将测试数据输入到训练好的模型中,完成基于图像分类的频谱感知。实验结果表明:与传统的频谱感知方法相比,在低信噪比(SNR)下、多用户协作感知时,所提方法具有更高的检测概率和更低的虚警概率。  相似文献   

11.
基于卷积神经网络的图像分类算法综述   总被引:1,自引:0,他引:1       下载免费PDF全文
杨真真  匡楠  范露  康彬 《信号处理》2018,34(12):1474-1489
随着大数据的到来以及计算能力的提高,深度学习(Deep Learning, DL)席卷全球。传统的图像分类方法难以处理庞大的图像数据以及无法满足人们对图像分类精度和速度上的要求,基于卷积神经网络(Convolutional Neural Network, CNN)的图像分类方法冲破了传统图像分类方法的瓶颈,成为目前图像分类的主流算法,如何有效利用卷积神经网络来进行图像分类成为国内外计算机视觉领域研究的热点。本文在对卷积神经网络进行系统的研究并且深入研究卷积神经网络在图像处理中的应用后,给出了基于卷积神经网络的图像分类所采用的主流结构模型、优缺点、时间/空间复杂度、模型训练过程中可能遇到的问题和相应的解决方案,与此同时也对基于深度学习的图像分类拓展模型的生成式对抗网络和胶囊网络进行介绍;然后通过仿真实验验证了在图像分类精度上,基于卷积神经网络的图像分类方法优于传统图像分类方法,同时综合比较了目前较为流行的卷积神经网络模型之间的性能差异并进一步验证了各种模型的优缺点;最后对于过拟合问题、数据集构建方法、生成式对抗网络及胶囊网络性能进行相关实验及分析。   相似文献   

12.
近年随着3维数据采集技术不断发展,大场景 点云数据的获取越来越方便。目前深 度学习网络框架在2维图像处理领 域越来越成熟,而大场景点云是一种3维无规则化的数据,3维卷积神经网络直接处理大场 景3维数据会存在分类精度低和计 算复杂等问题。因此为了有效解决基于深度学习的点云分类任务中存在的计算时间长和分类 精度低的问题,本文提出基于二值 神经网络的大场景点云分类方法,针对不规则的3维点云数据设计特征值计算方法,基于IR -Net二值神经网络处理输入的点云 特征图像,进一步采用Dynamic ReLU激活函数,提高神经网络的计算效率,最后得出点云分 类结果。实验结果表明,所提出 的方法在Oakland数据集上分类精度达到97.6%,在GML数据集中取得 了92.3%和97.2%的分类精度,实验结果证明Dy -ResNet 能够有效提升了点云分类的精度,减少计算的复杂度,并提高了训练效率。  相似文献   

13.
针对深度卷积网络原理分析的问题,该文提出一种基于模型重建的权值可视化方法。首先利用原有的神经网络对测试样本进行前向传播,以获取重建模型所需要的先验信息;然后对原本网络中的部分结构进行修改,使其便于后续的参数计算;再利用正交向量组,逐一地计算重建模型的参数;最后将计算所得的参数按照特定的顺序进行重排列,实现权值的可视化。实验结果表明,对于满足一定条件的深度卷积网络,利用该文所提方法重建的模型在分类过程的前向传播运算中与原模型完全等效,并且可以明显观察到重建后模型的权值所具有的特征,从而分析神经网络实现图像分类的原理。  相似文献   

14.
深度学习就是机器学习研究的过程,主要通过模拟人脑分析学习的过程对数据进行分析。目前,深度学习技术已经在计算机视觉、语音识别、自然语言处理等领域获得了较大发展,并且随着该技术的不断发展,为网络流量分类和异常检测带来了新的发展方向。移动智能手机与大家的生活息息相关,但是其存在的安全问题也日益凸显。针对传统机器学习算法对于流量分类需要人工提取特征、计算量大的问题,提出了基于卷积神经网络模型的应用程序流量分类算法。首先,将网络流量数据集进行数据预处理,去除无关数据字段,并使数据满足卷积神经网络的输入特性。其次,设计了一种新的卷积神经网络模型,从网络结构、超参数空间以及参数优化方面入手,构造了最优分类模型。该模型通过卷积层自主学习数据特征,解决了传统基于机器学习的流量分类算法中的特征选择问题。最后,通过CICAndmal2017网络公开数据集进行模型测试,相比于传统的机器学习流量分类模型,设计的卷积神经网络模型的查准率和查全率分别提高了2.93%和11.87%,同时在类精度、召回率以及F1分数方面都有较好的提升。  相似文献   

15.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。  相似文献   

16.
深度学习技术的应用给SAR图像目标识别带来了大幅度的性能提升,但其对实际应用中车辆目标局部部件的变化适应能力仍有待加强。利用数据内在先验知识,在高维语义特征中学习其内在的低维子空间结构,可以提升分类模型在车辆目标变体条件下的泛化性能。本文基于目标特征的稀疏性,提出了一种稀疏先验引导卷积神经网络(Convolution Neural Network,CNN)学习的SAR目标识别方法(CNN-TDDL)。首先,该方法利用CNN提取SAR图像目标的高维语义特征。其次,通过稀疏先验引导模块,利用特征稀疏性,对目标特征内在的低维子空间结构进行学习。分类任务驱动的字典学习层(Task-Driven Dictionary Learning,TDDL)将目标特征的低维子空间以稀疏编码的形式表示,再利用非负弹性正则网增强了稀疏编码的稳定性,使稀疏编码不仅有效地表征目标的低维子空间结构,并且能够提取更具判别性的类别特征。基于运动和静止目标获取与识别(Moving and Stationary Target Acquisition and Recognition,MSTAR)数据集以及仿真和实测配对和标记实验 (Synthetic and Measured Paired and Labeled Experiment,SAMPLE) 数据集的实验表明,相比于传统字典学习方法和典型深度学习方法,CNN-TDDL在MSTAR标准操作条件(Standard Operating Conditions, SOC)下识别精度提升0.85%~5.28%,型号识别精度提升3.97%以上,表现出更好的泛化性能。特征可视化分析表明稀疏先验引导模块显著提升了异类目标特征表示的可分性。   相似文献   

17.
Versatile video coding (VVC) is the newest video compression standard. It adopts quadtree with nested multi-type tree (QT-MTT) to encode square or rectangular coding units (CUs). The QT-MTT coding structure is more flexible for encoding video texture, but it is also accompanied by many time-consuming algorithms. So, this work proposes fast algorithms to determine horizontal or vertical split for binary or ternary partition of a 32 × 32 CU in the VVC intra coding to replace the rate-distortion optimization (RDO) process, which is time-consuming. The proposed fast algorithms are actually a two-step algorithm, including feature analysis method and deep learning method. The feature analysis method is based on variances of pixels, and the deep learning method applies the convolution neural networks (CNNs) for classification. Experimental results show that the proposed method can reduce encoding time by 28.94% on average but increase Bjontegaard delta bit rate (BDBR) by about 0.83%.  相似文献   

18.
The tremendous backlog of unanalyzed satellite data necessitates the development of improved methods for data cataloging and analysis. Ford Aerospace has developed an image analysis system, Satellite Image Analysis using Neural Networks (SIANN), that integrates the technologies necessary to satisfy NASA's science data analysis requirements for the next generation of satellites. SIANN will enable scientists to train a neural network to recognize image data containing scenes of interest and then rapidly search data archives for all such images. The approach combines conventional image processing technology with recent advances in neural networks to provide improved classification capabilities. SIANN allows users to proceed through a four-step process of image classification: filtering and enhancement, creation of neural network training data via application of feature extraction algorithms, configuring and training a neural network model, and classification of images by application of the trained neural network. A prototype experimentation testbed has been completed and applied to climatological data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号