首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为了使人脸表情识别更加快速、准确,以满足复杂社会情境中的需求,本文研究了基于深度卷积神经网络的人脸表情识别方法,实现了人脸不同离散表情识别分类.针对现有数据集数据量不足、深度网络计算易出现过拟合现象等问题,本文基于人脸图片关键点进行了剪裁,获得64个子区域,将数据扩充为64倍,以达到数据增强的目的;使用基于VGG-19网络模型的卷积神经网络,对动作单元进行分类与强度计算,使用Sigmoid函数,使网络具备多标签多分类能力,并在VGG-19网络的第四组卷积层之后加入一个加权处理层,提高准确率.结果显示,增强后叠加的人脸表情识别与分类基本能够完成,而引入加权处理层后的准确率则得到了显著提高.  相似文献   

2.
针对传统面部识别方法中网络模型重要通道特征关注度欠缺、参数过多、准确率低等问题,提出一种基于改进VGG19网络(Visual Geometry Group, VGG19)的表情识别方法。该方法在VGG19网络的每组卷积层之间都加入一个新模块,新模块由三方面组成:SE注意力机制模块、BN批量归一化层、PReLU激活函数,SE模块中的原激活函数ReLU替换为Mish激活函数,加速收敛,提升网络对面部细节关注度;对全连接层参数量进行修改,去除第一层全连接层和第二层全连接层,最大池化层替换为全局混合池化,达到卷积层加全局混合池化、一层全连接层的组合。原网络中全连接层节点数由[4 096,4 096,1 000]改进为[512,7],改善了VGG网络庞大参数量的特征,增加抗过拟合效果。在CK+和FER-2013表情数据集上准确率分别达到98.990%和73.112%,证明所提方法具有较好的泛化性和准确率。  相似文献   

3.
表情识别作为计算机视觉领域的研究热点,在情感识别、人机交互、智能安防等领域有着重要的应用.文章针对VGG19在训练人脸表情数据集时由于全连接层参数量过大而易过拟合的问题,利用胶囊网络CapsNet对VGG19的全连接层进行替换,以实现VGG19与CapsNet相级联,从而改善训练时过拟合的问题,同时使得级联后的模型在RAF-DB数据集上的精度提高了5.28%.针对VGG19特征提取网络的MaxPool易丢失人脸特征图信息的问题,利用SoftPool对MaxPool进行替换,从而在最大程度上保留了人脸的细粒度特征.实验结果表明,改进后的模型在RAF-DB数据集上取得了 84.21%的精度,在FER2013数据集上取得了 73.16%的精度,表情识别效果更优.  相似文献   

4.
针对动作特征在卷积神经网络模型传输时的损失问题以及网络模型过拟合的问题,该文提出一种跨层融合模型和多个模型投票的动作识别方法。在预处理阶段,借助排序池化的方法聚集视频中的运动信息,生成近似动态图像。在全连接层前设置对特征信息进行水平翻转结构,构成无融合模型。在无融合模型的基础上添加第2层的输出特征与第5层的输出特征融合结构,构造成跨层融合模型。训练时,对无融合模型和跨层融合模型两种基本模型采用3种数据划分方式以及两种生成近似动态图像顺序进行训练,得到多个不同的分类器。测试时使用多个分类器进行预测,对它们得到的结果进行投票集成,作为最终分类结果。在UCF101数据集上,提出的无融合模型和跨层融合模型的识别方法与动态图像网络模型的方法相比,识别率有较大提高;多模型投票的识别方法能有效缓解模型的过拟合现象,增加算法的鲁棒性,得到更好的平均性能。  相似文献   

5.
为解决便于发现我国基本农田被非法侵占的问题,针对现有神经网络收敛速度慢、识别准确率不高的缺点,提出一种基于卷积神经网络的遥感图像农田分类及识别方法。该算法使用较大的卷积核,有效地提取梯度信息;设计深度为6层的卷积神经网络,提高了网络的分类效果,且大大降低了网络的训练次数。实验结果表明,利用该识别模型对农田、建筑、荒漠以及植被的识别准确率达到98.15%,比经典AlexNet网络模型提高了6.1%;训练网络所需的迭代次数由1.49×10~6次左右降低到4 500次。因此,与经典AlexNet网络相比,改进的AlexNet网络用于遥感图像分类和目标图像识别,耗时更短、识别准确率更高。  相似文献   

6.
本文提出了一种基于改进AlexNet的双模态握笔手势识别方法.该方法根据握笔手势特征自建了 8 100张握笔手势数据集,对数据集进行了手势分割获取二值图像、骨架提取获取包含原图的骨架图像等处理,并将处理后的2种类型图像构成双模态图像输入至改进的AlexNet中.针对AlexNet提取握笔手势特征不充分的问题,本文将AlexNet第一层的卷积核大小修改为3×3,并在卷积层之后添加了批量归一化、注意力机制.通过实验证明,该方法对9种握笔手势的平均识别率达到75.6%,分别高于骨架图像、分割图像、AlexNet网络11%、16%和13%,证明了该模型对握笔手势识别的有效性.  相似文献   

7.
针对传统卷积神经网络在表情特征提取阶段容易丢失大量有用信息,无法提取到高判别性表情特征,从而导致表情识别率低的问题,提出一种基于多尺度特征融合注意力机制的人脸表情识别方法.首先,采用VGGNet16来提取卷积特征.为了避免表情特征信息的丢失,将网络中不同层次卷积层的输出特征图进行多尺度特征融合,引入上下文信息的同时提取...  相似文献   

8.
苏志明  王烈 《电讯技术》2021,61(4):396-402
针对人脸表情类内差异大、类间相似度高导致识别率低的问题,提出了一种基于角度距离损失与小尺度核网络的表情识别方法.网络基于3×3卷积核,在网络中加入融合空间金字塔注意力的点积残差块,引入Dropblock正则化,并提出了低层特征掩膜化.该模型低层特征具备高层特征的语义信息,而且参数量较少,结构简单有效.训练时,使用提出的基于角度距离损失函数监督神经网络学习,提高了网络的类间特征分离和类内特征聚类的特征判别能力.实验结果表明,该方法在CK+和FER2013数据集上识别准确率分别达到了97.88% 和72.81%,具有较强竞争力.此外,消融实验表明所提出的改进方法可提高表情识别率,进一步验证了其有效性.  相似文献   

9.
苏志明  王烈 《电讯技术》2021,61(4):396-402
针对人脸表情类内差异大、类间相似度高导致识别率低的问题,提出了一种基于角度距离损失与小尺度核网络的表情识别方法.网络基于3×3卷积核,在网络中加入融合空间金字塔注意力的点积残差块,引入Dropblock正则化,并提出了低层特征掩膜化.该模型低层特征具备高层特征的语义信息,而且参数量较少,结构简单有效.训练时,使用提出的基于角度距离损失函数监督神经网络学习,提高了网络的类间特征分离和类内特征聚类的特征判别能力.实验结果表明,该方法在CK+和FER2013数据集上识别准确率分别达到了97.88% 和72.81%,具有较强竞争力.此外,消融实验表明所提出的改进方法可提高表情识别率,进一步验证了其有效性.  相似文献   

10.
针对现有的高分辨率遥感图像居民地信息提取精度和效率不够高的问题,提出了一种基于改进全卷积网络的“高分一号”(GF-1)遥感影像居民地提取方法。首先,通过专业的目视解译制备大量居民地训练样本;然后,将预训练过的深度卷积神经网络进行全卷积网络的改造,并以具有多尺度卷积核的Inception模块代替由全连接层改造的卷积层,达到减小网络模型参数量、增加特征表达能力的目的;最后,用制作好的高分辨率遥感图像居民地数据集进行训练和验证,生成可直接进行居民地信息提取的全卷积网络。实验结果表明,基于改进全卷积网络的方法可以实现精确有效的居民地信息提取,Kappa系数超过94%。  相似文献   

11.
基于双激活层深度卷积特征的人脸美丽预测研究   总被引:2,自引:0,他引:2       下载免费PDF全文
目前,人脸美丽预测存在数据规模小、分类难度大、深度特征研究不足等问题.为此,本文提出基于双激活层深度卷积特征的人脸美丽预测研究的解决方案.首先,采用数据增强和人脸对齐方法来增加训练集的样本数量和提高数据库的数据质量.其次,提出一种双激活层改进CNN模型,使其更适合人脸美丽预测应用.实验结果表明,本文所提方法在分类和回归预测方面均大幅度优于传统人脸美丽预测方法;同时,在主流的CNN模型中取得了较好的实时性和准确性,基于2000测试集的分类准确率达到61.1%,回归相关度达到0.8546.因此,双激活层在深层人脸美丽特征学习中发挥了重要作用,可广泛应用于人脸图像识别与处理.  相似文献   

12.
雷翰林  张宝华 《激光技术》2019,43(4):476-481
为了避免景深和遮挡的干扰, 提高人群计数的准确性, 采用了LeNet-5, AlexNet和VGG-16 3种模型, 提取图像中不同景深目标的特性, 调整上述模型的卷积核尺寸和网络结构, 并进行了模型融合。构造出一种基于多模型融合的深度卷积神经网络结构, 网络最后两层采用卷积核大小为1×1的卷积层取代传统的全连接层, 对提取的特征图进行信息整合并输出密度图, 极大地降低了网络参量且取得了一定提升的数据, 兼顾了算法效率和精度, 进行了理论分析和实验验证。结果表明, 在公开人群计数数据集shanghaitech两个子集和UCF_CC_50子集上, 本文中计数方法的平均绝对误差和均方误差分别是97.99和158.02, 23.36和41.86, 354.27和491.68, 取得比现有传统人群计数方法更好的性能; 通过迁移实验证明所提出的人群计数模型具有良好的泛化能力。该研究对人群计数精度的提高是有帮助的。  相似文献   

13.
为解决眼镜遮挡会降低人脸识别性能的难点,借鉴深度卷积神经网络在超分辨率方面的成功应用,该文提出一种用于细粒度人脸识别的眼镜自动去除方法ERCNN.用卷积层、池化层、MFM特征选取模块和反卷积层设计ERCNN网络模型,自动学习戴眼镜和未戴眼镜人脸图像对之间的映射关系,实现端到端的眼镜去除.然后,收集大量监控场景下的人脸图像,以及互联网上公开的人脸图像作为训练集;同时构建SLLFW数据集,作为眼镜去除和人脸识别的测试集.最后,通过与传统的眼镜去除方法进行对比试验,该文算法的各项评价指标优于传统方法,能有效的去除真实人脸图像中眼镜;同时在SLLFW人脸数据集上形成的全框眼镜、半框眼镜和无框眼镜人脸数据集上对多种人脸识别算法进行对比试验.试验表明,在FAR为1%的情况下,利用该文方法对F-SLLFW, H-SLLFW和R-SLLFW数据集的人脸图像进行眼镜去除后,SphereFace算法的TAR分别达到90.05%, 91.14%和92.33%,比未去除眼镜的识别率分别提高了3.92%, 3.08%和1.26%;同样,在FAR为0.1%的情况下,比SphereFace算法的TAR分别提高了10.06%, 4.29%和2.13%,说明该文方法有助于提升细粒度人脸识别的识别精度.  相似文献   

14.
为解决眼镜遮挡会降低人脸识别性能的难点,借鉴深度卷积神经网络在超分辨率方面的成功应用,该文提出一种用于细粒度人脸识别的眼镜自动去除方法ERCNN。用卷积层、池化层、MFM特征选取模块和反卷积层设计ERCNN网络模型,自动学习戴眼镜和未戴眼镜人脸图像对之间的映射关系,实现端到端的眼镜去除。然后,收集大量监控场景下的人脸图像,以及互联网上公开的人脸图像作为训练集;同时构建SLLFW数据集,作为眼镜去除和人脸识别的测试集。最后,通过与传统的眼镜去除方法进行对比试验,该文算法的各项评价指标优于传统方法,能有效的去除真实人脸图像中眼镜;同时在SLLFW人脸数据集上形成的全框眼镜、半框眼镜和无框眼镜人脸数据集上对多种人脸识别算法进行对比试验。试验表明,在FAR为1%的情况下,利用该文方法对F-SLLFW, H-SLLFW和R-SLLFW数据集的人脸图像进行眼镜去除后,SphereFace算法的TAR分别达到90.05%, 91.14%和92.33%,比未去除眼镜的识别率分别提高了3.92%, 3.08%和1.26%;同样,在FAR为0.1%的情况下,比SphereFace算法的TAR分别提高了10.06%, 4.29%和2.13%,说明该文方法有助于提升细粒度人脸识别的识别精度。  相似文献   

15.
陈佳昌  肖飒  周伟松 《电讯技术》2022,62(3):288-291
为了解决传统卷积神经网络(Convolutional Neural Network,CNN)对于人脸微表情识别的泛化能力差的问题,提出了一种改进的Inception结构与残差结构结合的卷积神经网络方法.首先在改进的Inception结构的基础上将输入特征直接映射到输出结果中构成残差结构,并针对表情局部特征复杂模糊等不足...  相似文献   

16.
庄子波  邱岳恒  林家泉  宋德龙 《红外与激光工程》2022,51(4):20210320-1-20210320-10
为实现湍流的自动化预警,提出了一种基于卷积神经网络的激光雷达湍流预警算法。首先,该方法将激光雷达获取的风速数据进行速度结构函数的构建;然后,拟合出涡流耗散率,进而将涡流耗散率构建为像素数据集。将数据集输入一种由两个卷积层、两个全连接层、一个softmax层、若干激活函数组成的卷积神经网络分类模型进行湍流识别;最后,采用学习率递减的方法来调整模型的参数对网络进行训练,网络收敛后,其损失度低至3%,通过对比实验表明网络的准确度可达到85%。运用中川机场2016年机组报告进行对比分析,结果表明:文中方法对大气湍流的预警命中率可达80%、误报率为13.3%、虚警率为6.7%,该方法与Hog-SVM分类方法相比,命中率显著提高,从而证明了该卷积网络模型在湍流预警中泛化能力强,提高了预警效率,能够为管制员和气象预报人员提供一种判断依据。  相似文献   

17.
王小宇  李凡  曹琳  李军  张驰  彭圆  丛丰裕 《信号处理》2020,36(6):958-965
由于水声信号的高度复杂性,基于特征工程的传统水下目标识别方法表现欠佳。基于深度学习模型的水下目标识别方法可有效减少由于特征提取过程带来的水声信号信息损失,进而提高水下目标识别效果。本文提出一种适用于水下目标识别场景的卷积神经网络结构,即在卷积模块化设计中引入卷积核为1的卷积层,更大程度地保留水声信号局部特征,且降低模型的复杂程度;同时,以全局平均池化层替代全连接层的方式构造基于特征图对应的特征向量主导分类结果的网络结构,使结果更具可解释性,且减少训练参数降低过拟合风险。实验结果表明该方法得到的水下目标识别准确率(91.7%)要优于基于传统卷积神经网络(69.8%)和基于高阶统计量特征的传统方法识别表现(85%)。这说明本文提出的模型能更好保留水声信号的时域结构,进而提高分类识别效果。   相似文献   

18.
With the continuous progress of The Times and the development of technology,the rise of network social media has also brought the“explosive”growth of image data.As one of the main ways of People’s Daily communication,image is widely used as a carrier of communication because of its rich content,intuitive and other advantages.Image recognition based on convolution neural network is the first application in the field of image recognition.A series of algorithm operations such as image eigenvalue extraction,recognition and convolution are used to identify and analyze different images.The rapid development of artificial intelligence makes machine learning more and more important in its research field.Use algorithms to learn each piece of data and predict the outcome.This has become an important key to open the door of artificial intelligence.In machine vision,image recognition is the foundation,but how to associate the low-level information in the image with the high-level image semantics becomes the key problem of image recognition.Predecessors have provided many model algorithms,which have laid a solid foundation for the development of artificial intelligence and image recognition.The multi-level information fusion model based on the VGG16 model is an improvement on the fully connected neural network.Different from full connection network,convolutional neural network does not use full connection method in each layer of neurons of neural network,but USES some nodes for connection.Although this method reduces the computation time,due to the fact that the convolutional neural network model will lose some useful feature information in the process of propagation and calculation,this paper improves the model to be a multi-level information fusion of the convolution calculation method,and further recovers the discarded feature information,so as to improve the recognition rate of the image.VGG divides the network into five groups(mimicking the five layers of AlexNet),yet it USES 3*3 filters and combines them as a convolution sequence.Network deeper DCNN,channel number is bigger.The recognition rate of the model was verified by 0RL Face Database,BioID Face Database and CASIA Face Image Database.  相似文献   

19.
任克强  胡慧 《液晶与显示》2019,34(1):110-117
针对角度Softmax损失强约束存在的问题,提出一种用角度空间三元组损失对角度Softmax损失预训练模型进行微调的算法。算法首先对原来的卷积神经网络结构进行改进,将1×1卷积核与池化层加在不同残差块间,以进行选择更有效的特征。然后用角度空间下的三元组损失对预训练模型进行微调,以降低困难样本的强约束条件。最后在测试时,分别提取原始人脸图像特征和水平翻转的人脸图像特征,对两个特征相加作为最终的人脸特征表达,以丰富人脸特征信息,提高识别率。实验结果表明,在LFW和YTF人脸数据集分别取得了99.25%和94.52%的识别率,在大规模人脸身份识别中,本文提出的方法在仅用单模型和比较小的训练集就能有效地提高人脸识别率。  相似文献   

20.
张盼盼  罗海波  鞠默然  惠斌  常铮 《红外与激光工程》2020,49(5):20201010-20201010-8
为了解决Capsule网络随着输入图像增大计算量和参数数量急剧增加的问题,对Capsule网络进行了改进并将其用于SAR自动目标识别(SAR-ATR)中。基于大脑视觉皮层以层级结构以及柱状形式处理信息的机制,提出了完全实例化的思想,并运用类脑计算对Capsule网络进行了改进。具体方法是:使用多个卷积层实现层级处理,同时使用了较少的卷积核,但每一层使用的卷积核数量随着层级加深逐渐增加,使得提取的特征更加趋于抽象化;在PrimaryCaps层中,Capsule向量由最后一层卷积层输出的所有特征图构成,使得Capsule单元包含目标局部或整体的全部特征,以实现目标的完全实例化。在SAR-ATR上,将改进的Capsule网络与原Capsule网络、传统目标识别算法和基于经典卷积神经网络的目标识别算法进行对比实验。实验结果表明,改进的Capsule网络训练参数和计算量大大减少,并且训练速度得到很大提升,在SAR图像数据集上的识别准确率较Capsule网络和前两类方法分别提高了0.37和1.96~8.96个百分点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号