首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
针对现有行人属性识别方法模型复杂,识别性能较低的问题,提出一种端到端的行人属性识别方法。构建注意力机制修正网络,在主干网络的不同卷积层后添加注意力分支,以提取注意力特征关注属性相关空域;提出一种注意力机制辅助训练方法,将注意力分支与主网络在预测级进行损失融合,通过梯度反向传播修正主网络权重,实现主网络的有效训练;在预测阶段,利用权重修正后的主网络实现属性识别。在RAP数据集上的实验结果表明,提出方法在没有额外辅助信息、不增加主网络体积和计算量的情况下,提升了行人属性识别性能。  相似文献   

2.
张再腾  张荣芬  刘宇红 《控制与决策》2022,37(10):2487-2496
近年来,随着深度学习的蓬勃发展,行人属性识别得到了广泛的研究.但是,由于属性复杂且多样化、图像质量差、视角遮挡等困扰,难以捕获图像中的细粒度属性特征,具有很大的挑战性.对此,基于深度学习,提出多尺度残差注意网络(MRAN)用于行人属性识别,以Resnet50为主体架构,使用轻量级的金字塔卷积提供不同内核大小的并行卷积以完成多尺度信息的提取,嵌入注意力模块以关注属性存在的关键区域并挖掘属性内部联系;其次,使用特征金字塔融合策略,更充分地提取和融合多尺度特征.网络结合了多尺度学习、注意力机制和残差学习的思想,使网络提取出更丰富、更细腻的特征.最后,在PETA和PA100K两个数据集上进行实验研究,结果表明,所提出方法优于现有的研究方法.通过消融研究验证整个网络体系结构的3个组成部分的有效性和先进性,且所提出网络具有高准确性和低复杂度的双向优化.  相似文献   

3.
基于会话的推荐旨在根据匿名用户的短期交互数据来预测用户下一次交互项目. 现有图神经网络会话推荐模型大多在信息传播过程中平等对待所有邻居节点, 而没有区分他们对于中心节点的重要性, 从而给模型训练引入噪声. 此外, 随着图神经网络层数的增加, 过度平滑问题会随之产生. 针对上述问题, 本文提出结合跳跃连接的多层图注意力网络会话推荐模型(MGATSC). 首先利用图注意力网络学习邻居节点对于中心节点的重要性, 并堆叠多层网络以获取高阶邻居信息; 然后为了缓解过度平滑问题, 采用基于残差注意力机制的跳跃连接更新每层网络的节点嵌入, 并通过平均池化得到最终节点嵌入. 最后将反向位置嵌入融合到节点嵌入中, 经过预测层生成推荐. 在Tmall、Diginetica以及Retailrocket这3个公开数据集上的实验结果表明所提模型优于所有基线模型, 验证了模型的有效性与合理性.  相似文献   

4.
吴锐  刘宇  冯凯 《计算机应用》2021,41(2):372-378
针对行人属性识别任务中不同属性对特征粒度和特征依赖性的需求不同的问题,提出了一种基于由空间自注意力机制和通道自注意力机制组成的双域自注意力机制的行人属性识别模型.首先,使用ResNet50作为骨干网络,提取出具有一定语义信息的特征;然后将得到的特征分别输入到双分支网络中,提取具有空间依赖性与语义相关性的自注意力特征以及...  相似文献   

5.
针对现有行人属性识别方法忽视行人属性的互相关性和空间信息导致识别性能较低的问题,将任务视为时空序列多标签图像分类问题,提出基于卷积神经网络(CNN)和卷积长短期记忆网络(ConvLSTM)并融合通道注意力机制的模型.用CNN和通道注意力提取行人属性的显著性和相关性视觉特征;用ConvLSTM进一步提取视觉特征的空间信息...  相似文献   

6.
为了提高基于深度学习的行人属性识别的能力,提出了一种基于任务感知机制的行人属性识别网络模型。考虑到不同行人属性之间存在较强的语义相关性,提出了任务感知机制,充分挖掘不同任务中属性和属性之间的关联性;针对行人属性样本的不平衡性,利用加权损失策略降低不平衡性带来的影响;在现有的三个行人属性数据集PETA、PA100k和RAP上的实验结果表明,提出的方法具有较强的竞争力。  相似文献   

7.
传统的行人重识别方法依赖人工构造视觉特征,容易受到其他外界因素的影响,识别精度低.深度学习模型能自主地提取特征,但随着网络层数的加深会出现梯度消失情况,残差网络能缓解梯度消失问题,但提取出的特征信息未被合理使用.行人部分图像被遮挡是影响行人重识别准确性的另一个重要因素.针对上述问题提出了融合随机擦除和残差注意力网络的行...  相似文献   

8.
近年来基于深度学习的人脸表情识别技术已取得很大进展,但对于表情特征的多尺度提取,以及在不受约束的现实场景中进行面部表情识别仍然是具有挑战性的工作。为解决此问题,提出一种金字塔卷积神经网络与注意力机制结合的表情识别方法。对于初始的一张人脸表情图像,将其按照区域采样裁剪成多张子图像,将原图像和子图像输入到金字塔卷积神经网络进行多尺度特征提取,将提取到的特征图输入到全局注意力模块,给每一张图像分配一个权重,从而得到有重要特征信息的图像,将子图像和原始图像的特征进行加权求和,得到新的含有注意力信息的全局特征,最终进行表情识别分类。在CK+、RAF-DB、AffectNet三个公开表情数据集上分别取得了98.46%、87.34%、60.45%的准确率,提高了表情的识别精度。  相似文献   

9.
随着深度学习的应用,表情识别技术得到快速发展,但如何提取多尺度特征及高效利用关键特征仍是表情识别网络面临的挑战.针对上述问题,文中使用金字塔卷积有效提取多尺度特征,使用空间通道注意力机制加强关键特征的表达,构建基于残差注意力机制和金字塔卷积的表情识别网络,提高识别的准确率.网络使用MTCNN(Multi-task Convolutional Neural Network)进行人脸检测、人脸裁剪及人脸对齐,再将预处理后的图像送入特征提取网络.同时,为了缩小同类表情的差异,扩大不同类表情的距离,结合Softmax Loss和Center Loss,进行网络训练.实验表明,文中网络在Fer2013、CK+数据集上的准确率较高,网络参数量较小,适合表情识别在现实场景中的应用.  相似文献   

10.
目的 在行人再识别中,经常出现由于行人身体部位被遮挡和行人图像对之间不对齐而导致误判的情况。利用人体固有结构的特性,关注具有显著性特征的行人部件,忽略带有干扰信息的其他部件,有利于判断不同摄像头拍摄的行人对是否为同一人。因此,提出了基于注意力机制和多属性分类的行人再识别方法。方法 在训练阶段,利用改进的ResNet50网络作为基本框架提取特征,随后传递给全局分支和局部分支。在全局分支中,将该特征作为全局特征进行身份和全局属性分类;在局部分支中,按信道展开特征,获取每层响应值最高的点,聚合这些点,分成4个行人部件,计算每个行人部件上显著性特征的权重,并乘以初始特征得到每个部件的总特征。最后将这4个部件的总特征都进行身份和对应属性的分类。在测试阶段,将通过网络提取的部位特征和全局特征串联起来,计算行人间的相似度,从而判断是否为同一人。结果 本文方法引入了Market-1501_attribute和DukeMTMC-attribute数据集中的属性信息,并在Market-1501和DukeMTMC-reid数据集上进行测试,其中rank-1分别达到90.67%和80.2%,mAP分别达到76.65%和62.14%;使用re-ranking算法后,rank-1分别达到92.4%和84.15%,mAP分别达到87.5%和78.41%,相比近年来具有代表性的其他方法,识别率有了极大提升。结论 本文方法通过学习行人属性能更快地聚集行人部件的注意力,而注意力机制又能更好地学习行人部位的显著性特征,从而有效解决了行人被遮挡和不对齐的问题,提高了行人再识别的准确率。  相似文献   

11.
针对目前行人多属性识别算法识别精度不高的问题,利用行人属性之间的内在关联关系,基于“特征提取+回归”的思想,提出了一种基于深度卷积神经网络的行人多属性协同识别方法。该方法首先对多个行人属性标签进行组合编码,得到一个标签组合向量;然后采用基于通道注意力机制的ResNet50作为主干网络提取行人图像的深度特征;最后,设计了一个包含3个全连接层的神经网络结构来建立标签组合向量与行人深度特征之间的映射模型,在一个统一的网络框架下就可以同时对行人的多种属性进行准确识别。在行人属性公共数据集PETA和RAP上的实验结果表明,采用提出的识别方法在公共数据集PETA上获得的识别准确率为84.08%,而在公共数据集RAP上可以获得高达88.12%的识别准确率。  相似文献   

12.
针对目前的行人属性识别方法存在行人属性数据不均衡、行人特征表达能力不足、鲁棒性差的问题,本文提出局部特征重叠与行人属性识别相结合的方法.网络使用全局和局部两个分支来提升网络整体特征表达能力,在局部分支中将得到的特征图切分为几块大小相同的几个部分并使用Focal loss计算每个属性的损失解决行人属性不均衡问题.最后将投...  相似文献   

13.
人脸表情是人类内心情绪最真实最直观的表达方式之一,不同的表情之间具有细微的类间差异信息。因此,提取表征能力较强的特征成为表情识别的关键问题。为提取较为高级的语义特征,在残差网络(ResNet)的基础上提出一种注意力金字塔卷积残差网络模型(APRNET50)。该模型融合金字塔卷积模块、通道注意力和空间注意力。首先用金字塔卷积提取图像的细节特征信息,然后对所提特征在通道和空间维度上分配权重,按权重大小定位显著区域,最后通过全连接层构建分类器对表情进行分类。以端到端的方式进行训练,使得所提网络模型更适合于精细的面部表情分类。实验结果表明,在FER2013和CK+数据集上识别准确率可以达到73.001%和94.949%,与现有的方法相比识别准确率分别提高了2.091个百分点和0.279个百分点,达到了具有相对竞争力的效果。  相似文献   

14.

Convolutional neural networks (CNNs) have shown tremendous progress and performance in recent years. Since emergence, CNNs have exhibited excellent performance in most of classification and segmentation tasks. Currently, the CNN family includes various architectures that dominate major vision-based recognition tasks. However, building a neural network (NN) by simply stacking convolution blocks inevitably limits its optimization ability and introduces overfitting and vanishing gradient problems. One of the key reasons for the aforementioned issues is network singularities, which have lately caused degenerating manifolds in the loss landscape. This situation leads to a slow learning process and lower performance. In this scenario, the skip connections turned out to be an essential unit of the CNN design to mitigate network singularities. The proposed idea of this research is to introduce skip connections in NN architecture to augment the information flow, mitigate singularities and improve performance. This research experimented with different levels of skip connections and proposed the placement strategy of these links for any CNN. To prove the proposed hypothesis, we designed an experimental CNN architecture, named as Shallow Wide ResNet or SRNet, as it uses wide residual network as a base network design. We have performed numerous experiments to assess the validity of the proposed idea. CIFAR-10 and CIFAR-100, two well-known datasets are used for training and testing CNNs. The final empirical results have shown a great many of promising outcomes in terms of performance, efficiency and reduction in network singularities issues.

  相似文献   

15.
由于采用的监控图像尺寸较小、分辨率低等原因, 行人属性识别一直是一个极具挑战性的任务, 而低分辨率的图像往往又导致数据集存在识别行人主体区域不突出、背景噪音干扰严重等问题. 之前的方法大多将未作处理的原始图像作为输入, 使得属性识别效果一直不够理想, 并且, 属性识别的主流数据集通常存在正负样本不平衡的问题, 例如, 许多行人的服装属性分布有着季节性或习俗性的偏差. 因此, 本文提出一个新的深度学习网络——图像增强与样本平衡优化模型IEBO (image enhancement and sample balance optimization). 该模型通过色彩增强与提取行人主体区域的噪音抑制方法, 在突出行人核心特征的同时消除无用背景信息, 防止其对属性识别造成干扰. 另外模型通过权重调节针对样本不平衡的属性进行优化, 提高不平衡属性的识别能力. 实验最终表明, 新的行人属性识别模型在Market-1501-attribute数据集中取得了较好的性能.  相似文献   

16.
针对不同样本之间存在交叉数据的模式识别问题,将多层激励函数的量子神经网络引入模式识别之中,提出一种基于量子神经网络的模式识别算法。量子神经网络是将神经元与模糊理论相结合的模糊神经系统,由于自身固有的模糊性,它能将决策的不确定性数据合理地分配到各模式中,从而减少模式识别的不确定度,提高模式识别的准确性。本文以英文字母为例,应用量子神经网络模型进行字符识别,通过比较发现量子神经网络除了可以克服BP网络的诸多缺点外,对具有不确定性、两类模式之间存在交叉数据的模式识别问题,有极好的分类效果。仿真结果证明该方法的正确性和有效性。  相似文献   

17.
肝脏病灶是指肝脏疾病集中的部位或是综合病症、感染的主要部位。由于不同类型的多期相肝脏病灶计算机断层扫描(CT)影像存在异病同影或同病异影的情况,导致同一类型的CT影像结构变化较大,传统方法难以提取丰富的图像特征信息,肝脏病灶分类准确率有待提高。提出一种多期相注意力融合网络MAFNet,使用单期相分支表征单期相病灶图像特征,并在融合分支中采用中期融合的方式,融合单期相分支中提取出的特征映射,从而充分提取图像中不同层次的特征。利用多期相注意力模块提取单期相分支中肝脏病灶的加权特征,重新组织多期相肝脏病灶的特征映射,以保持不同单期相图像信息,表达3个期相影像的时序增强模式,得到更准确的分类结果。实验结果表明,基于该网络的分类方法能充分利用多期相肝脏CT影像的时序特征,有效捕捉同一患者不同期相的信息,肝脏病灶CT影像分类的平均准确率为90.99%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号