首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
Transformer因其全局注意力优势在异物检测上取得了比卷积神经网络(CNN)更具竞争力的结果,但依然面临计算成本高、输入图像块尺寸固定、局部与全局信息交互匮乏等问题。提出一种基于双通道Transformer骨干网络、金字塔轻量化Transformer块和通道交叉注意力机制的DualF ormer模型,用以检测地铁站台屏蔽门与列车门间隙中存在的异物。针对输入图像块尺寸固定的问题,提出双通道策略,通过设计2种不同的特征提取通道对不同尺度的输入图像块进行特征提取,增强网络对粗、细粒度特征的提取能力,提高对多尺度目标的识别精度;针对计算成本高的问题,构建金字塔轻量化Transformer块,将级联卷积引入到多头自注意力(MHSA)模块中,并利用卷积的维度压缩能力来降低模型的计算成本;针对局部与全局信息交互匮乏的问题,提出通道交叉注意力机制,利用提取到的粗细粒度特征在通道层面进行交互,优化局部与全局信息在网络中的权重。在标准化地铁异物检测数据集上的实验结果表明,DualFormer模型参数量为1.98×107,实现了89.7%的精度和24帧/s的速度,优于对比的Tra...  相似文献   

2.
针对人脸表情识别在特征提取时容易丢失大量有用的特征信息, 无法提取更加全面的人脸表情特征的问题, 提出了一种多尺度特征融合网络模型(DS-EfficientNet). 该模型包括深层网络和浅层网络两部分, 浅层网络用来提取面部表情的细节纹理信息, 深层网络提取表情的全局信息. 并在浅层网络中加入注意力机制, 增强对浅层细节信息的提取能力. 最终在通道上进行特征融合, 融合之后网络可以提取更加丰富的人脸表情信息. 为了减少模型参数, 提高模型的泛化性能, 将全连接层替换为全局平均池化层, 加入批归一化. 本文提出的方法在Fer2013和CK+上进行实验, 识别准确率达到了73.47%和98.84%. 实验证明该方法可以提取人脸更加丰富的表情信息, 模型具有更强的泛化能力.  相似文献   

3.
传统图像目标识别模型通常使用结构复杂、层数更深的神经网络以提升其在计算机视觉领域的准确率,但该类模型存在对计算机算力要求过高、占用内存较大、无法部署在手机等小型计算机上的问题。提出一种轻量化卷积神经网络ConcatNet,采用特征拼接的方式,通过多支路并行将通道注意力机制与深度可分离卷积相结合,在增强有效特征权重的基础上,降低模型的参数量和复杂度,实现网络的轻量化。在网络输出阶段,采用先筛选再混洗的方式提高模型的识别精度。利用全局平均池化和全局随机池化提取中间特征图的信息,其中全局平均池化可以较好地保留背景信息,全局随机池化按概率值选取特征,具有较强的泛化性,两者相结合能够减少信息的丢失。在CIFAR-10、CIFAR-100等数据集上的实验结果表明,与MobileNetV2等轻量化神经网络相比,ConcatNet网络在保持Top-1和Top-5精度相当的情况下,将参数量和计算复杂度均降低了约50%,极大降低了对承载设备的要求。  相似文献   

4.
对网站图像敏感信息识别检测问题,提出一种基于改进深度学习的图像敏感信息识别方法。通过特征融合网络,将经全局优化后的区域检测网络与全局识别网络提取特征相融合,并引入注意力机制,对图像中包含敏感部位的区域进行加权聚焦,提高模型检测效率和准确性。实验证明,采用通过全局特征优化后的区域检测网络,平均检测精度提高1%,相较于SSD、Faster R-CNN等目标生成网络,平均检测精度高8.54%与10.63%,提取结果更精准;融合局部特征的全局识别网络,识别精度随着局部特征提取准确度上升而上升,当提取种类到达10种时,识别精度比未加入高1.8%;通过引入注意力机制,本模型检测准确率提升明显,当聚焦点数为7时,比未引入高0.7%;最终,相较于未包含局部特征的ResNet50网络、虽然未包含局部特征但结构更复杂的ResNet101网络,与虽然考虑局部特征,但未与全局特征进行融合的DMCNet网络,本模型检测准确率平均高出3.25%、2.15%和6%,且耗费时间较短,具有更高的鉴别力和检测效率。  相似文献   

5.
吴锐  刘宇  冯凯 《计算机应用》2021,41(2):372-378
针对行人属性识别任务中不同属性对特征粒度和特征依赖性的需求不同的问题,提出了一种基于由空间自注意力机制和通道自注意力机制组成的双域自注意力机制的行人属性识别模型。首先,使用ResNet50作为骨干网络,提取出具有一定语义信息的特征;然后将得到的特征分别输入到双分支网络中,提取具有空间依赖性与语义相关性的自注意力特征以及整体性信息的全局特征;最后,融合双分支的特征,并利用批归一化(BN)和加权损失的策略降低行人属性样本不平衡的影响。在两个行人属性数据集PETA和RAP上的实验结果表明,所提出的模型比基准模型的平均准确率指标分别提高了3.91个百分点和4.05个百分点,在已提出的行人属性识别模型中具有较强的竞争力。基于双域自注意力机制的行人属性识别方法可在监控场景下对行人进行结构化描述,提高行人分析和检索等任务的准确度和效率。  相似文献   

6.
针对使用注意力机制的语义分割模型计算资源消耗与精度不平衡的问题,提出一种轻量化的语义分割注意力增强算法。首先,基于驾驶场景中物体的形状特点设计了条状分维注意力机制,使用条形池化代替传统方形卷积,并结合降维操作分维度提取长程语义关联,削减模型计算量。接着融合通道域与空间域上的注意力,形成可叠加与拆解的轻量化多维注意力融合模块,全方位提取特征信息,进一步提升模型精度。最后,将模块插入基于ResNet-101骨干网的编码—解码网络中,指导高低层语义融合,矫正特征图边缘信息,补充预测细节。实验表明,该模块有较强的鲁棒性和泛化能力,与同类型注意力机制相比,削减了约90%的参数量以及80%的计算量,且分割精度依旧取得了稳定的提升。  相似文献   

7.
命名实体识别是自然语言处理领域中信息抽取、信息检索、知识图谱等任务的基础。在命名实体识别任务中,Transformer编码器更加关注全局语义,对位置和方向信息不敏感,而双向长短期记忆(BiLSTM)网络可以提取文本中的方向信息,但缺少全局语义信息。为同时获得全局语义信息和方向信息,提出使用注意力机制动态融合Transformer编码器和BiLSTM的模型。使用相对位置编码和修改注意力计算公式对Transformer编码器进行改进,利用改进的Transformer编码器提取全局语义信息,并采用BiLSTM捕获方向信息。结合注意力机制动态调整权重,深度融合全局语义信息和方向信息以获得更丰富的上下文特征。使用条件随机场进行解码,实现实体标注序列预测。此外,针对Word2Vec等传统词向量方法无法表示词的多义性问题,使用RoBERTa-wwm预训练模型作为模型的嵌入层提供字符级嵌入,获得更多的上下文语义信息和词汇信息,增强实体识别效果。实验结果表明,该方法在中文命名实体识别数据集Resume和Weibo上F1值分别达到96.68%和71.29%,相比ID-CNN、BiLSTM、CAN-NER等...  相似文献   

8.
道路裂缝是道路安全检测的重要部分,随着深度学习和计算机视觉的发展,利用深度学习对道路图像中裂缝信息提取的方法趋于成熟。现有深度学习道路裂缝检测方法对细小裂缝提取不完整以及受背景因素干扰,导致检测精度降低。基于CBAM注意力机制和残差网络,改进U-Net神经网络模型,构建一种融合残差和注意力机制的道路裂缝检测深度学习网络模型。该模型在U-Net网络的上采样和下采样过程中分别嵌入通道注意力机制和空间注意力机制。CBAM注意力机制在通道和空间维度上同时进行全局平均和全局最大混合池化,以提取更多有效的全局和局部细节信息。同时,在U-Net网络中融合残差模块,有效解决网络梯度消失、梯度爆炸以及网络退化的问题,进一步提高道路裂缝的检测能力。实验结果表明,在上采样和下采样过程中嵌入CBAM注意力机制网络的F1值提升到81.02%,相比U-Net原始网络,提升13.76个百分点。融合残差模块并在下采样过程中嵌入CBAM注意力机制网络的F1值达到85.82%,相比只嵌入CBAM注意力机制的网络,提升了4.8个百分点。  相似文献   

9.
受人脑视觉感知机制启发,在深度学习框架下提出基于注意力机制的时间分组深度网络行为识别算法.针对局部时序信息在描述持续时间较长的复杂动作上的不足,使用视频分组稀疏抽样策略,以更低的成本进行视频级时间建模.在识别阶段引入通道注意力映射,进一步利用全局特征信息和捕捉分类兴趣点,执行通道特征重新校准,提高网络的表达能力.实验表明,文中算法在UCF101、HMDB51数据集上的识别准确率较高.  相似文献   

10.
针对目前的视频播放速度识别算法大多存在的提取精度差、模型参数量巨大的问题,提出了一种双支轻量化视频播放速度识别网络。首先,该网络是基于SlowFast双支网络架构组建的一个三维(3D)卷积网络;其次,为了弥补S3D-G网络在视频播放速度识别任务中存在的参数量大、浮点运算数多的缺陷,进行了轻量化的网络结构调整;最后,在网络结构中引入了高效通道注意力(ECA)模块,以通过通道注意力模块生成重点关注的内容对应的通道范围,这有助于提高视频特征提取的准确性。在Kinetics-400数据集上将所提网络与S3D-G、SlowFast网络进行对比实验。实验结果表明,所提网络在精确度差不多的情况下,模型大小和模型参数均比SlowFast减少了大约96%,浮点运算数减少到5.36 GFLOPs,显著提高了运行速度。  相似文献   

11.
基于深度学习的指静脉识别方法通常需要大量的计算资源,限制了其在嵌入设备上的推广和普及,采用轻量级网络又面临模型参数减少导致准确率下降的问题,为此提出一种基于指静脉关键特征和AdaFace损失的轻量级识别算法。在MicroNet框架中,首先提出一种FMixconv卷积来替代原网络中的深度卷积,减少参数的同时可以获得静脉特征的多尺度信息;其次引入轻量级注意力模块CA模块,从空间和通道上聚焦于静脉特征的关键信息;最后在损失函数中加入AdaFace损失,通过特征范数对图像质量进行评价,以减少图像质量下降对训练的影响。该算法在SDUMLA-HMT、FV-USM和自建数据集上的识别准确率达到99.84%、99.39%和99.42%,而参数量仅有0.82 M。实验结果表明,该算法在准确率和参数量大小上均领先于其他方法。  相似文献   

12.
现有目标检测器特征金字塔无法充分利用不同尺度特征图的特征信息,不适用于低分辨率图像的目标和小目标的检测.针对此问题,文中提出引入通道注意力机制和残差学习块的目标检测器.首先引入通道全局注意力机制,通过网络学习特征图中不同通道特征的权重,增强有效的全局特征信息.然后采用轻量级的残差块,突出特征的微小变化,提高低分辨率图像中小目标的检测性能.最后在用于预测的浅层特征图中融合深层特征,提高小目标的检测精度.在标准测试数据集上的实验表明,文中目标检测器适用于低分辨率图像,对小目标的检测效果较优.  相似文献   

13.
新冠状病毒具有很强的传染性,规范佩戴口罩可以阻隔病毒通过空气中的飞沫、气溶胶等载体传播,然而在公共场合时有公民不佩戴口罩或不规范佩戴口罩的现象,不利于疫情防控工作的开展。为解决这一问题,提出了一种自然环境下的实时人脸口罩检测与规范佩戴识别方法,采用YOLOv4算法,在自然环境下对公民口罩佩戴情况进行检测。针对模型参数量大,难以部署应用的难题,引入轻量级骨干网络L-CSPDarkNet(LightCSPDarkNet)以提高模型的检测速度,同时提出轻量级特征增强模块Light-FEB(Light Feature Enhancement Black)和多尺度注意力机制Multi-Scale-Sam(MultiScaleSam)增强轻量级主干网络的特征提取能力。实验结果表明,该算法精度可达91.94%,相比于原始YOLOv4算法提高了3.55个百分点,检测速度达到75?frame/s,高于原始YOLOv4的35?frame/s,可满足实际应用的需求。  相似文献   

14.
为解决健全人士与听障人士交互信息困难的问题,提出一种改进YOLOv5s网络模型的手语识别网络。应用[K]-means++算法提高先验锚框的尺寸匹配度,确定了最优先验锚框尺寸,实现先验锚框与实际物体的精确匹配;改进CBAM(convolution block attention module)注意力机制的通道域,解决其因降维而造成的通道信息缺失问题,并将改进后的CBAM加入到YOLOv5s的骨干网络中,使模型更加精准地定位和识别到关键的目标。将Cross Entropy Loss和Lovasz-Softmax Loss加权结合使用,使得网络在模型训练过程中更加稳定地收敛,在精准率上也得到了一定的提升。实验结果表明,与原本的YOLOv5s模型相比,改进后网络模型的平均精度均值(mean average precision,mAP)、精准率和召回率分别提升了3.44个百分点、3.17个百分点、1.89个百分点,有效地提高了手语识别网络的检测精确度。  相似文献   

15.
目的 表情是人机交互过程中重要的信息传递方式,因此表情识别具有重要的研究意义。针对目前表情识别方法存在背景干扰大、网络模型参数复杂、泛化性差等问题,本文提出了一种结合改进卷积神经网络(convolutional neural network,CNN)与通道加权的轻量级表情识别方法。方法 首先,采用标准卷积和深度可分离卷积组合神经网络结构,再利用全局平均池化层作为输出层,简化网络的复杂程度,有效降低网络参数;其次,网络引入SE(squeeze-and-excitation)模块进行通道加权,通过在不同卷积层后设置不同的压缩率增强表情特征提取能力,提升网络模型精度;最后,用softmax分类函数实现各类表情的准确分类。结果 本文网络参数量为6 108 519,相较于识别性能较好的Xception神经网络参数减少了63%,并且通过对网络模型的实时性测试,平均识别速度可达128 帧/s。在5个公开的表情数据集上验证网络模型对7种表情的识别效果,与7种卷积神经网络方法相比,在FER2013 (Facial Expression Recognition 2013)、CK+ (the extended Cohn-Kanade) 和JAFFE (Japanses Female Facial Expression) 3个表情数据集的识别精确度提高了5.72%、0.51%和0.28%,在RAF-DB (Real-world Affective Faces Database)、AffectNet这两个in-the-wild表情数据库的识别精确度分别提高了2.04%和0.68%。结论 本文提出的轻量级表情识别方法在不同通道具有不同的加权能力,获取更多表情关键特征信息,提高了模型的泛化性。实验结果表明,本文方法在简化网络的复杂程度、减少计算量的同时能够准确识别人脸表情,能够有效提升网络的识别能力。  相似文献   

16.
卷积神经网络在手势识别领域应用广泛,但现有的卷积神经网络存在特征表征不足的问题,导致手势识别精度较低。提出一种轻量级静态手势识别算法r-mobilenetv2,通过串联通道注意力与空间注意力,将两者输出的特征图以跳跃连接的形式线性相加,得到一种全新的注意力机制。使用一维卷积调整低层特征的通道维度,将低级特征与经过上采样的高层特征进行空间维度匹配及通道维度匹配,并进行线性相加,其结果经卷积操作后与高层特征按通道维度连接,从而实现特征融合。在此基础上,将所提注意力机制与特征融合相结合,并用于改进后的轻量级网络MobileNetV2中,得到r-mobilenetv2算法。实验结果表明,与MobileNetV2算法相比,r-mobilenetv2算法的参数量降低了27%,错误率下降了1.82个百分点。  相似文献   

17.
COVID-19的全球化大流行使得佩戴口罩出行成为人们生活中的常态,这种防疫措施给人脸识别算法带来了新的挑战。针对这一问题,提出了一种口罩遮挡下的轻量级人脸识别算法,该算法改进GhostNet为主干特征提取网络;提出了融合空间注意力机制的FocusNet特征加强提取网络,使模型聚焦于未被口罩遮挡的上半脸区域;针对当前口罩遮挡人脸数据集不充分的问题,提出了一种采用三维人脸网络生成添加口罩遮挡的数据增强方法。实验表明,所提出的改进模型与基准模型相比,模型参数量降低84%的同时,戴口罩人脸的识别率提升4.29个百分点,较好地平衡了速度与精度。  相似文献   

18.
为解决单一特征细粒度船舶图像识别率低的问题,提出一种循环注意卷积神经网络(recurrent attention convolutional neural network,RA-CNN)与多特征区域融合的船舶目标识别方法。该方法通过在VGG-19网络中引入尺度依赖池化(scale-dependent pooling,SDP)算法解决小目标过度池化的问题,提升了小型船舶的识别性能;注意建议网络(attention proposal network,APN)加入联合聚类(joint clustering)算法,生成多个独立的特征区域,使整个模型充分利用全局信息,提高了船舶识别精度;同时设计特征区域优化方法降低多个特征区域的重叠率,解决了过拟合问题;通过定义新的损失函数来交叉训练VGG-19和APN,加快了收敛速度。利用公开的光电船舶数据集对该方法进行测试实验,识别准确率最高可达90.2%,无论是识别率还是模型的鲁棒性较单特征都有了很大的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号