融合卷积注意力和Transformer架构的行人重识别方法 |
| |
作者姓名: | 王静 李沛橦 赵容锋 张云 马振玲 |
| |
作者单位: | 上海海洋大学信息学院 |
| |
基金项目: | 国家自然科学基金(61806123,42101443);;国家重点研发计划(2019YFD0900805)~~; |
| |
摘 要: | 行人重识别技术是智能安防系统中的重要方法之一,为构建一个适用各种复杂场景的行人重识别模型,基于现有的卷积神经网络和Transformer模型,提出一种融合卷积注意力和Transformer(FCAT)架构的方法,以增强Transformer对局部细节信息的关注。所提方法主要将卷积空间注意力和通道注意力嵌入Transformer架构中,分别加强对图像中重要区域的关注和对重要通道特征的关注,以进一步提高Transformer架构对局部细节特征的提取能力。在3个公开行人重识别数据集上的对比消融实验证明,所提方法在非遮挡数据集上取得了与现有方法相当的结果,在遮挡数据集上的性能得到显著提升。所提方法更加轻量化,在不增加额外计算量和模型参数的情况下,推理速度得到了提升。
|
关 键 词: | 行人重识别 深度学习 卷积神经网络 Transformer 注意力机制 |
|