期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	1篇
免费	0篇

学科分类

工业技术

1篇

出版年

2023年

1篇

排序方式： 共有1条查询结果，搜索用时 31 毫秒

基于改进的Transformer_decoder的增强图像描述

林椹尠屈嘉欣罗亮《计算机与现代化》2023,(1):7-12

Transformer的解码器（Transformer_decoder）模型已被广泛应用于图像描述任务中,其中自注意力机制（Self Attention）通过捕获细粒度的特征来实现更深层次的图像理解。本文对Self Attention机制进行2方面改进,包括视觉增强注意力机制（Vision-Boosted Attention, VBA）和相对位置注意力机制（Relative-Position Attention, RPA）。视觉增强注意力机制为Transformer_decoder添加VBA层,将视觉特征作为辅助信息引入Self Attention模型中,指导解码器模型生成与图像内容更匹配的描述语义。相对位置注意力机制在Self Attention的基础上,引入可训练的相对位置参数,为输入序列添加词与词之间的相对位置关系。基于COCO2014进行实验,结果表明VBA和RPA这2种注意力机制对图像描述任务都有一定改进,且2种注意力机制相结合的解码器模型有更好的语义表述效果。相似文献