基于多空间混合注意力的图像描述生成方法 Image description generation method based on multi-spatial mixed attention期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于多空间混合注意力的图像描述生成方法

引用本文：	林贤早,刘俊,田胜,徐小康,姜涛. 基于多空间混合注意力的图像描述生成方法[J]. 计算机应用, 2020, 40(4): 985-989. DOI: 10.11772/j.issn.1001-9081.2019091569

作者姓名：	林贤早刘俊田胜徐小康姜涛

作者单位：	杭州电子科技大学通信信息传输与融合技术国防重点学科实验室, 杭州 310018

基金项目：	国家自然科学基金资助项目（61673146）；国家自然科学基金重大仪器专项（61427808）；浙江省重点研发计划项目（2019C05005）。

摘要：	针对近海船舶监测系统中自动化情报生成的空缺，为了构建智能化船舶监测系统，提出基于多空间混合注意力的图像描述生成方法，对近海船舶图像进行描述。图像描述生成方法就是让计算机通过符合语言学的文字描述出图像中的内容。首先使用图像的感兴趣区域的编码特征预训练出多空间混合注意力模型，然后加入策略梯度改造损失函数对预训练好的解码模型继续进行微调，得到最终的模型。在MSCOCO（MicroSoft Common Objects in COntext）图像描述数据集上的实验结果表明，所提模型较以往的注意力模型提升了图像描述生成的评价指标，比如CIDEr分数。使用该模型在自建船舶描述数据集中能够自动描述出船舶图像的主要内容，说明所提方法能为自动化情报生成提供数据支持。
关键词：	图像描述深度学习注意力机制情报生成多空间混合注意力
收稿时间：	2019-09-16
修稿时间：	2019-10-28
Image description generation method based on multi-spatial mixed attention

LIN Xianzao,LIU Jun,TIAN Sheng,XU Xiaokang,JIANG Tao. Image description generation method based on multi-spatial mixed attention[J]. Journal of Computer Applications, 2020, 40(4): 985-989. DOI: 10.11772/j.issn.1001-9081.2019091569

Authors:	LIN Xianzao LIU Jun TIAN Sheng XU Xiaokang JIANG Tao

Affiliation:	Fundamental Science on Communication Information Transmission and Fusion Technology Laboratory, Hangzhou Dianzi University, Hangzhou Zhejiang 310018, China

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！
	点击此处可从《计算机应用》浏览原始摘要信息
	点击此处可从《计算机应用》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏