首页 | 官方网站   微博 | 高级检索  
     

基于多空间混合注意力的图像描述生成方法
引用本文:林贤早,刘俊,田胜,徐小康,姜涛. 基于多空间混合注意力的图像描述生成方法[J]. 计算机应用, 2020, 40(4): 985-989. DOI: 10.11772/j.issn.1001-9081.2019091569
作者姓名:林贤早  刘俊  田胜  徐小康  姜涛
作者单位:杭州电子科技大学 通信信息传输与融合技术国防重点学科实验室, 杭州 310018
基金项目:国家自然科学基金资助项目(61673146);国家自然科学基金重大仪器专项(61427808);浙江省重点研发计划项目(2019C05005)。
摘    要:针对近海船舶监测系统中自动化情报生成的空缺,为了构建智能化船舶监测系统,提出基于多空间混合注意力的图像描述生成方法,对近海船舶图像进行描述。图像描述生成方法就是让计算机通过符合语言学的文字描述出图像中的内容。首先使用图像的感兴趣区域的编码特征预训练出多空间混合注意力模型,然后加入策略梯度改造损失函数对预训练好的解码模型继续进行微调,得到最终的模型。在MSCOCO(MicroSoft Common Objects in COntext)图像描述数据集上的实验结果表明,所提模型较以往的注意力模型提升了图像描述生成的评价指标,比如CIDEr分数。使用该模型在自建船舶描述数据集中能够自动描述出船舶图像的主要内容,说明所提方法能为自动化情报生成提供数据支持。

关 键 词:图像描述  深度学习  注意力机制  情报生成  多空间混合注意力  
收稿时间:2019-09-16
修稿时间:2019-10-28

Image description generation method based on multi-spatial mixed attention
LIN Xianzao,LIU Jun,TIAN Sheng,XU Xiaokang,JIANG Tao. Image description generation method based on multi-spatial mixed attention[J]. Journal of Computer Applications, 2020, 40(4): 985-989. DOI: 10.11772/j.issn.1001-9081.2019091569
Authors:LIN Xianzao  LIU Jun  TIAN Sheng  XU Xiaokang  JIANG Tao
Affiliation:Fundamental Science on Communication Information Transmission and Fusion Technology Laboratory, Hangzhou Dianzi University, Hangzhou Zhejiang 310018, China
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号