首页 | 官方网站   微博 | 高级检索  
     

全卷积神经结构的段落式图像描述算法
引用本文:李睿凡,梁昊雨,冯方向,张光卫,王小捷.全卷积神经结构的段落式图像描述算法[J].北京邮电大学学报,2019,42(6):155-161.
作者姓名:李睿凡  梁昊雨  冯方向  张光卫  王小捷
作者单位:北京邮电大学计算机学院,北京100876;教育部信息网络工程研究中心,北京100876;北京邮电大学计算机学院,北京100876;教育部信息网络工程研究中心,北京100876;北京邮电大学网络技术研究院,北京100876
基金项目:国家重点研发计划项目(2019YFF0303302);国家自然科学基金项目(61906018);国家电网公司总部科技项目(5200-201918255A-0-0-00)
摘    要:针对段落式图像描述生成研究中提升描述语句之间的连贯性问题,提出了一种基于全卷积结构的图像段落描述算法.采用基于卷积网络的区域检测器获取图像表示,结合段落在语言学角度的层次性,构建一种层次性的深度卷积解码器对图像表示解码,自动生成段落式文本描述.同时将门控机制嵌入卷积解码器网络中,以提升模型的记忆能力.实验结果表明,相比于基于循环神经网络等传统段落图像的描述方法,新算法能够为图像生成更为连贯的段落式文本描述,在评测指标上取得较好的结果.

关 键 词:卷积网络  深度学习  图像描述  连贯性
收稿时间:2019-04-14

Paragraph Image Captioning with Deep Fully Convolutional Neural Networks
LI Rui-fan,LIANG Hao-yu,FENG Fang-xiang,ZHANG Guang-wei,WANG Xiao-jie.Paragraph Image Captioning with Deep Fully Convolutional Neural Networks[J].Journal of Beijing University of Posts and Telecommunications,2019,42(6):155-161.
Authors:LI Rui-fan  LIANG Hao-yu  FENG Fang-xiang  ZHANG Guang-wei  WANG Xiao-jie
Affiliation:1. School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2. Engineering Research Center of Information Networks, Ministry of Education, Beijing 100876, China;
3. Institute of Network Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China
Abstract:
Keywords:convolutional networks  deep learning  image captioning  coherence  
本文献已被 万方数据 等数据库收录!
点击此处可从《北京邮电大学学报》浏览原始摘要信息
点击此处可从《北京邮电大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号