首页 | 官方网站   微博 | 高级检索  
     

基于多尺度特征的图像描述生成模型
引用本文:周星光,靳华中,徐雨东,李晴晴,胡满.基于多尺度特征的图像描述生成模型[J].湖北工业大学学报,2020,35(2):61-66.
作者姓名:周星光  靳华中  徐雨东  李晴晴  胡满
作者单位:湖北工业大学计算机学院,湖北武汉430068;湖北工业大学计算机学院,湖北武汉430068;湖北工业大学计算机学院,湖北武汉430068;湖北工业大学计算机学院,湖北武汉430068;湖北工业大学计算机学院,湖北武汉430068
基金项目:大学生创新创业训练计划项目
摘    要:针对现有基于深度学习图像描述生成模型,在图像特征编码阶段,由于编码器提取的图像特征较为单一,图像信息利用不充分,造成文字对图片内容描述得不够准确、语义较模糊的问题,在VGG19基础上,改进现有模型对图像特征的编码形式,通过提取和融合图像多尺度特征的方法,获取更丰富的图像信息。在MSCOCO数据集上进行训练和测试,实验结果表明,提出的模型能够生成更加准确、完整,更有意义的图像描述语句。

关 键 词:图像描述生成  深度学习  多尺度  图像特征
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号