首页 | 官方网站   微博 | 高级检索  
     

图像语义相似性网络的文本描述方法
作者单位:;1.复旦大学计算机科学技术学院
摘    要:图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网络,引入图像间的视觉相似性和文本相似性信息,从而在预测图像的文本描述时保持相似图像的有效语义信息。增加栈式隐层和普通隐层的深度来提高语言模型的学习能力,最终得到接近自然语言的文本。实验结果表明,该方法在BLEU、ROUGE、METEOR和CIDEr等评价指标上均取得较好的效果,能够生成符合图像内容的高质量文本描述。

关 键 词:图像文本化描述  递归神经网络  语义相似性  语言模型  语义鸿沟  束搜索

IMAGE CAPTION BASED ON IMAGE SEMANTIC SIMILARITY NETWORK
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号