基于增强语义信息理解的场景图生成期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于增强语义信息理解的场景图生成

引用本文：	曾军英,陈运雄,秦传波,陈宇聪,王迎波,田慧明,顾亚谨.基于增强语义信息理解的场景图生成[J].电子技术应用,2023(5):52-56.

作者姓名：	曾军英陈运雄秦传波陈宇聪王迎波田慧明顾亚谨

作者单位：	五邑大学智能制造学部

摘要：	场景图生成（SGG）任务旨在检测图像中的视觉关系三元组，即主语、谓语、宾语，为场景理解提供结构视觉布局。然而，现有的场景图生成方法忽略了预测的谓词频率高但却无信息性的问题，从而阻碍了该领域进步。为了解决上述问题，提出一种基于增强语义信息理解的场景图生成算法。整个模型由特征提取模块、图像裁剪模块、语义转化模块、拓展信息谓词模块四部分组成。特征提取模块和图像裁剪模块负责提取视觉特征并使其具有全局性和多样性。语义转化模块负责将谓词之间的语义关系从常见的预测中恢复信息预测。拓展信息谓词模块负责扩展信息谓词的采样空间。在数据集VG和VG-MSDN上与其他方法进行比较，平均召回率分别达到59.5%和40.9%。该算法可改善预测出来的谓词信息性不足问题，进而提升场景图生成算法的性能。
关键词：	场景图生成图像裁剪语义转化拓展信息