首页 | 官方网站   微博 | 高级检索  
     

基于增强语义信息理解的场景图生成
引用本文:曾军英,陈运雄,秦传波,陈宇聪,王迎波,田慧明,顾亚谨.基于增强语义信息理解的场景图生成[J].电子技术应用,2023(5):52-56.
作者姓名:曾军英  陈运雄  秦传波  陈宇聪  王迎波  田慧明  顾亚谨
作者单位:五邑大学智能制造学部
摘    要:场景图生成(SGG)任务旨在检测图像中的视觉关系三元组,即主语、谓语、宾语,为场景理解提供结构视觉布局。然而,现有的场景图生成方法忽略了预测的谓词频率高但却无信息性的问题,从而阻碍了该领域进步。为了解决上述问题,提出一种基于增强语义信息理解的场景图生成算法。整个模型由特征提取模块、图像裁剪模块、语义转化模块、拓展信息谓词模块四部分组成。特征提取模块和图像裁剪模块负责提取视觉特征并使其具有全局性和多样性。语义转化模块负责将谓词之间的语义关系从常见的预测中恢复信息预测。拓展信息谓词模块负责扩展信息谓词的采样空间。在数据集VG和VG-MSDN上与其他方法进行比较,平均召回率分别达到59.5%和40.9%。该算法可改善预测出来的谓词信息性不足问题,进而提升场景图生成算法的性能。

关 键 词:场景图生成  图像裁剪  语义转化  拓展信息
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号