图像指代分割研究综述 |
| |
引用本文: | 邱爽,赵耀,韦世奎. 图像指代分割研究综述[J]. 信号处理, 2022, 38(6): 1144-1154. DOI: 10.16798/j.issn.1003-0530.2022.06.002 |
| |
作者姓名: | 邱爽 赵耀 韦世奎 |
| |
作者单位: | 1.北京交通大学信息科学研究所,北京 100044 |
| |
基金项目: | 基?金?项?目?:?基金项目:国家重点研发计划2018AAA0102100国家自然科学基金62120106009中央高校基本科研业务费专项资金资助2018JBZ001 |
| |
摘 要: | 图像指代分割作为计算机视觉与自然语言处理交叉领域的热点问题,其目的是根据自然语言描述在图像中分割出相应的目标区域。随着相关深度学习技术的成熟和大规模数据集的出现,这项任务引起了研究者的广泛关注。本文对图像指代分割算法的发展进行了梳理和分析。首先根据多模态信息的编码解码方式,将现有图像指代分割算法分成基于多模态信息融合和基于多尺度信息融合两类进行了系统阐述,重点介绍了基于CNN-LSTM框架的方法、结构复杂的模块化方法和基于图的方法;然后,对用于图像指代分割任务的典型数据集和主流评价指标进行了总结与统计;之后,通过实验综合比较了现有的图像指代分割模型之间的性能差异并进一步验证了各种模型的优缺点。最后,对这一领域现有方法中存在的问题进行讨论分析,并对未来的发展方向进行了展望,表明了针对复杂的指代描述,需要通过多步、显式的推理步骤来解决图像指代分割问题。
|
关 键 词: | 指代分割 图像语义分割 深度学习 卷积神经网络 |
收稿时间: | 2021-10-09 |
A Survey of Referring Image Segmentation |
| |
Affiliation: | 1.Institute of Information Science, Beijing Jiaotong University, Beijing 100044, China2.Beijing Key Laboratory of Advanced Information Science and Network Technology, Beijing 100044, China |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《信号处理》浏览原始摘要信息 |
|
点击此处可从《信号处理》下载免费的PDF全文 |