首页 | 官方网站   微博 | 高级检索  
     

深度学习多模态图像语义分割前沿进展
引用本文:赵什陆,张强.深度学习多模态图像语义分割前沿进展[J].中国图象图形学报,2023,28(11):3320-3341.
作者姓名:赵什陆  张强
作者单位:西安电子科技大学机电工程学院, 西安 710071
基金项目:国家自然科学基金项目(61773301);陕西省重点科技创新团队项目(2018TD-012);河北工业大学电工装备可靠性与智能化国家重点实验室项目(EERIKF2022005);卫星信息智能处理与应用技术实验室基金项目(2022-ZZKY-JJ-09-01)
摘    要:图像语义分割旨在将视觉场景分解为不同的语义类别实体,实现对图像中每一个像素的类别预测。多模态图像语义分割通过联合利用不同模态图像(即通过基于不同成像机理的传感器获取的图像)间的互补特性,能够全面且准确地实现复杂场景信息的学习与推理。目前基于深度学习的多模态图像语义分割前沿成果较多,但缺少系统且全面的调研与分析。本文首先总结并分析了目前主流的基于深度学习的可见光—热红外(red-green-bluethermal,RGB-T)图像语义分割算法和可见光—深度(red-green-blue-depth,RGB-D)图像语义分割算法。依据算法侧重点不同,将基于深度学习的RGB-T图像语义分割算法划分为基于图像特征增强的方法、基于多模态图像特征融合的方法和基于多层级图像特征交互的方法;依据算法对深度信息的利用方式,将基于深度学习的RGB-D图像语义分割算法划分为基于深度信息提取的方法和基于深度信息引导的方法。然后,介绍了多模态图像语义分割算法常用的客观评测指标以及数据集,并在常用数据集上对上述算法进行对比。对于RGB-T图像语义分割,在MFNet(multi-spectral fusion network)数据集上,GMNet (graded-feature multilabel-learning network)和MFFENet (multiscale feature fusion and enhancement network)分别取得了最优的类平均交并比(mean intersection-over-union per class,mIoU)(57.3%)和类平均精度(mean accuracy per class,mAcc)(74.3%)值。在PST900(PENN subterranean thermal 900)数据集上,GMNet仍然取得了最优的mIoU(84.12%)值,而EGFNet取得了最优的mAcc(94.02%)值。对于RGB-D图像语义分割,在NYUD v2(New York University depth dataset v2)数据集上,GLPNet(global-local propagation network)的mIoU和mAcc分别达到了54.6%和66.6%,取得最优性能。而在SUN-RGBD(scene understanding-RGB-D)数据集上,Zig-Zag的mIoU为51.8%,GLPNet的mAcc为63.3%,均为最优性能。最后,本文还指出了多模态图像语义分割领域未来可能的发展方向。

关 键 词:多模态图像  语义分割  特征增强  特征融合  特征交互  深度信息提取  深度信息引导
收稿时间:2022/5/23 0:00:00
修稿时间:2023/2/13 0:00:00

Progress in multi-modal image semantic segmentation based on deep learning
Zhao Shenlu,Zhang Qiang.Progress in multi-modal image semantic segmentation based on deep learning[J].Journal of Image and Graphics,2023,28(11):3320-3341.
Authors:Zhao Shenlu  Zhang Qiang
Affiliation:School of Mechano-Electronic Engineering, Xidian University, Xi''an 710071, China
Abstract:
Keywords:multi-modal image  semantic segmentation  feature enhancement  feature fusion  feature interaction  depth information extraction  depth information guidance
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号