首页 | 官方网站   微博 | 高级检索  
     

视觉场景描述及其效果评价
引用本文:马苗,王伯龙,吴琦,武杰,郭敏. 视觉场景描述及其效果评价[J]. 软件学报, 2019, 30(4): 867-883
作者姓名:马苗  王伯龙  吴琦  武杰  郭敏
作者单位:现代教学技术教育部重点实验室(陕西师范大学), 陕西 西安 710062;陕西师范大学 计算机科学学院, 陕西 西安 710119,陕西师范大学 计算机科学学院, 陕西 西安 710119,School of Computer Science, The University of Adelaide, Adelaide SA5005, Australia,陕西师范大学 计算机科学学院, 陕西 西安 710119,陕西师范大学 计算机科学学院, 陕西 西安 710119
基金项目:国家自然科学基金(61877038,61801282,61601274);陕西省自然科学基金(2018JM6068);中央高校基本科研业务经费(GK201703054,GK201703058)
摘    要:作为计算机视觉、多媒体、人工智能和自然语言处理等领域的交叉性研究课题,视觉场景描述的研究内容是自动生成一个或多个语句用于描述图像或视频中呈现的视觉场景信息.视觉场景中内容的丰富性和自然语言表达的多样性使得视觉场景描述成为一项充满挑战的任务,综述了现有视觉场景描述方法及其效果评价.首先,论述了视觉场景描述的定义、研究任务及方法分类,简要分析了视觉场景描述与多模态检索、跨模态学习、场景分类、视觉关系检测等相关技术的关系;然后分类讨论视觉场景描述的主要方法、模型及研究进展,归纳日渐增多的基准数据集;接下来,梳理客观评价视觉场景描述效果的主要指标和视觉场景描述技术面临的问题与挑战,最后讨论未来的应用前景.

关 键 词:深度学习  图像描述  视频描述  基准数据集  性能评价
收稿时间:2018-04-15
修稿时间:2018-06-13

Visual Scene Description and Its Performance Evaluation
MA Miao,WANG Bo-Long,WU Qi,WU Jie and GUO Min. Visual Scene Description and Its Performance Evaluation[J]. Journal of Software, 2019, 30(4): 867-883
Authors:MA Miao  WANG Bo-Long  WU Qi  WU Jie  GUO Min
Affiliation:Key Laboratory of Modern Teaching Technology of Ministry of Education(Shaanxi Normal University), Xi''an 710062, China;School of Computer Science, Shaanxi Normal University, Xi''an 710119, China,School of Computer Science, Shaanxi Normal University, Xi''an 710119, China,School of Computer Science, The University of Adelaide, Adelaide SA5005, Australia,School of Computer Science, Shaanxi Normal University, Xi''an 710119, China and School of Computer Science, Shaanxi Normal University, Xi''an 710119, China
Abstract:
Keywords:deep learning  image captioning  video captioning  benchmark dataset  performance evaluation
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号