首页 | 官方网站   微博 | 高级检索  
     

PandaDB:一种异构数据智能融合管理系统
引用本文:沈志宏,赵子豪,王华进,刘忠新,胡川,周园春. PandaDB:一种异构数据智能融合管理系统[J]. 软件学报, 2021, 32(3): 763-780
作者姓名:沈志宏  赵子豪  王华进  刘忠新  胡川  周园春
作者单位:中国科学院计算机网络信息中心,北京100190;中国科学院计算机网络信息中心,北京100190;中国科学院大学,北京100049
基金项目:中国科学院战略性先导科技专项B类课题(XDB38030300);国家自然科学基金重点项目((61836013);科技部创新方法工作专项(2019IM020100),中国科学院信息化专项课题(XXH13503)
摘    要:随着大数据应用的不断深入,对大规模结构化/非结构化数据进行融合管理和分析的需求日益凸显.然而,结构化/非结构化数据在存储管理方式、信息获取方式、检索方式方面的差异给融合管理和分析带来了技术挑战.本文提出了适用于异构数据融合管理和语义计算的属性图扩展模型,并定义了相关属性操作符和查询语法.接着,基于智能属性图模型提出异构数据智能融合管理系统PandaDB,并详细介绍了PandaDB的总体架构、存储机制、查询机制、属性协存和AI算法集成机制.性能测试和应用案例证明,PandaDB的协存机制、分布式架构和语义索引机制对大规模异构数据的即席查询和分析具有较好的性能表现,该系统可实际应用于学术图谱实体消歧与可视化等融合数据管理场景.

关 键 词:数据管理系统  异构数据融合  图数据模型  即席查询  人工智能
收稿时间:2020-07-20
修稿时间:2020-11-06

PandaDB: Intelligent Management System for Heterogeneous Data
SHEN Zhi-Hong,ZHAO Zi-Hao,WANG Hua-Jin,LIU Zhong-Xin,HU Chuan,ZHOU Yuan-Chun. PandaDB: Intelligent Management System for Heterogeneous Data[J]. Journal of Software, 2021, 32(3): 763-780
Authors:SHEN Zhi-Hong  ZHAO Zi-Hao  WANG Hua-Jin  LIU Zhong-Xin  HU Chuan  ZHOU Yuan-Chun
Affiliation:Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China;Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100049, China
Abstract:With the development of big data application, the demand of large-scale structured/unstructured data fusion management and analysis is becoming increasingly prominent. However, the differences in management, process, retrieval of structured/unstructured data brings challenges for fusion management and analysis. This paper proposes an extended property graph model for heterogeneous data fusion management and semantic computing, defines related property operators and query syntax. Based on the intelligent property graph model, this paper implements PandaDB, an intelligent heterogeneous data fusion management system. This paper depicts the architecture, storage mechanism, query mechanism, property co-storage, AI algorithm scheduling and distributed architecture of PandaDB. Test experiments and cases show that the co-storage mechanism and distributed architecture of PandaDB have good performance acceleration effects, and can be applied in some scenarios of fusion data intelligent management such as academic knowledge graph entity disambiguation.
Keywords:Data Management System  Heterogeneous data fusion  Graph Data Model  Ad-hoc Query  AI
本文献已被 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号