PandaDB:一种异构数据智能融合管理系统 PandaDB: Intelligent Management System for Heterogeneous Data期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

PandaDB:一种异构数据智能融合管理系统

引用本文：	沈志宏,赵子豪,王华进,刘忠新,胡川,周园春. PandaDB:一种异构数据智能融合管理系统[J]. 软件学报, 2021, 32(3): 763-780

作者姓名：	沈志宏赵子豪王华进刘忠新胡川周园春

作者单位：	中国科学院计算机网络信息中心,北京100190;中国科学院计算机网络信息中心,北京100190;中国科学院大学,北京100049

基金项目：	中国科学院战略性先导科技专项B类课题（XDB38030300）；国家自然科学基金重点项目（（61836013）；科技部创新方法工作专项（2019IM020100），中国科学院信息化专项课题（XXH13503）

摘要：	随着大数据应用的不断深入，对大规模结构化/非结构化数据进行融合管理和分析的需求日益凸显.然而，结构化/非结构化数据在存储管理方式、信息获取方式、检索方式方面的差异给融合管理和分析带来了技术挑战.本文提出了适用于异构数据融合管理和语义计算的属性图扩展模型，并定义了相关属性操作符和查询语法.接着，基于智能属性图模型提出异构数据智能融合管理系统PandaDB，并详细介绍了PandaDB的总体架构、存储机制、查询机制、属性协存和AI算法集成机制.性能测试和应用案例证明，PandaDB的协存机制、分布式架构和语义索引机制对大规模异构数据的即席查询和分析具有较好的性能表现，该系统可实际应用于学术图谱实体消歧与可视化等融合数据管理场景.
关键词：	数据管理系统异构数据融合图数据模型即席查询人工智能
收稿时间：	2020-07-20
修稿时间：	2020-11-06
PandaDB: Intelligent Management System for Heterogeneous Data

SHEN Zhi-Hong,ZHAO Zi-Hao,WANG Hua-Jin,LIU Zhong-Xin,HU Chuan,ZHOU Yuan-Chun. PandaDB: Intelligent Management System for Heterogeneous Data[J]. Journal of Software, 2021, 32(3): 763-780

Authors:	SHEN Zhi-Hong ZHAO Zi-Hao WANG Hua-Jin LIU Zhong-Xin HU Chuan ZHOU Yuan-Chun

Affiliation:	Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China;Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100049, China

Abstract:	With the development of big data application, the demand of large-scale structured/unstructured data fusion management and analysis is becoming increasingly prominent. However, the differences in management, process, retrieval of structured/unstructured data brings challenges for fusion management and analysis. This paper proposes an extended property graph model for heterogeneous data fusion management and semantic computing, defines related property operators and query syntax. Based on the intelligent property graph model, this paper implements PandaDB, an intelligent heterogeneous data fusion management system. This paper depicts the architecture, storage mechanism, query mechanism, property co-storage, AI algorithm scheduling and distributed architecture of PandaDB. Test experiments and cases show that the co-storage mechanism and distributed architecture of PandaDB have good performance acceleration effects, and can be applied in some scenarios of fusion data intelligent management such as academic knowledge graph entity disambiguation.

Keywords:	Data Management System Heterogeneous data fusion Graph Data Model Ad-hoc Query AI
本文献已被万方数据等数据库收录！
	点击此处可从《软件学报》浏览原始摘要信息
	点击此处可从《软件学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏