首页 | 官方网站   微博 | 高级检索  
     

混合的大规模数据库自动模式抽象方法
引用本文:王雪,周烜,王珊.混合的大规模数据库自动模式抽象方法[J].计算机学报,2013,36(8).
作者姓名:王雪  周烜  王珊
作者单位:1. 数据工程与知识工程教育部重点实验室(中国人民大学)北京100872;中国人民大学信息学院 北京 100872
2. 中国人民大学信息学院 北京 100872
基金项目:国家教育部"新世纪优秀人才支持计划"、国家自然科学基金,中国人民大学科学研究基金,This work is partly supported by the Program for New Century Excellent Talents of China
摘    要:随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为“团”,然后使用元聚类方法将这些“团”集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.

关 键 词:模式  抽象  大规模数据库  主题组  混合

Hybrid Schema Summarization Method of Large Scale Database
WANG Xue , ZHOU Xuan , WANG Shan.Hybrid Schema Summarization Method of Large Scale Database[J].Chinese Journal of Computers,2013,36(8).
Authors:WANG Xue  ZHOU Xuan  WANG Shan
Abstract:
Keywords:schema  summarization  large-scale database  subject group  hybrid
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号