首页 | 官方网站   微博 | 高级检索  
     

基于数据空间网格划分的PK-树索引结构
引用本文:胡云,孙志挥,李存华.基于数据空间网格划分的PK-树索引结构[J].计算机应用研究,2005,22(12):33-35,38.
作者姓名:胡云  孙志挥  李存华
作者单位:1. 淮海工学院,计算机科学系,江苏,连云港,222005;东南大学,计算机科学与工程系,江苏,南京,210018
2. 东南大学,计算机科学与工程系,江苏,南京,210018
3. 淮海工学院,计算机科学系,江苏,连云港,222005
基金项目:国家自然科学基金资助项目(70371015);高等学校博士学科点专项科研基金资助项目(20040286009);江苏省教育厅自然科学基金资助项目(02KJB520012)
摘    要:在大规模高维数据挖掘研究中,数据存储与索引方法的有效性是决定算法时空效率的重要因素。将数据空间网格划分策略与高效率的树型索引结构结合起来,可以充分发挥两者在数据组织上的综合优势,将复杂问题转换为结构化的简单重复问题:在统一的框架下给出了各种数据空间网格划分的定义,讨论了两种适用于实现网格化数据索引的R-树和PK-树索引结构:试验结果表明,PK-树在数据存储和索引上具有更高的效率,与网格化数据组织方法结合起来,对于降低大规模高维数据分析问题的时空复杂度具有重要意义。

关 键 词:网格划分  PK-树  索引
文章编号:1001-3695(2005)12-0033-03
收稿时间:2004-11-20
修稿时间:2004-11-202005-01-16

On the PK-tree Index Structure for Grid-based Point Data
HU Yun,SUN Zhi-hui,LI Cun-hua.On the PK-tree Index Structure for Grid-based Point Data[J].Application Research of Computers,2005,22(12):33-35,38.
Authors:HU Yun  SUN Zhi-hui  LI Cun-hua
Abstract:One of the key factor in large-scsle and high dimensional data mining is the efficiency of data handling and indexing. A promised approach to this concern is to take advantages of both grid partition and efficient tree structure indexing. With this means a complicated problem can be significently simplified, The paper formulizes the definition of various grid-partition methods and discusses a pair of tree-index structures which are preferable for handling large-scale and high dimensional point data set. Results show that the PK-tree is superior both in space usage and retrieve depth.
Keywords:Grid Partition  PK-tree  Indexing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号