首页 | 官方网站   微博 | 高级检索  
     

半结构化、层次数据的模式发现
引用本文:刘芳,胡和平,路松峰.半结构化、层次数据的模式发现[J].小型微型计算机系统,2001,22(1):84-88.
作者姓名:刘芳  胡和平  路松峰
作者单位:华中科技大学计算机科学与技术学院
基金项目:国防预研基金(94J3.4.2.J9w05)资助
摘    要:Web数据资源及数据集成引发了半结构化数据问题,半结构化数据指其结构隐含或不规整的自描述数据。由于缺乏独立于数据的模式,有效地查询划浏览该类数据比较困难,半结构化数据的模式发现成为解决该问题的基础步骤。本文提出的算法能够快速有效地发现半结构化层次数据中的规整结构。它采用自顶向下的生成,结合有效的剪枝策略,从OEM模型表达的半结构化层次数据中构建模式树。

关 键 词:半结构化数据  模式发现  OEM  层次数据  数据库
文章编号:1000-1220(2001)01-0084-05

SCHEMA DISCOVERY FOR SEMISTRUCTURED HIERARCHICAL DATA
LIU Fang,HU He-ping,LU Song-feng.SCHEMA DISCOVERY FOR SEMISTRUCTURED HIERARCHICAL DATA[J].Mini-micro Systems,2001,22(1):84-88.
Authors:LIU Fang  HU He-ping  LU Song-feng
Abstract:Semistructured data arise when the source does not impose a rigid structure (such as the web) and when data is combined from several heterogeneous data sources. Semistructured data is a self describing data whose structure is implicit or irregular. The lack of external schema information makes querying and browsing these data inefficient. This paper presents an algorithm discover schema fastly and efficiently. Using a top down approach with efficient prune strategy, a schema tree can be constructed from an OEM graph.
Keywords:Semistructured data  Schema discovery  OEMP  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号