首页 | 官方网站   微博 | 高级检索  
     

MapReduce环境下支持精确查询的嵌套式数据索引技术
作者姓名:彭敦陆  王丽  霍欢
作者单位:上海理工大学光电信息与计算机工程学院
基金项目:国家自然科学基金项目(61003031)资助;上海市自然科学基金项目(10ZR1421100)资助;上海市研究生创新基金项目(JWCXSL1302)资助
摘    要:目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特别是对如何保证精确查询效率更是一个挑战.结合列存储结构和倒排索引技术,首先定义了表达嵌套式数据集中数据位置信息的唯一路径UPath,提出一种新的支持嵌套式数据集精确查询的索引结构——Uni Hash.在此基础上,给出了生成数据值的唯一路径UPath以及基于MapReduce框架建立Uni Hash索引的相关算法.通过将其与XPath检索进行对比,验证了Uni Hash索引结构的有效性.实验表明,将嵌套式数据集进行列式存储并建立Uni Hash索引,能够明显地提高精确查询的效率.

关 键 词:嵌套式数据  精确查询  列存储  倒排索引  Uni Hash
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号