首页 | 官方网站   微博 | 高级检索  
     

一种大规模数据快速并行导入工具的研究与实现
作者单位:;1.黄河科技学院
摘    要:随着大规模数据的快速增长及高可靠性需求,将本地数据迁移到分布式数据库势在必行。针对这种情况,提出一种基于MapReduce的"快速并行导入"技术,充分利用集群的并行计算能力,直接向HBase底层存储文件HFile写入数据,既可避免上层数据导入时间的浪费,又节省资源开销。有效解决了从单机数据库向HBase分布式数据库导入数据功能低下、效率不高等问题。实验结果表明,在"快速并行导入"技术的基础上设计并实现的快速并行导入工具,支持多列族文本数据的快速导入。与传统使用API导入数据相比,速度提升一倍以上。

关 键 词:Hadoop  HBase  MapReduce  分布式数据库  大规模数据导入

STUDY AND REALISATION OF A FAST PARALLEL IMPORT TOOL FOR VERY-LARGE DATA
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号