首页 | 官方网站   微博 | 高级检索  
     

数据仓库ETL任务调度模型研究
引用本文:宋旭东,刘晓冰.数据仓库ETL任务调度模型研究[J].控制与决策,2011,26(2):271-275.
作者姓名:宋旭东  刘晓冰
作者单位:1. 大连交通大学软件学院,大连,116028;大连理工大学CIMS中心,大连,116024
2. 大连理工大学CIMS中心,大连,116024
基金项目:国家自然科学基金项目,辽宁省教育厅项目
摘    要:数据仓库系统包含众多的抽取-转换-加载(ETL)任务,这些任务具有一定的优先约束关系.在多处理机环境下,如何高效地调度这些ETL任务是构建数据仓库需要研究的重要问题.对此,在对数据仓库ETL任务调度规则进行归纳总结的基础上,以数据仓库总的ETL完成时间最短为目标,建立了数据仓库ETL任务调度模型.同时结合问题的特点,采用同层划分的思想,提出基于同层划分遗传算法求解问题的方法.最后,通过应用实例验证了所建立模型和求解算法的可行性和有效性.

关 键 词:数据仓库  抽取-转换-加载  任务调度  同层划分  遗传算法
收稿时间:2009/11/27 0:00:00
修稿时间:2010/4/17 0:00:00

Study on ETL Task Scheduling Model in Data Warehouse
SONG Xu-Dong,LIU Xiao-Bing.Study on ETL Task Scheduling Model in Data Warehouse[J].Control and Decision,2011,26(2):271-275.
Authors:SONG Xu-Dong  LIU Xiao-Bing
Affiliation:1.Software Institute,Dalian Jiaotong University,Dalian 116028,China;2.CIMS Center,Dalian University of Technology,Dalian 116024,China.)
Abstract:

Data warehouse system includes many extract-transform-load(ETL) tasks which have some precedence constraint relations. In a multi-processor environment, how to efficiently schedule these ETL tasks is one of the important aspects for constructing data warehouse. On the basis of classification and summary of data warehouse ETL scheduling rules, a data warehouse ETL scheduling model is established to minimize the total ETL execution time. At the same time, based on the characteristics of the problem, adopting the same layer division strategy, a genetic algorithm based on the same layer division is proposed. Finally, the application case of the model is represented, and the case results show the feasibility and effectiveness of this model and its algorithm.

Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号