首页 | 官方网站   微博 | 高级检索  
     

面向数据质量的ETL框架的设计与实现
引用本文:李庆阳,彭宏.面向数据质量的ETL框架的设计与实现[J].计算机工程与设计,2010,31(9).
作者姓名:李庆阳  彭宏
作者单位:华南理工大学,计算机科学与工程学院,广东,广州,510006
基金项目:广东省自然科学基金,广东省科技攻关项目 
摘    要:针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构.根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等.该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理.基于该设计思想开发一个ETL工具-DQETL.DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理.最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤.

关 键 词:数据仓库  数据质量  抽取-转换-装载(ETL)  规则推导  数据清洗

Design and realization of ETL architecture to data quality
LI Qing-yang,PENG Hong.Design and realization of ETL architecture to data quality[J].Computer Engineering and Design,2010,31(9).
Authors:LI Qing-yang  PENG Hong
Affiliation:LI Qing-yang,PENG Hong (School of Computer Science , Engineering,South China University of Technology,Guangzhou 510006,China)
Abstract:
Keywords:data warehouse  data quality  extract-transform-load(ETL)  rule deduction  data cleaning
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号