首页 | 官方网站   微博 | 高级检索  
     

低质量数据下的知识获取方案研究
引用本文:李兴森,石勇,鹿盟,申爱华.低质量数据下的知识获取方案研究[J].当代经济管理,2007,29(3):78-83.
作者姓名:李兴森  石勇  鹿盟  申爱华
作者单位:1. 中国科学院,研究生院管理学院,北京,100080;中国科学院,数据技术与知识经济研究中心,北京,100080
2. 中国科学院,数据技术与知识经济研究中心,北京,100080;中国科学院,研究生院,北京,100080
3. 中国科学院,研究生院管理学院,北京,100080
基金项目:国家自然科学基金委管理科学部与信息科学部跨学科重点项目(70531040),国家自然科学基金项目,(70501030,70472074),973计划项目(2004CB720103)。
摘    要:数据挖掘已经成为重要的知识来源。随着信息化的深入,企业对数据挖掘有了较大的需求,但数据质量差往往会造成数据挖掘的结论可信度低,从而影响了数据挖掘的应用。本文以可拓学方法,通过系统分析产生脏数据的原因,提出了基于学科链方法的数据清洗方案。通过数据挖掘手段发现数据质量差距,追溯到软件设计、实施、维护等上游环节,提出从来源环节解决问题的系统方法,并提出通过数据挖掘应用咨询促使数据质量改进的措施,从而降低数据清洗的工作量,使数据质量不高的企业也可以实施数据挖掘项目,获取决策支持所需的知识。

关 键 词:数据质量  数据挖掘  知识管理  可拓学  数据挖掘咨询  企业信息化
文章编号:1673-0461(2007)03-0078-06

Knowledge Acquisition under the Low-quality Data
LI Xing-sen,SHI Yong,LU Meng,SHEN Ai-hua.Knowledge Acquisition under the Low-quality Data[J].Contemporary Economic Management,2007,29(3):78-83.
Authors:LI Xing-sen  SHI Yong  LU Meng  SHEN Ai-hua
Abstract:The demand for data mining as a new knowledge source has been increasing in enterprise with the development of information system.However,the low-quality data tends to lead to the low credible conclusion on data mining,which affects the application of the data mining.Through the analysis on the reasons based on extension theory,the paper has established a new method called data mining consulting to solve the data quality problem by metasynthesis method including software designing,management and data mining testing,etc.Its application in a web company shows that it has good practicality which can carry out data mining project in low quality data enterprises and increase the data quality.
Keywords:data quality  data mining  knowledge management  Extenics  data mining consulting  enterprise informationalization
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号