首页 | 官方网站   微博 | 高级检索  
     

基于信息熵的不确定性数据清理方法
引用本文:覃远翔,段亮,岳昆.基于信息熵的不确定性数据清理方法[J].计算机应用,2013,33(9):2490-2492.
作者姓名:覃远翔  段亮  岳昆
作者单位:1. 云南大学 信息学院,昆明 650091 2.
基金项目:国家自然科学基金资助项目,云南省应用基础研究计划项目,云南省教育厅科研基金资助项目
摘    要:针对不确定性数据中往往包含一些异常数据而导致相应的查询结果出现错误的问题,提出了一种基于信息熵的不确定性数据清理方法以减少异常数据并提高不确定性数据的质量。首先使用信息熵来度量数据的不确定度,然后结合统计学方法计算出不确定性数据的可信区间,最后去除那些不在可信区间内的数据。实验结果验证了该方法的高效性和有效性。

关 键 词:不确定性数据    数据清理    信息熵    不确定度    可信区间
收稿时间:2013-03-25
修稿时间:2013-04-21

Approach for cleaning uncertain data based on information entropy theory
QIN Yuanxiang , DUAN Liang , YUE Kun.Approach for cleaning uncertain data based on information entropy theory[J].journal of Computer Applications,2013,33(9):2490-2492.
Authors:QIN Yuanxiang  DUAN Liang  YUE Kun
Affiliation:1. School of Information Science and Engineering, Yunnan University, Kunming Yunnan 650091, China
2.
Abstract:In response to the issue that data anomalies in the uncertain databases often hamper the efficient and effective use of data, an uncertain data cleaning method was proposed to reduce abnormal data based on the information entropy theory. First, the uncertainty degree of uncertain data was defined by using information entropy. Then, the confidence interval of uncertain data was obtained based on statistical method with the degree of uncertainty. By means of the confidence interval, the uncertain databases were cleaned. The experimental results show the effectiveness and efficiency of the proposed method.
Keywords:uncertain data  data cleansing  information entropy  uncertainty degree  confidence interval
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号