首页 | 官方网站   微博 | 高级检索  
     

基于共享知识的不完整大数据填充方法
引用本文:熊中敏,郭怀宇,王鑫.基于共享知识的不完整大数据填充方法[J].计算机应用研究,2021,38(9):2683-2689.
作者姓名:熊中敏  郭怀宇  王鑫
作者单位:上海海洋大学 信息学院,上海201306
基金项目:国家自然科学基金资助项目(41501419);上海市地方院校能力建设项目(19050502100)
摘    要:针对传统大数据填充方法相似度度量方法单一,且通常只考虑原数据集内部联系,使得填充数据容易被原数据集限制、失去自身原有特点、填充结果不客观等问题.提出一种新的概念——共享知识,该方法首先基于共享知识构建不完整数据集与异源相似完整数据集的共享关系,并建立共享信息系统;其次通过新的相似度度量方法建立它们对象间的相似关系,从而用异源相似完整数据集对象对不完整的数据集对象进行相似填充.实验结果表明,新的相似度度量方法比单一的数值型相似度度量方法填充精度更高.与其他填补算法相比,该方法对缺失值的填充精度值能够稳定地保持在0.85以上,均方根误差稳定在0.15之下,充分保留了填充值的客观性,填充效果更好.

关 键 词:不完整数据  共享知识  相似度  异源  数据填充
收稿时间:2021/1/13 0:00:00
修稿时间:2021/8/10 0:00:00

Incomplete big data filling method based on shared knowledge
xiongzhongmin,guohuaiyu and wangxin.Incomplete big data filling method based on shared knowledge[J].Application Research of Computers,2021,38(9):2683-2689.
Authors:xiongzhongmin  guohuaiyu and wangxin
Affiliation:School of Information, Shanghai Ocean University,,
Abstract:
Keywords:shared knowledge  similarity  heterogeneity  data filling
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号