首页 | 官方网站   微博 | 高级检索  
     

基于信息熵的粗糙K-prototypes聚类算法
引用本文:欧阳浩,戴喜生,王智文,王萌.基于信息熵的粗糙K-prototypes聚类算法[J].计算机工程与设计,2015(5).
作者姓名:欧阳浩  戴喜生  王智文  王萌
作者单位:1. 广西科技大学 计算机学院,广西 柳州,545006
2. 广西科技大学 电气与信息工程学院,广西 柳州,545006
基金项目:国家自然科学基金项目(61364006);广西自然科学基金项目(2013GXNSFAA019336、2013GXNSFBA019280);广西高校科学技术研究基金项目(LX2014190);广西科技大学科学基金项目
摘    要:针对传统K-prototypes在计算分类属性的差异度时未考虑各个分类属性对聚类结果的影响程度,且算法容易受到噪声的干扰,无法处理数据中不够精确、不完整等不确定性问题,提出基于信息熵的粗糙K-prototypes聚类算法。在计算数据样本之间分类属性的差异度时,使用信息熵的理论,确定每个分类属性对于聚类分析结果的影响权重;引入粗糙理论,计算得到各样本与粗糙模之间的粗糙相异度,通过多次迭代计算,获得最终聚类结果。该算法结合信息熵和粗糙理论,可区别对待各分类属性,解决数据不精确引起的不确定性问题,4个UCI数据集上的实验分析结果验证了该算法的有效性。

关 键 词:混合型数据  聚类  信息熵  粗糙集  数据挖掘

Rough K-prototypes clustering algorithm based on entropy
OUYANG Hao,DAI Xi-sheng,WANG Zhi-wen,WANG Meng.Rough K-prototypes clustering algorithm based on entropy[J].Computer Engineering and Design,2015(5).
Authors:OUYANG Hao  DAI Xi-sheng  WANG Zhi-wen  WANG Meng
Abstract:
Keywords:mixed data  clustering  information entropy  rough set  data mining
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号