首页 | 官方网站   微博 | 高级检索  
     

基于信息增益的模糊K-prototypes聚类算法
引用本文:欧阳浩,王智文,戴喜生,刘智琦.基于信息增益的模糊K-prototypes聚类算法[J].计算机工程与科学,2015,37(5):1009-1014.
作者姓名:欧阳浩  王智文  戴喜生  刘智琦
作者单位:1. 广西科技大学计算机学院,广西柳州,545006
2. 广西科技大学电气与信息工程学院,广西柳州,545006
基金项目:国家自然科学基金资助项目(61462008,61364006);广西自然科学基金资助项目(2013GXNSFAA019336);广西高校科学技术研究项目(LX2014190,YB2014210,LX2014190);广西科技大学科学基金资助项目(校科自1261128)
摘    要:K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用了信息论中信息增益的计算方法,来获得各个属性的权值。在计算各属性的差异度时,乘以这些权值,从而可以获得更为准确的聚类结果。为了增加算法处理模糊问题的能力,本算法引用了模糊理论,从而使其具有较好的抗干扰能力和处理不确定性问题的能力。通过对四个UCI数据集的聚类分析实验,表明了本算法的有效性。

关 键 词:聚类  信息增益  模糊K-prototypes算法  混合型数据
收稿时间:2014-09-10
修稿时间:2014-11-04

A fuzzy K-prototypes clustering algorithm based on information gain
OUYANG Hao , WANG Zhi-wen , DAI Xi-sheng , LIU Zhi-qi.A fuzzy K-prototypes clustering algorithm based on information gain[J].Computer Engineering & Science,2015,37(5):1009-1014.
Authors:OUYANG Hao  WANG Zhi-wen  DAI Xi-sheng  LIU Zhi-qi
Affiliation:(1.School of Computer,Guangxi University of Science and Technology,Liuzhou 545006; 2.School of Electrical and Information Engineering, Guangxi University of Science and Technology,Liuzhou 545006,China)
Abstract:K-prototypes clustering algorithms  combine K-means and K-modes to analyze mixed data objects.Classic K-prototypes clustering algorithms don’t consider the effect degree of each attribute to the last clustering results when calculating the dissimilarity of data object. But in the real world,the importance of each attribute varies.In this paper we use information gain of the information theory to get the weight of each attribute.These weights are used to get a better clustering result when we calculate the dissimilarity.In order to improve the fuzzy ability,the proposed algorithm exploits the fuzzy theory to get a better capability for dealing with anti-noise  and uncertain problems. Clustering experiments on four UCI data sets validate the effectiveness of our algorithm.
Keywords:clustering  information gain  fuzzy K-prototypes  mixed data
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号