首页 | 官方网站   微博 | 高级检索  
     

一种基于CSA的混和属性特征大数据集聚类算法
引用本文:李洁,高新波,焦李成.一种基于CSA的混和属性特征大数据集聚类算法[J].电子学报,2004,32(3):357-362.
作者姓名:李洁  高新波  焦李成
作者单位:西安电子科技大学 电子工程学院,陕西西安 710071
基金项目:国家自然科学基金,国家高技术研究发展计划(863计划)
摘    要:在数据挖掘中,我们经常会遇到和分析大量具有数值和类属特征的数据.然而,现有的大多数分类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性的数据.为此,本文提出一种基于克隆选择的模糊聚类新算法,通过改进距离测度函数将数值特征与类属特征相结合,从而实现具有混合属性特征数据的聚类分析;通过引入克隆选择算法(CSA)实现目标函数的全局优化.由于克隆算子能够将进化搜索与随机搜索、全局搜索和局部搜索相结合,因而通过对候选解进行克隆算子操作,能够快速得到全局最优解.实验结果表明,基于CSA的模糊聚类新算法对于处理具有混和特征的大数据集聚类问题是相当有效的.

关 键 词:聚类分析  数值特征  类属特征  克隆选择算法  
文章编号:0372-2112(2004)03-0357-06
收稿时间:2003-04-14

A CSA-Based Clustering Algorithm for Large Data Sets with Mixed Numeric and Categorical Values
LI Jie,GAO Xin-bo,JIAO Li-cheng.A CSA-Based Clustering Algorithm for Large Data Sets with Mixed Numeric and Categorical Values[J].Acta Electronica Sinica,2004,32(3):357-362.
Authors:LI Jie  GAO Xin-bo  JIAO Li-cheng
Affiliation:School of Electronic Engineering,Xidian Univ ,Xi'an,Shaanxi 710071,China
Abstract:In the field of data mining,it is often encountered to perform cluster analysis on large data sets with mixed numeric and categorical values.However,most existing clustering algorithms are only efficient for the numeric data rather than the mixed data set.For this purpose,this paper presents a novel clustering algorithm for these mixed data sets by modifying the common cost function,trace of the within cluster dispersion matrix.The clonal selection algorithm (CSA) is used to optimize the new cost function,since the clonal operator can combine the evolutionary search and random search,and incorporate the global search with local search,by the clonal operation on candidate solutions;the new algorithm can quickly obtain the global optimum.Experimental result illustrates that the CSA-based new clustering algorithm is feasible for the large data sets with mixed numeric and categorical values.
Keywords:cluster analysis  numeric data  categorical data  clonal selection algorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号