首页 | 官方网站   微博 | 高级检索  
     

一种分类数据的聚类算法
引用本文:谢坤武,陈世强.一种分类数据的聚类算法[J].计算机研究与发展,2006,43(Z3).
作者姓名:谢坤武  陈世强
摘    要:现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.

关 键 词:数据开采  聚类算法  分类数据

A Clustering Algorithm for Categorical Data
Xie Kunwu,Chen Shiqiang.A Clustering Algorithm for Categorical Data[J].Journal of Computer Research and Development,2006,43(Z3).
Authors:Xie Kunwu  Chen Shiqiang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号