首页 | 官方网站   微博 | 高级检索  
     

层次聚类算法的改进及分析
引用本文:郭晓娟,刘晓霞,李晓玲.层次聚类算法的改进及分析[J].计算机应用与软件,2008,25(6):243-245.
作者姓名:郭晓娟  刘晓霞  李晓玲
作者单位:1. 西北大学,陕西,西安,710127
2. 中国地质大学,湖北,武汉,430074
摘    要:层次凝聚算法是一个非常有用的聚类算法,它在迭代地凝聚每次接近对直到所有的数据都属于同一个簇.但层次聚类也存在着几个缺点,如聚类时的时空复杂性高;聚类的簇效率低、误差较大等.经验研究表明,大部分HAC算法都有这样一个趋势:除了在谱系图的顶层,所有低层聚类的簇都是比较小的并且很接近于其他的簇,提出了一种改进算法能够减小时空复杂性并能验证其正确性,分析与实验都证明这种方法是非常有效的.

关 键 词:聚类  层次聚类  谱系图    POP
修稿时间:2006年7月21日

ON IMPROVEMENT AND ANALYSIS OF HIERARCHICAL CLUSTERING ALGORITHM
Guo Xiaojuan,Liu Xiaoxia,Li Xiaoling.ON IMPROVEMENT AND ANALYSIS OF HIERARCHICAL CLUSTERING ALGORITHM[J].Computer Applications and Software,2008,25(6):243-245.
Authors:Guo Xiaojuan  Liu Xiaoxia  Li Xiaoling
Affiliation:Guo Xiaojuan1 Liu Xiaoxia1 Li Xiaoling21(Northwest University,Xi'an 710127,Shaanxi,China)2(China University of Geosciences,Wuhan 430074,Hubei,China)
Abstract:A prominent and useful class of algorithm is hierarchical agglomerative clustering(HAC)which iteratively agglomerates the closest pare until all data points belong to one cluster.However,HAC methods have several drawbacks,such as high time and memory complexities when clustering,insufficient and inaccurate cluster validation,etc.Empirical study shows that most HAC algorithms follow a trend where,except for a number of top levels of the dendrogram,all lower level agglomerate clusters are very small in size a...
Keywords:Clustering HAC Dendrogram Cluster POP  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号