首页 | 官方网站   微博 | 高级检索  
     

基于数据预处理的并行分层聚类算法*
引用本文:李朝鹏,李肯立,成运,李朝健.基于数据预处理的并行分层聚类算法*[J].计算机应用研究,2010,27(1):71-73.
作者姓名:李朝鹏  李肯立  成运  李朝健
作者单位:1. 湖南人文科技学院,湖南,娄底,417000
2. 湖南大学,计算机与通讯学院,长沙,410082
3. 湖南工程学院,湖南,湘潭,411101
基金项目:国家自然科学基金资助项目(90715029);湖南省自然科学基金资助项目(07JJ6116);湖南省重点建设学科资助项目;湖南省教育厅项目(09C546)
摘    要:分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一。针对目前基于SIMD模型的并行分层聚类算法处理海量数据时效果不理想的问题,提出一种基于数据预处理的自适应并行分层聚类算法,在O((λn)2/p)的时间内对n个输入数据点进行聚类。其中1≤p≤n/log n,0.1≤λ≤0.3。将提出的算法与现有文献结论进行的性能对比分析表明,本算法明显改进了现有文献的研究结果。

关 键 词:分层聚类    并行算法    预处理数据

Parallel hierarchical clustering algorithm based on preprocessed data
LI Zhao-peng,LI Ken-li,CHENG Yun,LI Zhao-jian.Parallel hierarchical clustering algorithm based on preprocessed data[J].Application Research of Computers,2010,27(1):71-73.
Authors:LI Zhao-peng  LI Ken-li  CHENG Yun  LI Zhao-jian
Affiliation:(1. Hunan University of Humanities, Science & Technology, Loudi Hunan 417000, China; 2.School of Computer & Communication, Hunan University, Changsha 410082, China; 3.Hunan Institute of Engineering, Xiangtan Hunan 411101, China)
Abstract:Hierarchial clustering technology plays a very important role in image processing, intrusion detection and bioinformatics applications, which is one of the most extensively studied branch in data mining. Presently the parallel hierarchical algorithms aren't very good at processing large data. To overcome this shortcoming, this paper proposed a new parallel algorithm based on preprocessed data. The proposed algorithms could cluster n objects with O(p) processors in O((λn)~2/p) time, where 1≤p≤n/log n,0.1≤λ≤0.3. Performance comparisons show that it is the first parallel hierarchical clustering algorithm without memory conflicts, and thus it is an improved result over the past researches.
Keywords:hierarchical clustering  parallel algorithms  preprocessed data
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号