分布式k-means聚类算法的改进 Optimization of k-means clustering algorithm in hadoop distributed computing framework期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

分布式k-means聚类算法的改进

引用本文：	宋玲,戚云枫,齐东阳.分布式k-means聚类算法的改进[J].广西大学学报(自然科学版),2014(5).

作者姓名：	宋玲戚云枫齐东阳

作者单位：	广西大学计算机与电子信息学院,广西南宁,530004

基金项目：	广西自然科学基金资助项目

摘要：	经典的分布式k-means聚类算法随机选取初始聚类中心，进行多次的迭代，容易使得聚类效率低，网络通信量大，而且聚类结果不稳定。针对这些问题，提出一种改进的分布式k-means聚类算法。该算法通过划分数据集，计算属性最密集的k个数据块作为聚类中心，以确保聚类中心的代表性，进而减少算法的迭代计算次数，提高聚类效率。通过在Hadoop分布式平台上进行实验，结果表明改进算法能减少迭代次数和收敛时间。
关键词：	k-means聚类分布式算法 MapReduce计算模型聚类中心
Optimization of k-means clustering algorithm in hadoop distributed computing framework

SONG Ling,QI Yun-feng,QI Dong-yang.Optimization of k-means clustering algorithm in hadoop distributed computing framework[J].Journal of Guangxi University(Natural Science Edition),2014(5).

Authors:	SONG Ling QI Yun-feng QI Dong-yang

Abstract:

Keywords:	k-means clustering distributed algorithm MapReduce model clustering center
本文献已被万方数据等数据库收录！