首页 | 官方网站   微博 | 高级检索  
     

面向海量数据的K-means聚类优化算法
引用本文:冀素琴,石洪波.面向海量数据的K-means聚类优化算法[J].计算机工程与应用,2014(14):143-147.
作者姓名:冀素琴  石洪波
摘    要:针对集中式系统框架难以进行海量数据聚类分析的问题,提出基于MapReduce的K-means聚类优化算法。该算法运用MapReduce并行编程框架,引入Canopy聚类,优化K-means算法初始中心的选取,改进迭代过程中通信和计算模式。实验结果表明该算法能够有效地改善聚类质量,具有较高的执行效率以及优良的扩展性,适合用于海量数据的聚类分析。

关 键 词:海量数据  聚类  MapReduce  K-means算法  Canopy算法
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号