面向海量数据的K-means聚类优化算法 |
| |
引用本文: | 冀素琴,石洪波.面向海量数据的K-means聚类优化算法[J].计算机工程与应用,2014(14):143-147. |
| |
作者姓名: | 冀素琴 石洪波 |
| |
摘 要: | 针对集中式系统框架难以进行海量数据聚类分析的问题,提出基于MapReduce的K-means聚类优化算法。该算法运用MapReduce并行编程框架,引入Canopy聚类,优化K-means算法初始中心的选取,改进迭代过程中通信和计算模式。实验结果表明该算法能够有效地改善聚类质量,具有较高的执行效率以及优良的扩展性,适合用于海量数据的聚类分析。
|
关 键 词: | 海量数据 聚类 MapReduce K-means算法 Canopy算法 |
本文献已被 CNKI 等数据库收录! |
|