大规模数据集谱聚类并行优化算法 Spark Parallel Optimization Large-scale Spectral Clustering Algorithm期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

大规模数据集谱聚类并行优化算法

引用本文：	郝笑弘,尹青山.大规模数据集谱聚类并行优化算法[J].机械设计与制造,2021,368(10):211-214.

作者姓名：	郝笑弘尹青山

作者单位：	山西水利职业技术学院,山西太原030032;吉林大学软件学院,吉林长春130012

摘要：	为解决传统谱聚类算法在应用于大规模数据上时,复杂度较高且资源占用较大,导致算法聚类效果不好甚至无法聚类的问题,提出基于并行框架和采样相结合的改进谱聚类算法,算法在自适应相似矩阵计算基础上,通过数据分块和单向节点并行,提高算法相似矩阵的计算效率,通过Nystr(o)m加权抽样逼近,减少拉普拉斯矩阵特征向量的计算复杂度,最后通过KD树结构避免k-mean聚类过程的距离计算,从而提高了聚类效率.仿真实验结果表明,文中算法在取得与传统算法相近的聚类性能的同时,取得更好的加速比,验证了算法对大规模集的良好适应性.
关键词：	大规模谱聚类自适应相似矩阵计算单向节点并行 Nystr(o)m加权抽样 KD树优化
Spark Parallel Optimization Large-scale Spectral Clustering Algorithm

HAO Xiao-hong,YIN Qing-shan.Spark Parallel Optimization Large-scale Spectral Clustering Algorithm[J].Machinery Design & Manufacture,2021,368(10):211-214.

Authors:	HAO Xiao-hong YIN Qing-shan

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏