首页 | 官方网站   微博 | 高级检索  
     

大规模数据集谱聚类并行优化算法
引用本文:郝笑弘,尹青山.大规模数据集谱聚类并行优化算法[J].机械设计与制造,2021,368(10):211-214.
作者姓名:郝笑弘  尹青山
作者单位:山西水利职业技术学院,山西太原030032;吉林大学软件学院,吉林长春130012
摘    要:为解决传统谱聚类算法在应用于大规模数据上时,复杂度较高且资源占用较大,导致算法聚类效果不好甚至无法聚类的问题,提出基于并行框架和采样相结合的改进谱聚类算法,算法在自适应相似矩阵计算基础上,通过数据分块和单向节点并行,提高算法相似矩阵的计算效率,通过Nystr(o)m加权抽样逼近,减少拉普拉斯矩阵特征向量的计算复杂度,最后通过KD树结构避免k-mean聚类过程的距离计算,从而提高了聚类效率.仿真实验结果表明,文中算法在取得与传统算法相近的聚类性能的同时,取得更好的加速比,验证了算法对大规模集的良好适应性.

关 键 词:大规模谱聚类  自适应相似矩阵计算  单向节点并行  Nystr(o)m加权抽样  KD树优化

Spark Parallel Optimization Large-scale Spectral Clustering Algorithm
HAO Xiao-hong,YIN Qing-shan.Spark Parallel Optimization Large-scale Spectral Clustering Algorithm[J].Machinery Design & Manufacture,2021,368(10):211-214.
Authors:HAO Xiao-hong  YIN Qing-shan
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号