首页 | 官方网站   微博 | 高级检索  
     

K-means型多视图聚类中的初始化问题研究
引用本文:洪敏,贾彩燕,王晓阳.K-means型多视图聚类中的初始化问题研究[J].计算机科学与探索,2019,13(4):574-585.
作者姓名:洪敏  贾彩燕  王晓阳
作者单位:北京交通大学 计算机与信息技术学院,北京 100044;交通数据分析与挖掘北京市重点实验室,北京 100044;北京交通大学 计算机与信息技术学院,北京 100044;交通数据分析与挖掘北京市重点实验室,北京 100044;北京交通大学 计算机与信息技术学院,北京 100044;交通数据分析与挖掘北京市重点实验室,北京 100044
基金项目:The General Program of the National Natural Science Foundation of China under Grant Nos. 61473030, 61632004;the Fundamental Research Funds for the Central Universities of China under Grant
摘    要:在K-means型多视图聚类算法中,最终的聚类结果会受到初始类中心的影响。因此研究了不同的初始中心选择方法对K-means型多视图聚类算法的影响,并提出一种基于采样的主动式初始中心选择方法(sampledclustering by fast search and find of density peaks,SDPC)。该方法通过对数据集进行均匀采样,利用密度峰值快速搜索聚类算法(clustering by fast search and find of density peaks,DPC),以及K-means再迭代策略,进一步改善多视图聚类中的初始中心选择效率和类个数问题。实验验证了不同初始化方法对K-means型多视图聚类算法的影响。多视图基准数据集上的实验结果表明:全局(核)K-means初始化方法存在时间复杂度过高的问题,AFKMC~2(assumption-free K-Markov chain Monte Carlo)初始化适用于大规模数据,DPC可以主动选择类个数和初始类中心,SDPC较DPC而言,不仅能主动式获得类个数,还在聚类精度和效率上取得了较好的折衷。

关 键 词:多视图  类初始化  聚类

Research on Initialization of K-means Type Multi-View Clustering
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号