首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

2.
针对目前谱聚类算法的相似图包含较多错误社区信息的问题,引入了概率矩阵的概念,提出了一种改进的谱聚类社区发现算法。该算法首先利用马尔可夫过程计算节点间的转移概率,并基于转移概率构建复杂网络的概率矩阵;然后以均值概率矩阵重新构造相似图;最后通过优化归一化切割函数实现社区划分。采用人工网络和现实网络与其他典型算法进行对比实验,实验结果表明,该算法能够更加精准地划分社区,具有更加良好的聚类性能。  相似文献   

3.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

4.
自适应谱聚类算法研究   总被引:4,自引:0,他引:4  
谱聚类能识别出在原空间中线性不可分的聚类, 且其效果优于传统聚类算法.谱聚类要想获得好的效果必须选择一个合适的尺度参数,本文在传统谱聚类算法的基础上引入类似核选取的技巧,提出了一个能自动选取该尺度参数的自适应谱聚类算法.将该算法和现有的谱聚类参数选择算法作了比较,在人工数据集和UCI数据集上的实验表明,自适应谱聚类算法在很多情况下优于其它参数选择算法.  相似文献   

5.
大规模数据集的多层聚类算法   总被引:1,自引:0,他引:1  
针对大多谱聚类算法由于计算复杂度高而不适于大规模数据的问题,提出了一种能处理大规模数据集的多层算法。该算法把海量数据根据一定的相关性逐级分组成小数据集,再对分组后的小数据集用谱聚类算法进行聚类,最后利用权核K均值聚类逐级微调,完成全部数据的聚类。通过对UCI数据库中的数据集和图像分割的仿真实验,结果表明该算法的聚类效果很好。  相似文献   

6.
针对谱聚类算法对图像分割效果差强人意的特点,研究了一种改进的Nystrm算法进行谱聚类图像分割,使谱聚类算法应用于图像分割的效果有所改善。该算法首先对图像进行预处理,变换图像的分布数据空间,再分别计算对选定样本空间的数据间以及样本与其他空间的数据间的距离矩阵,并转化为相似矩阵;然后对相似矩阵正交化并且特征分解,进行K-Means聚类;最后将聚类结果进行后期处理。通过实验验证了该算法的有效性。  相似文献   

7.
传统K-means聚类算法的性能依赖于初始聚类中心的选择。本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的个节点作为聚类的初始聚类中心,然后进行聚类迭代过程。实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量。  相似文献   

8.
提出融入无监督聚类的地震易损性分析方法-将隶属度矩阵的近似正交约束与谱聚类相结合的平衡化谱聚类算法.该算法基于图Laplacian矩阵的重表示矩阵,从给定的所有地震记录中筛选出具有代表性的样本子集,缓解由所选地震动强度指标过多引起的“维数灾难”问题;并通过隶属度矩阵的近似正交约束,解决应用传统谱聚类算法筛选地震波时产生的“均匀效应”问题.以实际工程为例,开展以“拱坝-地基结构”为整体体系的地震易损性研究,分别建立以15条规范反应谱样本、109条整体样本为参照基准的地震易损性模型进行聚类算法效果验证.结果表明,聚类算法筛选的样本与整体样本的地震易损性结果接近,在损伤体积比、坝顶位移、横缝最大开度性能指标下,两者易损性概率最大误差分别为4.39%、3.84%、6.64%,误差不超过5%的最小概率分别为92.24%、99.19%、81.75%,表明该算法在筛选典型地震样本方面的有效性.  相似文献   

9.
在图像分割中谱聚类算法需要计算像素之间的相似度矩阵,构造数据量大,并且要对拉普拉斯矩阵进行特征分解,计算比较耗时。针对这一问题,提出了一种基于稀疏矩阵的谱聚类图像分割算法。算法结合图像特征信息在不同尺度上对谱聚类进行误差分析,设计了一种新的样本信息选取方案,并利用选取的图像信息直接创建稀疏相似度矩阵。理论分析以及图像分割实验结果表明,该算法能够有效降低谱聚类的计算复杂度,同时,提高了分割的准确性和鲁棒性。  相似文献   

10.
针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越.  相似文献   

11.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

12.
聚类分析的一个重要应用就是图像识别,谱聚类因为比传统的聚类方法更高效而迅速被广泛运用到图像处理中。谱聚类算法其中一个重要的步骤是构造一个合适的相似矩阵,本文提出一种基于共享近邻重要性的自适应谱聚类算法且应用到数字手写图像识别中,与自适应谱聚类算法做比较试验,表明谱聚类算法能取得较好的识别结果。  相似文献   

13.
作为数据挖掘的一项重要技术,聚类分析具有广泛的应用领域.同时,聚类也是数据挖掘领域中一个相对比较困难的问题.在聚类算法中,基于模糊划分的FCM算法是一种重要的算法.和其它的算法相比,FCM算法具有计算简单、运算速度快,且有比较直观的几何意义的优点,因此在图像处理、模式识别等领域得到了广泛的应用.和所有的c均值算法一样,FCM算法也是只用类中心来表示类,这样只是适合球状类型的簇.本文在目前FCM算法研究的基础上,讨论了传统FCM算法在原型初始化上的局限性.提出一种基于层次凝聚的改进算法,使之能够适用于不规则分布的数据.  相似文献   

14.
在无先验知识的前提下,复杂网络聚簇需确定簇数并精确地将节点分配到其所属簇,而大部分传统聚簇方法无法自动确定簇数。为解决这一问题,结合GEP和信息论聚类框架,提出了复杂网络自动聚簇算法——AutoC-NC-GEP。算法为复杂网络聚簇建立了GEP结构模型,设计了有效的遗传算子,提出了"不完全聚簇划分"概念,并分别以Map Eqation和Modularity两种不同的网络社团结构量化函数为适应度函数,使用真实网络对算法的聚簇性能进行了测试。实验结果表明,在没有先验知识的前提下,AutoCNC-GEP算法不仅能正确解析网络的社团数量,还可以自动将节点精确地分配到其所属社团中,从而获得网络的最佳社团结构。  相似文献   

15.
为了在高维数据流中有效地形成聚类,针对经典算法CELL-Tree存在的问题,提出一种新的概要数据结构PL-Tree以及基于此数据结构的算法PLStream,并采取衰减窗口模式来适应数据流的变化,采用剪枝策略控制内存中聚类模型的规模.实验表明,PLStream算法能较好地适应高维数据流,比CELL/Tre算法具有更好的时...  相似文献   

16.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

17.
With the rapid development of WLAN (Wireless Local Area Network) technology, an important target of indoor positioning systems is to improve the positioning accuracy while reducing the online computation. In this paper, it proposes a novel fingerprint positioning algorithm known as semi-supervised affinity propagation clustering based on distance function constraints. We show that by employing affinity propagation techniques, it is able to use a fractional labeled data to adjust similarity matrix of signal space to cluster reference points with high accuracy. The semi-supervised APC uses a combination of machine learning, clustering analysis and fingerprinting algorithm. By collecting data and testing our algorithm in a realistic indoor WLAN environment, the experimental results indicate that the proposed algorithm can improve positioning accuracy while reduce the online localization computation, as compared with the widely used K nearest neighbor and maximum likelihood estimation algorithms.  相似文献   

18.
基于最近邻优先的高效聚类算法   总被引:12,自引:1,他引:12  
针对高维空间中任意形状的多层次聚类问题,基于“同类相近”的思想,提出并实现了最近邻优先吸收聚类算法NNAF算法。证明了最近邻点搜索定理,基于这一定理又提出了SNN(Searching Nearest Neighbors)算法和GSNN(Grid-based Searching Nearest Neighbors)算法,其时间复杂度为O(n*log(n)),当用扫描图像所得数据时,时间复杂度会降为O(n);而使用传统的搜索算法,时间复杂度为O(n^2);提出了实现任意形状高维空间聚类的NNAF算法,时间复杂度为O(n);提出了MLCA(Multi-layer Cluster Algorithm)算法并证明了两个相关的定理,在改变阈值后重新聚类时,使用MLCA算法可以节省90%以上的时间。实验结果显示,以上算法适应于任意形状的高维空间数据的聚类,可以有效过滤噪声数据,且用户需要的先验知识少、可快速获得各种层次的聚类结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号