首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 501 毫秒
1.
自适应谱聚类算法研究   总被引:4,自引:0,他引:4  
谱聚类能识别出在原空间中线性不可分的聚类, 且其效果优于传统聚类算法.谱聚类要想获得好的效果必须选择一个合适的尺度参数,本文在传统谱聚类算法的基础上引入类似核选取的技巧,提出了一个能自动选取该尺度参数的自适应谱聚类算法.将该算法和现有的谱聚类参数选择算法作了比较,在人工数据集和UCI数据集上的实验表明,自适应谱聚类算法在很多情况下优于其它参数选择算法.  相似文献   

2.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

3.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

4.
针对基于核的多视图聚类算法(kernel based multi-view clustering method, MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means, IMVCKM)。通过将数据集分块,在每个数据块中使用MVKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。  相似文献   

5.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

6.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

7.
AP聚类算法是Frey和Dueck在2007年提出的一个先进的聚类方法.该算法具有较传统聚类算法更好的聚类性能,已被成功地应用于计算机科学的研究领域.为了获得高质量的聚类集,原始AP算法的迭代是在全部数据点之间交流信息,直到收敛.由于这种算法在计算数据时需要占用二次CPU时间,不适用于大规模的数据集,因此,本文在AP算法的基础上提出了一种有效的聚类算法.该算法在迭代时可修剪不必要的信息,且在计算消息收敛的同时确定迭代集群,并对算法进行了实验,证明算法是有效的.  相似文献   

8.
针对子空间聚类算法中相似性学习和谱聚类相互分离的问题,提出自适应图正则的单步子空间聚类(one-step subspace clustering with adaptive graph regularization, OSCAGR)算法。利用Frobenius范数鼓励分组效应,根据局部连通性为每个数据点分配自适应的最优邻域学习系数矩阵;考虑全局结构和局部结构,保证数据空间中相近的点拥有较大的表示系数;通过量化范数将子空间聚类两个独立的阶段整合到一个统一的优化框架中。试验结果表明,OSCAGR算法在UCI数据集和3个图像数据集上比其他对比方法的精度高1%~7%,OSCAGR算法的聚类正确率和归一化互信息优于其他对比方法。  相似文献   

9.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

10.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

11.
针对传统聚类算法在对复杂密集型数据集聚类时不能取得较好聚类结果的问题,利用进化聚类算法对复杂密集型数据集进行聚类,提出一种基于蚁群系统的聚类算法(clustering algorithm based on ant colony system,CAACS),利用蚂蚁在行进路径中释放信息素且追求浓信息素的原理来实现蚂蚁的随机搜索,并引入近邻函数值的概念来确定样本数据之间的相似性,通过蚂蚁在行走过程中不断建立样本数据之间的最相似连接来形成各个子连通图,各个子连通图中的样本数据构成一个类。实验采用随机产生的不规则数据集以及一系列合成的数据集将CAACS算法与DBSCAN算法(density-based spatial clustering of application with noise)及面向非规则非致密空间分布数据的蚁群聚类方法进行比较。实验结果表明CAACS算法对复杂密集型数据集能达到较好的聚类结果。  相似文献   

12.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷, 提出基于进化思想的聚类算法及其类簇融合算法, 该算法将K均值聚类算法嵌入进化聚类算法框架中, 通过调整距离倍参, 将数据逐渐划分, 在此过程中自动确定类簇数目, 提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法, 将相似度大的类簇进行融合, 使得k值逐渐趋向真实值. 实验表明, 该方法具有良好的实用性.  相似文献   

13.
聚类分析的一个重要应用就是图像识别,谱聚类因为比传统的聚类方法更高效而迅速被广泛运用到图像处理中。谱聚类算法其中一个重要的步骤是构造一个合适的相似矩阵,本文提出一种基于共享近邻重要性的自适应谱聚类算法且应用到数字手写图像识别中,与自适应谱聚类算法做比较试验,表明谱聚类算法能取得较好的识别结果。  相似文献   

14.
随着文本数据的快速积累,文本自动分析成为管理和利用海量文本数据的重要手段。其中,文本聚类是文本分析的基本任务之一。本文着重介绍文本分析与谱聚类的研究进展,阐述目前在文本分析中应用谱聚类技术的主要方法,旨在为文本分析中谱聚类方法的应用提供引导作用。  相似文献   

15.
针对单一聚类算法存在的不能泛化的问题,将集成学习技术应用于聚类算法中,集成学习技术可以显著提高学习系统的泛化能力。提出了1种基于粒子群和遗传算法的协同进化聚类集成算法,粒子群算法保证算法快速收敛,遗传算法全局搜索扩大搜索范围,提高了聚类的性能和收敛速度。将本研究提出的算法在多个UCI数据集上进行试验验证,结果表明该算法是有效的。  相似文献   

16.
混合属性数据聚类的新方法   总被引:1,自引:0,他引:1  
提出了一种数值型和类别型混合属性数据聚类的全局算法。算法通过随机选取足够多的初始原型来覆盖数据集的全局分布信息,然后通过评估函数迭代地消去多余的原型。最后对本文算法进行了验证,证明了该算法的有效性和收敛性。并与其他已有同类型算法的聚类结果进行比较,说明本文算法对混合属性数据具有更高的聚类准确度,为解决混合型数据聚类问题提供了一种新途径。  相似文献   

17.
讨论聚类分析中的一个主要问题,即可能出现的结构性属性加权,提出了加权的不同措施用于实体的一种新算法,这种算法允许使用k-means-type来有效聚集大的数据集。并通过人造的和真实的2种实验数据论证这种优化算法,提供了一种找出每一个类聚中每一个属性权值的新算法。  相似文献   

18.
为提高人脸数据集生成的准确率和效率,提出了一种将人脸跟踪与人脸聚类相结合的人脸数据集生成方法.首先,对KCF算法进行改进,并将改进的KCF算法用于人脸跟踪,得到不同时间片段的人脸图像集; 其次,从每个人脸图像集中通过人脸图像优选算法选出高质量的人脸图像; 再次,将优选出来的人脸图像进行人脸聚类,以完成视频中每个人的人脸数据集的生成; 最后,通过实验对比基于人脸跟踪、基于人脸聚类和基于本文方法的人脸数据集生成效果.实验结果表明,本文方法与基于人脸跟踪的人脸数据集生成方法相比,纯度提升约15%; 与基于人脸聚类的人脸数据集生成方法相比,效率提升约50%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号