共查询到19条相似文献,搜索用时 109 毫秒
1.
2.
模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始类中心非常敏感易导致一致性聚类.可能性模糊C-均值聚类(PFCM)综合了FCM和PCM算法并且克服了这些缺点.但是PFCM必须先运行FCM来计算参数.提出一种新的PCM算法,新的PCM算法利用协方差矩阵来计算参数衡量了数据集的紧凑程度且无须先运行FCM,在新的PCM和FCM基础上提出了新PFCM算法,该算法无须事先运行FCM以计算参数,减少了算法运算时间.对数据集的测试实验结果表明了提出的新算法能同时产生模糊隶属度和典型值,减少聚类时间,同时具有更好的分类准确率. 相似文献
3.
4.
本文首先介绍了模糊C均值聚类算法及其不足。在模糊C均值聚类算法的基础上,结合有效性函数,提出了一种自动聚类算法——自适应的模糊C均值聚类算法,并建立了自适应的模糊C均值聚类算法的研究模型。最后,对改进算法用MATLAB进行编程实现,并通过多组数据集进行实验测试,对产生的多种实验结果进行分析,验证自适应的模糊C均值聚类算法可以实现自动类别数的判定。 相似文献
5.
6.
模糊C均值聚类(FCM)算法是一种基于非监督聚类算法。样本加权模糊C均值聚类(WFCM)算法是FCM算法的改进,该算法能够明显提高收敛速度和聚类的准确性。无论是FCM算法还是WFCM算法,对噪声都相对敏感,而且聚类数目仍然需要人工确定。在此提出一种改进算法,首先通过偏微分方程(PDE)降噪算法对原始脑MRI医学图像进行处理;其次利用聚类有效性确定最佳聚类数目,对WFCM算法进行改进;最后利用本文改进算法对图像进行聚类分割。实验表明,该方法是一种具有自动分类能力、抗噪性较好的模糊聚类图像分割算法。 相似文献
7.
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。 相似文献
8.
9.
10.
针对传统串行聚类集成算法在处理高维海量数据时效率低下的问题,提出基于Spark的并行聚类集成算法SCEA(Spark based Clustering Ensemble Algorithm).首先,通过主成分分析与成对约束结合的方法对算法输入数据进行预处理,达到数据降维并去除特征相关性的目的;其次,通过调用不同聚类算法获得基聚类成员后,采用三元组方法通过基聚类成员的簇标签构造出相似度矩阵,并调用层次聚类算法得到最终的聚类结果;最后,在调用MLlib中已有聚类算法的基础上,基于Scala对SCEA算法进行了实现.将SCEA与同类算法在多组数据集下进行对比测试,实验结果表明:总体上SCEA不仅较已有算法在准确率方面有所提高,并且通过分析运行时间、加速比以及可扩展性3个性能指标,证明了SCEA在算法性能上的优越性. 相似文献
11.
12.
13.
Shih-Ming Pan Kuo-Sheng Cheng 《IEEE transactions on systems, man and cybernetics. Part C, Applications and reviews》2007,37(5):827-838
Traditional clustering algorithms (e.g., the K-means algorithm and its variants) are used only for a fixed number of clusters. However, in many clustering applications, the actual number of clusters is unknown beforehand. The general solution to this type of a clustering problem is that one selects or defines a cluster validity index and performs a traditional clustering algorithm for all possible numbers of clusters in sequence to find the clustering with the best cluster validity. This is tedious and time-consuming work. To easily and effectively determine the optimal number of clusters and, at the same time, construct the clusters with good validity, we propose a framework of automatic clustering algorithms (called ETSAs) that do not require users to give each possible value of required parameters (including the number of clusters). ETSAs treat the number of clusters as a variable, and evolve it to an optimal number. Through experiments conducted on nine test data sets, we compared the ETSA with five traditional clustering algorithms. We demonstrate the superiority of the ETSA in finding the correct number of clusters while constructing clusters with good validity. 相似文献
14.
15.
传统的用于Web日志聚类的算法大都需要用户指定聚类个数。提出了一种新的自适应聚类算法并对Web日志用户会话进行聚类。该算法基于凝聚聚类思想和划分聚类思想,用初始数据集中每2个会话之间的相异度作为距离的度量,合并距离小于一定阈值的两个会话以产生初始聚类,再根据一定的规则动态地合并距离最小的会话类或会话,算法的结果是产生自然的聚类。最后,通过比较会话聚类的内部距离和类间距离来验证算法的有效性。这种聚类算法的最大优点在于,他能够产生自动的聚类,而不需要用户事先指定需要产生的聚类个数,并且能有效识别孤立点。实验表明,这种聚类能够产生较高质量的聚类效果。 相似文献
16.
与经典的K均值聚类算法相比,模糊C均值(FCM)聚类算法通过引入模糊因子,考虑不同聚类数据簇之间的相互关系,得到可分性更好的聚类结果。但是模糊因子的引入,使得任意一个样本点都存在模糊性,造成FCM极易受到噪声和离群点的影响,聚类结果泛化性能较差。因此,该文提出一种簇间可分的鲁棒FCM算法(RBI-FCM)。RBI-FCM利用K均值算法对模糊隶属度的稀疏特征,降低不同数据簇之间的相互作用,突出不同数据簇相邻区域的可分性;另外,RBI-FCM在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,可提高聚类模型的泛化性能。该文设计了有效的模型求解迭代算法。实验结果表明,RBI-FCM算法提高了FCM的鲁棒性,有效降低FCM对数据簇分布差异性和抽样不均衡的敏感性,得到理想的聚类结果。 相似文献
17.
粒子群优化(Particle Swarm Optimization,PSO)算法在复杂多峰函数可行域空间搜索时极易陷入局部极值点.研究表明改变种群拓扑结构和调整算法参数有助于改善种群的多样性,但是目前研究中少有同时考虑种群全局拓扑结构和局部粒子个体能力.本文提出一种具有异构分簇特性的自适应PSO算法.该算法采用K-均值聚类算法对种群进行动态分簇,形成多异构子群,并采用Ring型拓扑结构进行子群间信息流通.而后采用基于寻解水平评价的粒子自适应参数调整策略进行个体调整.通过实验分析表明该算法能够提高粒子群优化的种群的多样性、粒子活性、搜索能力和收敛性能,同时也降低了算法对参数初值的依赖性. 相似文献
18.
聚类作为一种重要的图像分割方法得到了大量研究,提出了一种新的结合稀疏编码的红外图像聚类分割算法,扩展了传统的基于K-means聚类的图像分割方法。结合稀疏编码的聚类算法能有效融合图像的局部信息,而且易于利用像素之间的内在相关性,但是对于分割会出现过分割和像素难以归类的问题。为此,在字典的学习过程中,将原子的聚类算法引入其中,有助于缩减字典中原子所属类别的数目防止出现过分割;同时将稀疏编码系数同原子对聚类中心的隶属程度相结合来判断像素所属的类别。这种处理方式能更好地实现利用像素的内在相关性进行聚类分割,并在其中自然引入了局部空间信息,达到更好分离目标区域和背景区域的目的。实验结果表明,结合稀疏编码的K-means聚类分割算法能更好的实现复杂背景下红外图像重要区域的准确分割提取。 相似文献