首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
针对K-均值算法需要事先确定聚类的数目,无法适用于未知雷达信号分选的问题,通过引入脉冲间欧几里德距离和距离阈值TMS2812,完成聚类数目和聚类中心的自动选取,给出一个K-均值的改进算法,改进后的算法既收敛速度快,易于工程化实现,又可自动确定聚类数目和聚类中心。仿真实验表明,该改进算法提高了K-均值算法的适用范围,能够有效适应于未知雷达信号的分选。  相似文献   

2.
可能性模糊C-均值聚类新算法   总被引:17,自引:4,他引:13       下载免费PDF全文
模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始类中心非常敏感易导致一致性聚类.可能性模糊C-均值聚类(PFCM)综合了FCM和PCM算法并且克服了这些缺点.但是PFCM必须先运行FCM来计算参数.提出一种新的PCM算法,新的PCM算法利用协方差矩阵来计算参数衡量了数据集的紧凑程度且无须先运行FCM,在新的PCM和FCM基础上提出了新PFCM算法,该算法无须事先运行FCM以计算参数,减少了算法运算时间.对数据集的测试实验结果表明了提出的新算法能同时产生模糊隶属度和典型值,减少聚类时间,同时具有更好的分类准确率.  相似文献   

3.
K均值聚类算法是一种常见且有效的基于划分的聚类算法。为解决该聚类算法对初始中心敏感的问题,常用的方法是层次化初始聚类中心。然而,层次初始的聚类算法仍然需要将聚类个数作为输入参数,在高维数据和海量数据中不易应用。基于能够自动确定聚类数目的目的,采用DBI度量,提出一种层次初始的聚类个数自适应的聚类方法(简称DHIKM)。通过UCI数据集和仿真数据上的实验,证明DHIKM可以在采样数据中快速找到合适的聚类个数,实验结果表明该算法在聚类质量与收敛速度上的有效性。  相似文献   

4.
本文首先介绍了模糊C均值聚类算法及其不足。在模糊C均值聚类算法的基础上,结合有效性函数,提出了一种自动聚类算法——自适应的模糊C均值聚类算法,并建立了自适应的模糊C均值聚类算法的研究模型。最后,对改进算法用MATLAB进行编程实现,并通过多组数据集进行实验测试,对产生的多种实验结果进行分析,验证自适应的模糊C均值聚类算法可以实现自动类别数的判定。  相似文献   

5.
《现代电子技术》2017,(21):112-116
模糊C均值聚类算法在处理高维数据集时,存在计算复杂度高,算法泛化能力差,计算精度低等问题。考虑到特征属性对聚类的贡献程度的差异,在多属性模糊C均值聚类的思想上,提出一种基于属性重要性的约简算法。为验证有效性,在UCI数据集上,将新算法与因子分析法和粗糙集理论约简方法进行比较分析。实验结果表明,该方法具有更好的泛用性,在平均标准差大或类间中心距离较远的数据集上具有更好的性能。  相似文献   

6.
模糊C均值聚类(FCM)算法是一种基于非监督聚类算法。样本加权模糊C均值聚类(WFCM)算法是FCM算法的改进,该算法能够明显提高收敛速度和聚类的准确性。无论是FCM算法还是WFCM算法,对噪声都相对敏感,而且聚类数目仍然需要人工确定。在此提出一种改进算法,首先通过偏微分方程(PDE)降噪算法对原始脑MRI医学图像进行处理;其次利用聚类有效性确定最佳聚类数目,对WFCM算法进行改进;最后利用本文改进算法对图像进行聚类分割。实验表明,该方法是一种具有自动分类能力、抗噪性较好的模糊聚类图像分割算法。  相似文献   

7.
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。  相似文献   

8.
针对现有直觉模糊c均值聚类算法无法发现非凸聚类结构的缺陷,提出了一种基于核化距离的直觉模糊c均值聚类算法。算法在定义了基于核的直觉模糊欧式距离基础上,通过把聚类样本映射到高维特征空间,使原来没有显现的特征突现出来,从而能够更好地聚类。实验选择一组人工数据集及一组UCI数据集测试了本文算法,并将其与五种经典的聚类算法进行了比较。实验结果充分表明了该算法的有效性及优越性。  相似文献   

9.
基于聚类分析的无线暂态信号的盲分类   总被引:1,自引:0,他引:1  
在通信个体识别中,含有重要信息的暂态信号起着重要的作用。在无训练样本的情况下,先将暂态信号通过小波变换进行消噪,再用K-调和均值聚类算法来进行分类识别。仿真证明,在等信噪比和相同类数目的情况下,调和均值聚类和K—means算法的综合应用,不仅解决了非平穗的暂态信号的分类,而且其计算量少,时高维数据的分类效果也较明显。  相似文献   

10.
针对传统串行聚类集成算法在处理高维海量数据时效率低下的问题,提出基于Spark的并行聚类集成算法SCEA(Spark based Clustering Ensemble Algorithm).首先,通过主成分分析与成对约束结合的方法对算法输入数据进行预处理,达到数据降维并去除特征相关性的目的;其次,通过调用不同聚类算法获得基聚类成员后,采用三元组方法通过基聚类成员的簇标签构造出相似度矩阵,并调用层次聚类算法得到最终的聚类结果;最后,在调用MLlib中已有聚类算法的基础上,基于Scala对SCEA算法进行了实现.将SCEA与同类算法在多组数据集下进行对比测试,实验结果表明:总体上SCEA不仅较已有算法在准确率方面有所提高,并且通过分析运行时间、加速比以及可扩展性3个性能指标,证明了SCEA在算法性能上的优越性.  相似文献   

11.
K-means聚类算法研究综述   总被引:5,自引:0,他引:5  
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。  相似文献   

12.
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。  相似文献   

13.
Traditional clustering algorithms (e.g., the K-means algorithm and its variants) are used only for a fixed number of clusters. However, in many clustering applications, the actual number of clusters is unknown beforehand. The general solution to this type of a clustering problem is that one selects or defines a cluster validity index and performs a traditional clustering algorithm for all possible numbers of clusters in sequence to find the clustering with the best cluster validity. This is tedious and time-consuming work. To easily and effectively determine the optimal number of clusters and, at the same time, construct the clusters with good validity, we propose a framework of automatic clustering algorithms (called ETSAs) that do not require users to give each possible value of required parameters (including the number of clusters). ETSAs treat the number of clusters as a variable, and evolve it to an optimal number. Through experiments conducted on nine test data sets, we compared the ETSA with five traditional clustering algorithms. We demonstrate the superiority of the ETSA in finding the correct number of clusters while constructing clusters with good validity.  相似文献   

14.
周浩理  李太君  肖沙 《电视技术》2015,39(17):139-142
K-means算法是经典的基于划分的聚类算法,但该算法存在依赖于初始聚类中心、容易陷入局部最优解等缺点,针对这些缺点,本文提出了基于微正则退火K-means聚类算法,通过继承微正则退火算法的高效全局寻优特性,可以避免陷入局部最优解。实验结果表明,改进的算法能够有效的减少原算法对初始聚类中心点的依赖,提高算法的稳定性,摆脱原算法容易陷入局部最优解的缺点。  相似文献   

15.
传统的用于Web日志聚类的算法大都需要用户指定聚类个数。提出了一种新的自适应聚类算法并对Web日志用户会话进行聚类。该算法基于凝聚聚类思想和划分聚类思想,用初始数据集中每2个会话之间的相异度作为距离的度量,合并距离小于一定阈值的两个会话以产生初始聚类,再根据一定的规则动态地合并距离最小的会话类或会话,算法的结果是产生自然的聚类。最后,通过比较会话聚类的内部距离和类间距离来验证算法的有效性。这种聚类算法的最大优点在于,他能够产生自动的聚类,而不需要用户事先指定需要产生的聚类个数,并且能有效识别孤立点。实验表明,这种聚类能够产生较高质量的聚类效果。  相似文献   

16.
与经典的K均值聚类算法相比,模糊C均值(FCM)聚类算法通过引入模糊因子,考虑不同聚类数据簇之间的相互关系,得到可分性更好的聚类结果。但是模糊因子的引入,使得任意一个样本点都存在模糊性,造成FCM极易受到噪声和离群点的影响,聚类结果泛化性能较差。因此,该文提出一种簇间可分的鲁棒FCM算法(RBI-FCM)。RBI-FCM利用K均值算法对模糊隶属度的稀疏特征,降低不同数据簇之间的相互作用,突出不同数据簇相邻区域的可分性;另外,RBI-FCM在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,可提高聚类模型的泛化性能。该文设计了有效的模型求解迭代算法。实验结果表明,RBI-FCM算法提高了FCM的鲁棒性,有效降低FCM对数据簇分布差异性和抽样不均衡的敏感性,得到理想的聚类结果。  相似文献   

17.
具有异构分簇的粒子群优化算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
李文锋  梁晓磊  张煜 《电子学报》2012,40(11):2194-2199
 粒子群优化(Particle Swarm Optimization,PSO)算法在复杂多峰函数可行域空间搜索时极易陷入局部极值点.研究表明改变种群拓扑结构和调整算法参数有助于改善种群的多样性,但是目前研究中少有同时考虑种群全局拓扑结构和局部粒子个体能力.本文提出一种具有异构分簇特性的自适应PSO算法.该算法采用K-均值聚类算法对种群进行动态分簇,形成多异构子群,并采用Ring型拓扑结构进行子群间信息流通.而后采用基于寻解水平评价的粒子自适应参数调整策略进行个体调整.通过实验分析表明该算法能够提高粒子群优化的种群的多样性、粒子活性、搜索能力和收敛性能,同时也降低了算法对参数初值的依赖性.  相似文献   

18.
宋长新 《激光与红外》2012,42(11):1306-1310
聚类作为一种重要的图像分割方法得到了大量研究,提出了一种新的结合稀疏编码的红外图像聚类分割算法,扩展了传统的基于K-means聚类的图像分割方法。结合稀疏编码的聚类算法能有效融合图像的局部信息,而且易于利用像素之间的内在相关性,但是对于分割会出现过分割和像素难以归类的问题。为此,在字典的学习过程中,将原子的聚类算法引入其中,有助于缩减字典中原子所属类别的数目防止出现过分割;同时将稀疏编码系数同原子对聚类中心的隶属程度相结合来判断像素所属的类别。这种处理方式能更好地实现利用像素的内在相关性进行聚类分割,并在其中自然引入了局部空间信息,达到更好分离目标区域和背景区域的目的。实验结果表明,结合稀疏编码的K-means聚类分割算法能更好的实现复杂背景下红外图像重要区域的准确分割提取。  相似文献   

19.
汉语文本聚类及其算法设计   总被引:1,自引:0,他引:1  
主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结果表明算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号