首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对传统K-均值算法对初始聚类中心选择较为敏感的问题,提出了一种基于融合集群度与距离均衡优化选择的K-均值聚类(K-MCD)算法。首先,基于"集群度"思想选取初始簇中心;然后,遵循所有聚类中心距离总和均衡优化的选择策略,获得最终初始簇中心;最后,对文本集进行向量化处理,并根据优化算法重新选取文本簇中心及聚类效果评价标准进行文本聚类分析。对文本数据集从准确性与稳定性两方面进行仿真实验分析,与K-均值算法相比,K-MCD算法在4个文本集上的聚类精确度分别提高了18.6、17.5、24.3与24.6个百分点;在平均进化代数方差方面,K-MCD算法比K-均值算法降低了36.99个百分点。仿真结果表明K-MCD算法能有效提高文本聚类精确度,并具有较好的稳定性。  相似文献   

2.
基于改进K-均值聚类的快速分形图像编码算法   总被引:2,自引:0,他引:2  
将先进的K-均值聚类理论引入到分形图像编码领域,是目前国际学术界的研究热点之一.本文全面分析了K-均值聚类的初始聚类中心选取问题,给出了基于均值一标准差的初始聚类中心选取新方案,并据此提出了一种新的快速分形图像编码算法.仿真实验表明,本文所提出的快速分形图像编码算法是一种高效的图像压缩方法,不仅其压缩效果明显优于传统K_均值聚类分形图像压缩方案,而且具有较短的编码时间.同时,该算法还具有较强的通用性与适应性(传统K-均值分形编码方法对于纹理图像压缩效果较差,而本文算法的压缩效果却较理想).  相似文献   

3.
针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.  相似文献   

4.
传统的K-均值算法,因对初始聚类中心的选择敏感,存在容易陷入局部最优解的缺点,差分演化算法是一类基于种群的启发式全局搜索技术,对于实值参数的优化具有很强的鲁棒性。为了克服K-均值聚类算法的上述缺点,提出基于差分演化的K-均值聚类算法,该方法结合K-均值算法的高效性和差分演化算法的全局优化能力,较好地解决了聚类中心优化问题。通过实验结果表明,此算法能够有效改善聚类质量。  相似文献   

5.
基于初始聚类中心优化的K-均值算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对传统的K-均值算法对初始聚类中心的选取和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。利用该方法选出初始聚类中心,再应用K-均值算法进行聚类,同时对孤立点进行特殊处理。实验表明,该方法能够产生高质量的聚类结果。  相似文献   

6.
全局K-均值聚类算法需要随机选取初始的聚类中心,本文基于K中心点算法的思想,将其作为全局K-均值聚类算法的初始聚类中心,并对全局K-均值聚类算法进行改进。依托人工模拟数据和学习库中的数据分析,对比两种算法的性能,得出改进算法聚类时间短,鲁棒性强的结论。  相似文献   

7.
基于样本空间分布密度的初始聚类中心优化K-均值算法*   总被引:2,自引:1,他引:1  
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。  相似文献   

8.
针对粒子群优化算法容易陷于局部最优,且初始聚类中心选择对K-均值算法的影响较大,提出一种融合邻域扰动的简化粒子群K-均值初始优化聚类算法(ADPSO-IKM)。首先,根据 “集群度”思想实现优化初始聚类中心。其次,在粒子群算法公式中加入邻域扰动项,避免陷入局部最优,并且算法遵循自适应度优化学习策略增强全局搜索能力,进一步提高算法精度。通过仿真测试表明,提出的ADPSO-IKM算法能加快收敛速度,可防止粒子的早熟,收敛效果好并具有较好的稳定性。  相似文献   

9.
针对布谷鸟搜索(CS)算法后期收敛速度慢,传统K-均值算法对初始簇中心选择比较敏感,提出了一种自适应调整的布谷鸟搜索及优化初始K-均值聚类算法(CSSA-OIKM)。首先,由“集群度”与距离均衡优化选择初始簇中心。其次,融合粒子群算法思想,遵循自适应优化学习策略以均衡CS算法全局与局部精细搜索能力。最后,在改进CS算法的基础上引入自适应度调节步长因子与动态变化发现概率,增强算法收敛性能。通过对经典数据集的仿真实验分析,相比K-均值算法、PSO-K-均值算法及CS-K-均值算法来说,提出的CSSA-OIKM算法能有效提高聚类精确性,且算法稳定性好。  相似文献   

10.
指定K个聚类的多均值聚类算法在K-均值算法的基础上设置了多个次类,以改善K-均值算法在非凸数据集上的劣势,并将多均值聚类问题形式化为优化问题,可以得到更优的聚类效果。但是该算法对初始原型敏感,且随机选取原型的方式使聚类结果不稳定。针对上述问题,提出一种稳定的K-多均值聚类算法,并对该算法的复杂度与收敛性进行了简要讨论。该算法先基于数据样本的最邻近关系构造图,根据图的连通分支将数据分为若干组,取每组数据的均值点作为初始原型,再用交替迭代的方法对优化问题进行求解,得到最后的聚类结果。在人工数据集和真实数据集上的实验表明,该算法具有更稳定更优越的聚类效果。  相似文献   

11.
针对典型K-Means算法随机选取初始中心点导致的算法迭代次数过多的问题,采取数据分段方法,将数据点根据距离分成k段,在每段内选取一个中心作为初始中心点,进行迭代运算;为寻找最优的聚类数目k,定义了新的聚类有效性函数-聚类指数,包含聚类紧密度和聚类显著度两个指标,通过最优化聚类指数,在[1, n ]内寻找最优的k值。在IRIS数据集进行的仿真实验结果表明,算法的迭代次数明显减少,寻找的最优k值接近数据集的真实情况,算法有效性得到了验证。  相似文献   

12.
改进K-means加权自适应多视图数据聚类算法   总被引:1,自引:0,他引:1  
李丽亚  闫宏印 《计算机仿真》2021,38(8):314-317,429
在如今的大数据时代,视图数据越来越多,由于这些数据表现出明显的多样性和差异性,使得多视图数据聚类成为了大数据的研究重点问题之一.针对多视图数据聚类问题,提出了一种基于改进K-means加权自适应多视图聚类算法.首先,提出加权自适应多视图聚类算法,降低视图同维度变换的复杂性.然后考虑到数据的误差性和离群点问题,对数据条件进行优化处理,把Frobenius范数作为条件进行改进,起到对多视图数据加权的作用.再结合自由度问题,找到多视图数据的最优解,降低目标函数自由度.最后根据K-means优化理论,通过权重系数减少数据对多视图聚类的影响,确定多视图不同簇的聚类中心,从而完成对所有视图数据的优化.基于MATLAB仿真平台,分别对5个数据集采用4种性能评价指标进行仿真验证.实验结果表明,所提出的算法大大减少了运行时间,而且具有较好的聚类性能.  相似文献   

13.
一种改进的半监督K-Means聚类算法   总被引:1,自引:0,他引:1  
半监督聚类利用部分标签的数据辅助未标签的数据进行学习,从而提高聚类的性能。针对基于K-means的聚类算法发现非球状簇能力差的问题,本文提出新的处理思想,即把已标签数据对未标签数据的引力影响加入到类别分配决策中,给出了类与点的引力影响度定义,设计了带引力参数的半监督K-means聚类算法。实验表明,该算法在处理非球状簇分布的聚类时比现有的半监督K-means方法效果更好。  相似文献   

14.
基于K均值的迭代局部搜索聚类算法   总被引:1,自引:0,他引:1  
K均值聚类算法(KM)是解决聚类问题的一个常用的方法,该方法的主要缺点是其找到的局部极小值与全局最优值的偏差往往较大。论文构造一种基于KM算法的迭代局部搜索算法(称之为IKM)。该算法以KM算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解。当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围。试验结果表明IKM算法得到的聚类结果比KM算法得到的聚类结果有明显的改进,平均改进达100%以上。当数据集越大,簇的个数越多时,改进的效果越是显著,可以达到300%以上。因而,IKM算法是一个确实可行的有效的方法。  相似文献   

15.
一种基于网格的改进的K-Means聚类算法   总被引:1,自引:0,他引:1  
K-Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K-Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出了一种基于网格的改进的K-Means聚类算法(IKMG).IKMG利用网格连通性原理并借助树形结构,将多个密集网格单元作为初始根节点,周围网格作为它的子节点,以此类推,广度优先扩展树最终得到K个聚类树.实验结果表明,IKMG不但大大缩短了K-Means算法对大数据集的处理时间,而且能有效消除聚类结果对初始聚类中心的敏感性,无需人为指定K值,能找出不同大小、不同形状的聚类.  相似文献   

16.
一种基于粗糙集的K-Means聚类算法   总被引:5,自引:0,他引:5  
冯征 《计算机工程与应用》2006,42(20):141-142,146
在传统的硬聚类过程中,得到的簇中数据对象是确定的,然而在现实世界,边界数据是不能被准确划分到任何一个簇的。粗糙集是处理这种边界不确定性的工具,基于此提出了一种基于粗糙集的K-Means聚类算法,这种算法生成的簇包括上近似集和下近似集,可以处理边界对象。试验证明,这种算法是有效的。  相似文献   

17.
一种改进的基于特征赋权的K均值聚类算法   总被引:2,自引:0,他引:2  
聚类分析是数据挖掘及机器学习领域内的重点问题之一。近年来,为了提高聚类质量,借鉴和引入了分类领域特征选择及特征赋权思想,提出了一些基于特征赋权的聚类算法。在这些研究基础上,本文提出了一种基于密度的初始中心点选择算法,并借鉴文[1]所提出的特征赋权方法,给出了一种改进的基于特征赋权的K均值算法。实验表明该算法能较为稳定地得到较高质量的聚类结果。  相似文献   

18.
K-Means聚类算法研究综述   总被引:2,自引:0,他引:2       下载免费PDF全文
K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如何选取,离群点的检测与去除,距离和相似性度量等。从多个方面对K-Means算法的改进措施进行概括,并和传统K-Means算法进行比较,分析了改进算法的优缺点,指出了其中存在的问题。对K-Means算法的发展方向和趋势进行了展望。  相似文献   

19.
一种自适应的蚂蚁聚类算法   总被引:33,自引:0,他引:33  
徐晓华  陈崚 《软件学报》2006,17(9):1884-1889
受蚂蚁分巢居住行为的启发,提出一种人工蚂蚁运动(ant movement,简称AM)模型和在此模型上的一个自适应的蚂蚁聚类算法(adaptive ant clustering,简称AAC).将人工蚂蚁看成一个行为简单的Agent,代表一个数据对象.在AM中,人工蚂蚁有睡眠和活跃两种状态.在AAC算法中,定义了一个适应度函数用来衡量蚂蚁与其邻居的相似程度.人工蚂蚁通过其适应度和激活概率函数来决定处于活跃态或者睡眠态.整个蚂蚁群体在移动中动态地、自适应地、自组织地形成多个独立的子群体,使不同类别的蚂蚁之间相互  相似文献   

20.
针对常规PID控制器对于复杂的、动态的和不确定的系统控制还存在着许多不足之处,提出一种基于模糊RBF神经网络的PID自适应控制方法。首先用改进的模糊K一均值聚类算法初始化RBF神经网络的隐层节点中心和基函数宽度,再采用梯度法优化RBF神经网络自适应地整定PID的三个参数。仿真结果表明该学习算法的实用性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号