首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
改进的k-nn快速分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统的k-近邻(k-nn)方法的缺点,将聚类中的K均值和分类中的k近邻算法有机结合,提出了一种改进的k-nn快速分类算法。实验表明该算法在影响分类效果不大的情况下能达到快速分类的目的。  相似文献   

2.
结合关联规则的元搜索引擎结果聚类改进   总被引:2,自引:1,他引:1  
将目的搜索引擎返回的结果经分词处理并提取主要关键词后,采用关联规则建立关联词矩阵,并利用FCM(Fuzzy C-Means,模糊C均值聚类)对结果进行聚类,且通过聚类有效性函数FPU,c)判断最佳聚类结果,最终按照相关度大小顺序将结果返回。通过与K-means(K均值聚类)算法的实验对比发现,以上方法能有效地保证运行效率与聚类个数的有效性,且提高了相关结果的排序位置,因此更能满足用户的需求。  相似文献   

3.
一种基于广度优先搜索的K-means初始化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
K-means算法是在现实应用中非常广泛的聚类算法,K-means算法对初始中心的选择非常敏感,对已存在的有代表性的初始算法进行了研究,提出了一种基于广度优先搜索的K-means初始化算法。该算法综合考虑了密度与距离因素,选择初始点。分析表明该算法选择的初始点非常接近期望的中心点。  相似文献   

4.
基于密度的K-Means算法及在客户细分中的应用研究   总被引:4,自引:1,他引:3       下载免费PDF全文
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。  相似文献   

5.
针对标准中值滤波算法边缘保持能力较差的缺点,设计了K均值中值滤波算法和递归K均值中值滤波算法。使用K均值方法将中心像素点的邻域数据序列分成两类,将该像素点所属的这类数据的中值作为输出。为了加快算法的速度,提出了两个阈值TLTH,保证在不影响结果精确性的同时尽量减少处理时间。传统的K均值算法耗时较高,论文的另一个改进是对K均值的优化处理,大大缩短了算法的处理时间。实验证明改进算法具有较好的噪声抑制能力和边缘保持能力。  相似文献   

6.
半监督的改进K-均值聚类算法   总被引:4,自引:1,他引:3       下载免费PDF全文
K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心。在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性。  相似文献   

7.
基于PSO的模糊C-均值聚类算法的图像分割   总被引:3,自引:0,他引:3  
根据粒子群优化算法(PSO)强大的全局搜索能力,提出了用PSO算法优化模糊C均值聚类(FCM)的聚类中心的方法,有效地避免了传统的FCM对初始值及噪声数据敏感,容易陷入局部最优的缺点,同时图像分割的效果也得到了提高,性能也比传统的FCM方法更加稳定。实验结果反映了该方法的有效性。  相似文献   

8.
聚类问题的自适应杂交差分演化模拟退火算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对K-均值聚类算法对初始值敏感和易陷入局部最优的缺点,提出了一个基于自适应杂交差分演化模拟退火的K-均值聚类算法。该算法以差分演化算法为基础,通过模拟退火算法的更新策略来增强全局搜索能力,并运用自适应技术来选择学习策略、确定算法的关键参数。实验结果表明,该算法能较好地克服传统K-均值聚类算法的缺点,具有较好的全局收敛能力,且算法稳定性强、收敛速度快,将新算法与传统的K-均值聚类算法以及最近提出的几个同类聚类算法进行了比较。  相似文献   

9.
针对网络设计和组合优化中的度约束最小生成树问题,基于第k最小生成树的求解算法,提出了一种求解网络G关于指定节点的最小k度生成树的新算法。该算法通过对网络G的最小生成树作最优可行变换,逐步构造出指定节点的度数越来越接近度约束k的最小i度生成树,最终得到了网络G关于指定节点的最小k度生成树。给出了算法实施的具体步骤,并证明了算法的正确性。最后通过仿真结果和一个运输实例,表明了该算法在解决度约束最小生成树问题中的有效性。  相似文献   

10.
将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足。提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类。在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性。  相似文献   

11.
新的K-均值算法最佳聚类数确定方法   总被引:8,自引:0,他引:8       下载免费PDF全文
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。  相似文献   

12.
传统的K-均值聚类方法,在聚类过程中过度依赖初始聚类中心的选择,同时由于全局搜索能力的不足,很难得到精确的聚类中心。鱼群算法在解决优化问题中表现出良好的并行性和全局搜索特性,但由于人为设置参数的影响可能会陷入局部最优。针对聚类问题的特征,将鱼群算法运用到聚类问题中,在使用自适应步长的鱼群算法的基础上,进一步融合免疫接种机制,加强算法对精确解的搜索性能,通过UCI数据集上的实验分析和比较,表明算法具有更好的有效性和稳定性。  相似文献   

13.
传统K-means算法除了对初始聚类中心的选择非常敏感,易收敛到局部最优解外,还存在着K值难以确定的问题,不合适的K值往往会得到较差的聚类结果。而K值问题也是聚类分析中的一个重要的研究方向,在粒子群聚类算法的基础上,结合K-means算法,提出了自适应K值的粒子群聚类算法。当算法收敛时,可通过比较不同K值时全局最优适应度值之间的关系来决定K值的增大与减小。实验表明改进的算法可以有效指导K值的选取,并且具有较好的聚类效果。  相似文献   

14.
提出一种新的选取初始聚类中心的算法,该算法结合了凝聚层次聚类算法AGNES,利用该算法选出初始聚类中心,再应用到K-means算法中进行聚类。实验表明,改进的算法聚类效果更好,准确率得到了提高,迭代次数也明显减少,还能够发现异常点。  相似文献   

15.
K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用维度加权的欧氏距离来度量样本点之间的远近,计算出所有样本的密度和权重后,令密度最大的点作为第一个初始聚类中心,并剔除该簇内所有样本,然后依次根据上一个聚类中心和数据集中剩下样本点的权重并通过引入的参数[τi]找出下一个初始聚类中心,不断重复此过程直至数据集为空,最后自动得到[k]个初始聚类中心。在UCI数据集上进行测试,对比经典K-means算法、WK-means算法、ZK-means算法和DCK-means算法,基于距离和权重改进的K-means算法的聚类效果更好。  相似文献   

16.
基于密度和对象方向聚类算法的改进   总被引:10,自引:1,他引:10  
针对K-means算法所存在的问题进行了深入的研究,提出了基于密度和聚类对象方向的改进算法(KADD算法)。该算法采取聚类对象分布密度方法来确定初始聚类中心,然后根据对象的聚类方向来发现任意形状的簇。理论分析与实验结果表明,改进算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果。  相似文献   

17.
迄今为止,在数据挖掘领域,人们已经实现了多种聚类算法,其中使用最广泛的当属K-means聚类算法.然而,在数据挖掘中,K-means算法面临的一个主要问题就是初始中心点选择问题.本文提出了一种结合关系矩阵和度中心性(Degree Centrality)的分析方法,从而确定K-means算法初始的k个中心点.与传统方法相比,本文算法可得到更加优质的聚类结果.实验结果表明该算法的有效性和可行性.  相似文献   

18.
K-means聚类算法可以实现对指纹库的软划分,提高定位系统的查询效率和定位精度。由于K-means算法聚类中心选择和聚类数设定的随机性,使其稳定性较差,影响定位系统的性能,在此提出采用融合聚类的方式对K-means算法进行优化。采用基于密度峰值的聚类算法得到指纹库中每一个指纹点的局部密度和局部距离,然后计算综合决策量γ;选取跳跃点前的前k个点作为K-means算法的初始聚类中心,同时确定最佳聚类数k。试验结果表明,融合聚类算法相较于传统K-means算法定位误差在1.5 m内的概率提高了约9%,定位系统的定位精度得到明显提高。  相似文献   

19.
王娟 《微型机与应用》2011,30(20):71-73,76
传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means算法的局部性和对初始聚类中心的敏感性。  相似文献   

20.
针对传统K—means聚类算法对初始聚类中心的敏感性和随机性,造成容易陷入局部最优解和聚类结果波动性大的问题,结合密度法和最大化最小距离的思想,提出基于最近高密度点间的垂直中心点优化初始聚类中心的K—means聚类算法。该算法选取相互间距离最大的K对高密度点,并以这足对高密度点的均值作为聚类的初始中心,再进行K—means聚类。实验结果表明,该算法有效排除样本中含有的孤立点,并且聚类过程收敛速度快,聚类结果有更好的准确性和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号