首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 640 毫秒
1.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

2.
文本聚类是数据挖掘的核心技术,能帮助用户有效地导航、总结和组织文本信息。本文通过对文本聚类的应用研究,探讨了几种聚类算法的原理与特点,提出并分析了K-means算法与层次凝聚算法的具体实现步骤。  相似文献   

3.
常彤 《通讯世界》2017,(19):289-290
K-means算法因其简单、易理解、速度快等优点在众多领域得到广泛的应用,然而该算法的K值选取,初始聚类点的选取和对于孤立点的处理等都会影响最终聚类结果.根据k-means算法目前的应用研究现状,针对这些缺点对算法进行改进,最后指出了改进中存在的一些问题,并指出未来的研究方向.  相似文献   

4.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

5.
本文对传统的K-means聚类算法进行了深入的分析研究,发现了算法当中的一些缺陷和漏洞,并且找出可以改进K-means聚类算法的方法,使聚类分析的结果更具有实际意义,保证了聚类结果的高质量。  相似文献   

6.
一种改进的特征加权K-means聚类算法   总被引:4,自引:0,他引:4  
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据.  相似文献   

7.
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。  相似文献   

8.
《现代电子技术》2018,(10):164-168
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。  相似文献   

9.
云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法。首先对云计算Hadoop框架的存储数据能力和采用的Map Reduce计算模型进行分析,然后采用群智能算法对传统数据挖掘K-means聚类算法进行改进,解决其容易陷入局部最优问题。实验结果表明,相比加权K-means聚类算法,提出的改进算法表现出更好的聚类精度和运行速度,可以适用于大规模数据的聚类挖掘。  相似文献   

10.
针对K-means算法对于初始聚类中心选择敏感问题,提出了一种改进的K-means算法,该算法优化了聚类中心选择问题,能够获得全局最优的聚类划分,同时减少了算法的时间复杂度。实验结果表明,采用本文的算法进行网络入侵检测,相对于经典的聚类算法,能获得理想的网络入侵检测率和网络误报率。  相似文献   

11.
周浩理  李太君  肖沙 《电视技术》2015,39(17):139-142
K-means算法是经典的基于划分的聚类算法,但该算法存在依赖于初始聚类中心、容易陷入局部最优解等缺点,针对这些缺点,本文提出了基于微正则退火K-means聚类算法,通过继承微正则退火算法的高效全局寻优特性,可以避免陷入局部最优解。实验结果表明,改进的算法能够有效的减少原算法对初始聚类中心点的依赖,提高算法的稳定性,摆脱原算法容易陷入局部最优解的缺点。  相似文献   

12.
This paper proposes a novel phishing web image segmentation algorithm which based on improving spectral clustering. Firstly, we construct a set of points which are composed of spatial lo-cation pixels and gray levels from a given image. Secondly, the data is clustered in spectral space of the similar matrix of the set points, in order to avoid the drawbacks of K-means algorithm in the con-ventional spectral clustering method that is sensitive to initial clustering centroids and convergence to local optimal solution, we introduce the clone operator, Cauthy mutation to enlarge the scale of clustering centers, quantum-inspired evolutionary algorithm to find the global optimal clustering centroids. Compared with phishing web image segmentation based on K-means, experimental results show that the segmentation performance of our method gains much improvement. Moreover, our method can convergence to global optimal solution and is better in accuracy of phishing web seg-mentation.  相似文献   

13.
针对传统的K-means算法对初始聚类中心的敏感很大,极易陷入局部最优值,基于遗传算法的K-means聚类算法由于个体的多样性不足而常出现早熟等现象,采用遗传模拟退火算法优化初始聚类中心点后进行K-means聚类,并提出了一种新的用于评价聚类结果的适应度函数,该函数更为准确地反映类内距离和类间距离.实验结果表明,该方法能获得更好的聚类结果.  相似文献   

14.
SOM+K-means两阶段聚类算法及其应用   总被引:2,自引:0,他引:2  
在众多聚类算法中,K-means和自组织神经网络(SOM)是较为经典的2个。在分析2种算法优缺点的基础上,提出基于SOM的K-means两阶段聚类算法,该算法根据SOM算法自动聚类的优点得到初步聚类数目和各类中心点,以此作为K-means算法的初始输入进一步聚类,从而得到精确的聚类信息。最后,应用该算法对某地区电信家庭客户数据进行分析,结果表明该算法有较好的聚类效果。  相似文献   

15.
空间一致性约束谱聚类算法用于图像分割   总被引:4,自引:0,他引:4  
近来出现的谱聚类算法在模式识别和图像分割中得到了广泛应用.与传统的聚类算法相比,谱聚类算法能在任意形状的样本空间上聚类且收敛于全局最优解.本研究从谱聚类和权核K-均值的等价性出发,基于图像的空间一致特性,提出了一种基于空间约束特性的谱聚类算法.该算法通过对加权核K-均值的目标函数加上空间一致约束项,利用近似逼近将目标函数最小化与谱聚类算法等价起来.仿真实验表明,此算法在图像分割中取得了比原始谱聚类算法更好的分割效果.  相似文献   

16.
针对分布式多传感器航迹关联的特点,考虑采用K-means聚类的航迹关联算法。将来自各传感器的局部航迹与系统航迹进行关联,并将系统航迹作为初始聚类中心,避免了K-means算法本身依赖初始值的缺陷;提出将系统航迹与局部航迹的欧式距离以及其状态向量在1范数下的距离之和作为相似度测度;设定距离门限值,减少了极端数据对聚类结果的影响,并增加多义性处理。蒙特卡洛仿真实验表明,该算法在目标密集并且目标有交叉的情况下能以较小的代价得到较高的平均正确关联率。同时,该算法克服了最近邻域法的局部最优特性和关联正确率高度依赖特征阈值等局限性。  相似文献   

17.
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。  相似文献   

18.
粒子群优化的聚类方法在图像分割中的应用   总被引:1,自引:1,他引:0  
图像分割和对象提取是从图像处理到图像分析的关键步骤.K-均值聚类算法和粒子群优化方法结合,即将K-均值方法的结果作为一个粒子并采用粒子群优化的方法,通过适应度函数,利用新的分类中心调整粒子位置,产生新的聚类中心.并将此方法应用于图像的分割.最后,将两种方法的处理结果进行了比较,结果表示基于PSO聚类方法对图像的分割效果比原算法有所改进.  相似文献   

19.
针对K-均值算法需要事先确定聚类的数目,无法适用于未知雷达信号分选的问题,通过引入脉冲间欧几里德距离和距离阈值TMS2812,完成聚类数目和聚类中心的自动选取,给出一个K-均值的改进算法,改进后的算法既收敛速度快,易于工程化实现,又可自动确定聚类数目和聚类中心。仿真实验表明,该改进算法提高了K-均值算法的适用范围,能够有效适应于未知雷达信号的分选。  相似文献   

20.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号