首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
王虹  孙红 《电子科技》2016,29(1):29
针对层次聚类法和 K-means 聚类法的缺陷和不足,提出将二者相结合的改进算法,既解决了层次聚类法伸缩性差的问题,又解决了 K-means聚类法对初始聚类中心敏感的问题。通过对改进算法的计算复杂度分析并利用 UCI 数据库的测试数据对改进算法进行测试。结果表明,混合聚类算法使样本聚类的准确率提高到94%,并有更高的执行效率和更好地实用性。此外,将此算法应用到汽车销售公司的客户细分管理中,得出了差别化明显的客户细分类别,表明此改进算法具有更强的客户细分能力以及客户行为特征的解释能力。  相似文献   

2.
针对经典K-means选取初始值具有一定的盲目性和不确定性,提出了基于Canopy+算法的改进K-means聚类算法。首先对实验数据进行预处理,并从每条日负荷数据提取六个特征值;然后搭建Spark大数据集群,利用集群具有的内存并行化特点,提升改进聚类算法处理大规模数据的能力;最后将预处理后的用户日负荷数据进行单机K-means以及改进后算法的集群聚类。实验结果表明,在降低迭代次数的基础上,改进后集群聚类算法误差平方和降低3 659.906、轮廓系数提高0.03、DB指数下降0.06。使用改进后算法将电力用户划分为五个类别,其中具有调峰潜力、较优质的需求侧响应用户为第5类用户。  相似文献   

3.
选取2020年5月3日邢台出现四个超级单体的强对流过程,以6分钟的间隔对三维闪电数据进行划分,使用DBSCAN聚类算法删除离散点,使用K-means聚类算法对三维闪电数据进行聚类分析。选取轮廓系数最大的K值,并与雷达回波拼图数据进行对比,识别四个超级单体并计算聚类中心和聚类最大半径,使用趋势外推法对四个超级单体的运动轨迹进行预测。分析表明:DBSCAN聚类算法可以有效删除离散点,操作性强;四个超级单体的K-means算法聚类中心和30 dBZ以上的强回波区域一致性较好,可以获取聚类中心运动轨迹和聚类最大半径;使用临近三个时次数据进行趋势外推,MSE最小,该方法对雷电预警信号发布有参考价值。  相似文献   

4.
根据传统的K-means算法不能事先确定聚类分析方法的数量,在原始聚类中心选择敏感而且很容易受孤点数控制造成聚类结果不好的情况,给出了一个有效的簇中距离算法以及和原始簇中心选择相结合的AKD-means算法。首先,由提出的基于距离的LAND-DBSCAN方法 ,去除样本中的噪音数据并决定了其中的最佳聚类分析方法数量;其次利用提出的基于簇中心的K-means++方法进行聚类,并求出了聚类的类簇中心点。对西安市出行的轨迹数据集进行实证分析,并选择了轮廓系数、DBI、inertias等验证指数,与Kmeans算法、DBSCAN与K-means结合算法进行了对比验证,结果表明AK-means算法的精度高于后两者。  相似文献   

5.
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。  相似文献   

6.
K-means聚类算法研究综述   总被引:5,自引:0,他引:5  
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。  相似文献   

7.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

8.
本文对传统的K-means聚类算法进行了深入的分析研究,发现了算法当中的一些缺陷和漏洞,并且找出可以改进K-means聚类算法的方法,使聚类分析的结果更具有实际意义,保证了聚类结果的高质量。  相似文献   

9.
李金  宫宁生  张蕾 《电视技术》2015,39(1):136-138
提出了一种基于改进的K-means的车牌字符分割方法。该方法首先利用均值跳变法对车牌区域进行精确定位,再利用改进的K-means算法对车牌字符进行聚类,最后根据K-means算法得到的聚类中心对车牌字符进行分割。实验结果表明,该方法能够准确地分割出车牌字符,且具有较强的抗干扰性。  相似文献   

10.
本文重点讨论了聚类分析方法中K-means聚类算法在客户价值分析中的作用,通过对客户的现有价值和潜在价值进行分析,对客户进行细分.并针对某地区移动公司的客户数据信息,用K-means算法进行了详细的实例分析.  相似文献   

11.
云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法。首先对云计算Hadoop框架的存储数据能力和采用的Map Reduce计算模型进行分析,然后采用群智能算法对传统数据挖掘K-means聚类算法进行改进,解决其容易陷入局部最优问题。实验结果表明,相比加权K-means聚类算法,提出的改进算法表现出更好的聚类精度和运行速度,可以适用于大规模数据的聚类挖掘。  相似文献   

12.
传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确.随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究者利用Hadoop并行框架进行K-means并行化研究,虽然提高了算法的运行时间,但K-means算法在聚类判定时需要反复迭代,反复进行磁盘的读写操作,很大一部分时间花费在磁盘操作上,并行算法的效率大打折扣.为此,本文提出基于Spark框架的改进并行K-means算法,通过对RDD的操作有效解决了频繁的磁盘读写.在标准数据集下,进行对比实验,通过聚类效果和算法并行的加速比,验证了改进算法的有效性.  相似文献   

13.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

14.
针对K-means算法对于初始聚类中心选择敏感问题,提出了一种改进的K-means算法,该算法优化了聚类中心选择问题,能够获得全局最优的聚类划分,同时减少了算法的时间复杂度。实验结果表明,采用本文的算法进行网络入侵检测,相对于经典的聚类算法,能获得理想的网络入侵检测率和网络误报率。  相似文献   

15.
在图像处理大领域内,对特征值的处理尤为重要,而K-means算法是被运用于特征值聚类的重要方法之一,该方法简单快捷,聚类效果较佳,因而被学术界广泛使用。针对传统的K-means算法在进行数据集划分过程中的不足之处,提出了一种基于二分法的K-means聚类算法,该算法对数据集进行划分来选择出下次划分的数据集,以此来形成迭代,实验表明该算法相比于传统算法在划分方面有了明显的改进。  相似文献   

16.
一种改进的特征加权K-means聚类算法   总被引:4,自引:0,他引:4  
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据.  相似文献   

17.
王伟 《电子器件》2020,43(2):380-385
针对聚类算法K-means在聚类的过程中,出现数据的属性缺失造成聚类的精确度下降等问题,提出了一种改进BP神经网络的BPK-means算法。该算法首先根据BP神经网络对缺失的属性值进行预测,补全缺失的数据,极大的提高了数据的完整性和可靠性;然后对异常的数据进行去噪处理;最后通过K-means算法对修复后的数据进行聚类。通过理论验证和实验结果都表明所提出的方法比原始的算法精确度有很大提高。  相似文献   

18.
针对在复杂环境下需要通过多航迹规划以实现武器协同的问题,利用排挤机制产生Kmeans聚类的初始聚类中心,并将改进K-means聚类与量子粒子群算法(QPSO)相结合应用于无人机的三维多航迹规划。改进算法解决了K-means聚类易陷入局部最优、聚类准确率低的问题。根据产生的初始聚类中心,将粒子划分成多个子种群,利用QPSO算法对每个子种群进行优化,使得每个子种群可以产生一条可行航迹。仿真分析证明了改进算法可以有效保证子种群之间的多样性,生成较为分散的多条可行航迹。  相似文献   

19.
《现代电子技术》2019,(8):145-150
针对传统K-means聚类算法对高维非线性数据聚类效果不佳、聚类时间消耗大的问题,文中对高维数据的预处理进行研究,提出一种基于深度信念网络(DBN)的K-means聚类算法(DBNOK)。此算法首先使用多层受限玻尔兹曼机(RBM)对数据进行特征学习,并将学习到的隐含特征进行K-means相关参数和初始聚类中心进行交叉迭代优化。用DBNOK算法分别在低维数据集和高维数据集上进行实验,结果表明,DB-NOK算法聚类准确率优于标准的K-means算法和模糊均值聚类(FCM)算法。  相似文献   

20.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号