首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对K-均值聚类算法存在的不足,提出了一种新的整合粒子群优化算法(PSO)和K-均值算法的聚类算法.在新算法中,首先结合使用粒子群优化算法和K-均值算法搜索全局最优解的位置,然后再用K-均值算法在全局最优解附近的局部空间内快速寻找最优聚类中心.通过对4个数据集的实验测试,将此算法与K-均值算法、基于粒子群的K-均值算法进行了比较.实验结果表明,新算法的聚类质量比后两个算法更优.  相似文献   

2.
通过对模糊聚类K-均值算法进行分析,针对隶属度归一可能引起结果偏差,对隶属度进行了改进,并进行了实验比较,验证了改进的有效性.  相似文献   

3.
K-均值聚类算法是聚类算法中比较典型的算法之一,在其各类改进算法中都受到了离群点、初质心、类个数等因素的干扰。本文利用相似密度提出一种新的聚类初始质心选取和离群点判别方法,对K-均值聚类算法进行了改进。通过实验证明改进算法提高了聚类的有效性和稳定性。  相似文献   

4.
王庆飞 《科技信息》2007,(27):196-196,184
本文对模糊聚类K-均值算法进行了分析,针对隶属度归一可能引起结果偏差,对隶属度进行了改进,并进行了实验比较,验证了改进的有效性。  相似文献   

5.
期货公司客户信用风险的控制和管理对期货公司发展与进步有着举足轻重的作用,聚类分析可以作为客户分类方法之一为期货公司所用,而模糊聚类是聚类分析的新方法之一.本文基于期货公司客户的实际交易数据,首先提取若干特征指标作为聚类分析的基本变量,然后分别运用K-均值聚类算法和改进的模糊聚类分析方法对期货公司的客户进行分类,最后将两...  相似文献   

6.
基于PSO的模糊C均值聚类算法   总被引:4,自引:0,他引:4  
在分析模糊C均值聚类算法存在不足的基础上,提出了一种新的聚类算法:基于粒子群的模糊C均值聚类算法.该算法利用粒子群强大的全局寻优能力,不仅克服了传统的模糊C均值聚类算法对初始值敏感、噪声数据敏感、易陷人局部最优的问题,而且有较快的收敛速度.试验证明,这种算法是一种很有潜力的模糊聚类算法.  相似文献   

7.
在模糊c均值算法基础上,提出一种将粒子群算法与c均值算法相结合产生基于自适应粒子群优化的模糊聚类算法(APFC).用KDD cup99数据集进行评估模糊c均值算法和APFC算法检测性能.试验结果表明, APFC均值算法能够避免模糊c均值算法固有的缺点,检测率提高和误报率下降,并且有较高的检测性能.  相似文献   

8.
通过对多雷达扫描得到的高炉料面进行数据处理,根据数据的特征,分别采用模糊C均值聚类和特征加权模糊C均值聚类算法对料面数据进行分类,建立标准料面模型库.再通过模糊模式识别中贴近度的方法把待分类的目标料面与模型库相匹配,为后续的布料控制提供依据.该算法在某2500 m3高炉上进行了实验,取得良好的效果.仿真结果表明了其有效性.  相似文献   

9.
提出了一种模糊C均值聚类和密度聚类算法相结合的方法对裂纹图像进行分割提取.使用标准的模糊C均值聚类算法来对原始图像进行初始聚类,得到包含裂纹区域的候选点.本文还提出裂纹狭长度与区域向量2种概念,并用来去除候选点中的伪裂纹.然后,利用密度聚类算法(DBSCAN算法)对候选点进行裂纹聚类,提取出最终的裂纹图像.实验结果证明,使用上述方法对裂纹图像进行分割提取可以得到很好的效果.  相似文献   

10.
区间数据的并行模糊聚类算法   总被引:7,自引:0,他引:7  
研究了对区间数据进行聚类的模糊聚类算法;介绍和分析了模糊c-均值算法的基本思想及实现步骤;定义了区间数据的距离和四则运算,并推广模糊c-均值算法对区间数据进行聚类.在此基础上,讨论了对区间数据进行聚类的并行模糊c-均值算法.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的模糊c-均值算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

11.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

12.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

13.
通过将粗糙集和模糊聚类算法相结合, 利用粗糙集中上近似集和下近似集的概念改进模糊聚类算法, 解决了模糊聚类边界不确定的问题, 得到了上近似集和下近似集的聚类结果, 从而实现更好的聚类, 改进算法可以处理边界问题和复杂数据问题. 将改进的粗糙集模糊聚类算法用于研究环糊精聚类, 并将聚类结果与K均值聚类分析算法、 模糊C均值聚类算法相比, 实验结果表明, 改进算法有较好的聚类效果.  相似文献   

14.
基于进化策略的K-means聚类算法   总被引:3,自引:0,他引:3  
针对K-means聚类算法易陷入局部极小以及K值选取的问题,提出一类基于进化策略的聚类算法,可以有效地搜索最优聚类中心和聚类个数K;还提出了确定K值范围的经验公式,以减小搜索空间,提高搜索效率,并给出了理论分析.相对遗传算法而言,本方法鳊码简单,种群较小.对Fishers iris数据集的仿真实验表明,该方法得到最优解的可能性比经典算法大得多.  相似文献   

15.
数据挖掘可以从海量数据中发现模型和数据间的关系并做出预测。针对入侵检测系统的特点,将数据挖掘算法应用于入侵检测系统中,并着重研究了聚类算法中的K均值算法和一种改进的K均值算法。  相似文献   

16.
冷泳林  张清辰  鲁富宇 《河南科学》2014,(11):2259-2262
数据采集过程中存在大量缺失数据,即不完整数据.传统方法在聚类不完整数据时采用填充或丢弃缺失数据方式实现数据的聚类.依据不完整信息系统理论提出一种基于K-means的不完整数据聚类算法,算法首先将数据集划分成完整数据集和非完整数据集两部分,对完整数据集采用K-means算法进行聚类,然后将不完整数据依据设计的相似度度量方法划分到对应的簇中,实现数据集的聚类.实验结果表明,提出的方法能够高效、精确地实现不完整数据聚类.  相似文献   

17.
一种新的密度加权粗糙K-均值聚类算法   总被引:1,自引:0,他引:1  
为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UCI机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。  相似文献   

18.
针对聚类算法在入侵检测应用中存在的参数预设、聚类有效性评价、未知攻击类型检测等问题,提出了一种基于密度和最优聚类数的改进算法,根据样本的分布情况启发式地确定初始聚类中心,从样本的几何结构角度提出一种新的内部评价指标,给出了最优聚类数确定方法,在此基础上,设计了一个增量式的入侵检测模型,实现了聚类中心和聚类数目的动态调整.实验结果表明,与K-means及其他两种改进聚类算法相比,新算法收敛速度更快、聚类准确率更高,能够对未知网络行为进行有效聚类,具有较好的入侵检测效果.  相似文献   

19.
一种基于密度的引力聚类算法   总被引:1,自引:0,他引:1  
针对传统基于距离的聚类算法所存在的缺点,将万有引力和牛顿第二运动定律思想引入到聚类过程中,提出了一种改进的基于密度的引力聚类算法GCABD.该算法可以自动决定目标数据集中的簇的个数,并且能发现任意形状的簇且可以过滤"噪声"数据.实验结果表明,所提出的GCABD算法的聚类效果和精度均比典型的K-means算法好,提高了聚类质量.  相似文献   

20.
聚类分析作为数据挖掘中一个重要的组成部分,主要用于在潜在的数据中发现有价值的数据分布和数据模式。在研究基本蚁群聚类模型、信息熵以及LF算法和K-means算法的基础上,提出了一种蚁群聚类组合算法策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号