首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对k-means算法对初始值敏感、易陷入局部极小值等缺点,结合遗传算法的思想,提出了一种基于遗传算法和k-means算法的混合聚类方法,为了测试该聚类算法的性能,用k-means 算法和改进的算法进行了1组实验,并对2种算法的聚类结果进行比较,实验结果表明算法能够有效地解决聚类问题.  相似文献   

2.
营养作为人类生活的必要前提,大量患有某种疾病患者或由于工作职业原因对不同营养成分需求各不一致,发现不同食物种类营养成分及含量间的关系具有较强的应用价值。由于各类食物类别所含食物数量不同,针对Apriori算法通过支持度和置信度来衡量关联规则的特点,为克服各类食物数量不一致容易对挖掘结果产生不良影响,设计了一种通过k-means与Apriori算法对多种食物的营养成分及含量的挖掘与分析的方法。首先根据不同食物营养成分含量采用k-means聚类算法进行聚类,将食物数据集划分出了多个互不相交的"簇",再在各"簇"内通过Apriori算法实现食物营养成分含量之间的关联规则挖掘,其结果表明使用该方法经过聚类后的同一簇内食物营养成分关联程度明显优于直接在数据集中使用Apriori算法进行挖掘,为各类人群的合理膳食及饮食健康提供了重要的参考依据。  相似文献   

3.
一种改进的基于密度和样本数量的K-means算法   总被引:1,自引:0,他引:1  
对原始K-means算法进行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点。首先,寻找样本容量的最大可能初始聚类数n。然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类。最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并。为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验,验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法。  相似文献   

4.
用k-means算法对二维数据进行聚类分析,并用C#语言实现了该算法。先按照样本点的距离进行初始划分,然后再按照各样本点和初始中点的距离远近进行聚类。结果表明,k-means算法对二维数据的聚类是有效的,实现该算法的程序对二维数据的聚类具有通用性。  相似文献   

5.
依据图书馆的现有信息,结合数据挖掘的流行方向,应用聚类算法分析研究读者的借阅行为,获得对图书馆管理有用的信息,提高图书馆管理工作效率和资源利用率。  相似文献   

6.
在聚类分析中,模糊k-均值算法是目前应用最为广泛的方法之一,然而该算法对初始化敏感,容易陷入局部极值点,为此,提出一种基于克隆选择的模糊聚类新算法以实现全局优化处理.在新算法中,由于克隆算子能够将进化搜索与随机搜索、全局搜索和局部搜索相结合,因而通过对候选解进行克隆算子操作,能够快速得到全局最优解.用人造数据和IRIS实际数据所做测试结果表明了新算法的有效性.  相似文献   

7.
从划分聚类要求的时间和空间上看,传统的串行算法已很难适应海量的数据,有必要研发高性能、可扩展的并行算法来解决这一问题,基于一些主要的并行划分聚类算法所存在的问题,提出了在机群系统上采取数据并行策略设计的并行划分聚类算法思想。  相似文献   

8.
面对日益激烈的竞争环境,不管是金融行业,还是电信行业,企业运营营销方式从大众化营销转为根据不同的用户群体需求提供的差异化营销,而差异化营销的关键因素就是用户有效细分。本文根据通信用户通话数据作为分析对象,通过采集相关特点人群呼入呼出次数、通话持续时长等数据比较筛选后得到相关特征,对用户通话数据进行聚类,以此获取具有良好电信特征的群体。然后在以上筛选基础上,结合用户数据,采用K-means算法挖掘出用户数据与相关工作业务之间存在的相关关联性结果。企业可以此类用户细分为指导,为用户提供更好的优质服务。  相似文献   

9.
基于k-means聚类算法的试卷成绩分析研究   总被引:1,自引:0,他引:1  
研究了k-means聚类算法,并将此算法应用于高校学生试卷成绩分析中.首先对数据进行了预处理,然后使用k-means算法,对学生试卷成绩进行分类评价.用所获得的结果指导学生的学习和今后的教学工作.  相似文献   

10.
模糊C-均值(FCM)聚类算法的改进   总被引:6,自引:0,他引:6  
付辉 《科学技术与工程》2007,7(13):3121-3123
针对目前模糊C-均值聚类算法不适用于有噪声和样本不均衡等问题,借助改进算法AFCM和WFCM的思想,提出另一种新的聚类算法。它是AFCM和WAFCM结合的一种算法,但有着更好的健壮性和聚类效果。  相似文献   

11.
数据挖掘技术中聚类算法的探索与研究   总被引:1,自引:0,他引:1  
申锐 《山西科技》2009,(2):90-91
文章在对各种聚类算法深入分析的基础上,尤其在对基于密度的聚类算法、基于层次的聚类算法和基于划分的聚类算法深入研究的基础上,提出了一种改进基于密度和层次的快速聚类算法。该算法保持了基于密度聚类算法发现任意形状簇的优点,而且具有近似线性的时间复杂性,因此适合对大规模数据的挖掘。  相似文献   

12.
随着网络技术和相关学科的发展,入侵检测技术日趋成熟.对SOM算法和K-Means算法进行了具体的分析,提出了一种基于SOM和K-Means的使两类算法优点相结合并克服各自不足的聚类算法,提高了聚类信息的精确度、对攻击的识别率和系统的整体性能.  相似文献   

13.
K-means 是一种基于划分的聚类算法,由于 K-means 算法在选择初始聚类中心时是随机选取 k 个点,因此一旦 k 个点选取不合理,将会误导聚类过程,得到一个不合理的聚类结果。在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,采取“射靶”的原理进行类中心搜索。从实验结果中可以发现,改进后 K-means 得到的聚类结果更加稳定,对初始聚类中心的依赖性减弱了。  相似文献   

14.
在海量的动态数据流中发现有价值的知识,是数据挖掘技术研究的重要问题.研究数据流聚类,根据数据流的特点,提出了一种基于滑动窗口的一趟数据流挖掘的算法,对原有的一趟数据流聚类算法进行了改进,增强了一趟数据流聚类算法的扩展性,改进了数据流聚类的质量.  相似文献   

15.
数据挖掘领域中的聚类方法   总被引:4,自引:0,他引:4  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

16.
一种基于密度的引力聚类算法   总被引:1,自引:0,他引:1  
针对传统基于距离的聚类算法所存在的缺点,将万有引力和牛顿第二运动定律思想引入到聚类过程中,提出了一种改进的基于密度的引力聚类算法GCABD.该算法可以自动决定目标数据集中的簇的个数,并且能发现任意形状的簇且可以过滤"噪声"数据.实验结果表明,所提出的GCABD算法的聚类效果和精度均比典型的K-means算法好,提高了聚类质量.  相似文献   

17.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

18.
基于遗传算法的聚类分析及其应用   总被引:12,自引:0,他引:12  
通过把C-均值法中的距离平方和准则函数作为遗传算法的适应度函数,把各个聚类中心编码成染色体,来讨论一种基于遗传算法的聚类分析方法,目的是利用遗传算法的全局性来提高聚类算法找到全局最优的可能性。实验结果证明,该算法可以很好地解决某些聚类分析问题。  相似文献   

19.
聚类算法研究综述   总被引:6,自引:0,他引:6  
阐述了聚类算法基本原理,介绍了各种聚类算法,并比较分析了几种典型聚类算法的优点与不足,以便于对聚类算法作进一步的研究。  相似文献   

20.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号