首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。  相似文献   

2.
逄琳  刘方爱 《计算机应用》2016,36(6):1634-1638
针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)。该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类。首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后,根据曲线的极值点对应的划分估计最佳聚类数和初始聚类中心。实验结果表明,所提CODHD算法与预处理阶段的聚类优化(COPS)算法相比,聚类准确度提高了30%,聚类算法效率至少提高14.24%。所提算法具有较强的可行性和实用性。  相似文献   

3.
聚类分析是一种重要的人类活动,被广泛应用于数据挖掘、统计学、生物学和机器学习等领域。随着仿生学的发展,一种新的智能优化算法——蚁群算法被提出,并被应用于聚类分析。针对PAM算法和蚁群聚类算法的缺点,提出了一种将PAM算法和蚁群聚类算法相结合的聚类方法。仿真实验表明,算法性能得到了有效提高。  相似文献   

4.
李小红  罗敏 《计算机科学》2012,39(9):162-165
提出了一种新的基于图划分的聚类算法——GAGPBCUK算法。该算法解决了谱聚类算法参数敏感和聚类结果不准确等问题。3组仿真实验结果表明,GAGPBCUK算法不仅在识别和学习数据集中的隐含聚类数方面具有很好的性能,而且能够得到比谱聚类算法(NJW算法)更加有效的聚类结果。  相似文献   

5.
聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。  相似文献   

6.
针对传统的划分聚类算法过度依赖初始聚类中心并容易陷入局部最优的问题,提出基于萤火虫算法的改进划分聚类算法。该算法将萤火虫个体对应于一组聚类中心的解,类簇的聚合度对应于萤火虫的亮度,通过萤火虫个体之间的相互吸引寻找聚类中心的最优解。在寻优过程中使用随机分布的萤火虫种群克服划分聚类过于依赖初始聚类中心的问题,采用自适应步长的策略加强算法寻找精确解的能力。为了避免在寻优过程中因为种群过于集中而导致算法陷入局部最优,引入小生境技术提高萤火虫的种群多样性。仿真实验结果表明,与传统聚类算法相比,该算法的聚类精度较高,稳定性较好。  相似文献   

7.
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

8.
朱永红 《微机发展》2007,17(1):123-124
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法———覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

9.
周妍  孔晓玲  张然 《福建电脑》2007,(8):9-10,21
聚类分析是数据挖掘的核心技术之一。本文介绍了当前最具代表性的聚类算法,分析它们各方面的特性,总结了聚类方法发展的趋势,并对聚类算法的研究提出了展望,便于研究者对已有算法应用与改进。  相似文献   

10.
业宁  董逸生 《计算机科学》2003,30(7):149-151
1 引言在生物学中,小生境(Niche)是指特定环境下的一种生存环境。在生物进化过程中,相同的物种一般生活在一起,共同繁衍后代,它们往往生活在特定的区域,如热带动物很难在北极生存,而北极的动物很难在赤道存活。受大自然的物竞天择,优胜劣汰的思想启发,De Jong提出了基于排挤机制的(Crowding)的小生境方法,排挤的思想源于在一个有限的空间中,各种不同的生物为了能够延续生存,它们之间必须相互竞争有限的资源。该方法已经成功地用于解决多峰函数的极限问题。  相似文献   

11.
一种基于语料特性的聚类算法   总被引:3,自引:0,他引:3  
曾依灵  许洪波  吴高巍  白硕 《软件学报》2010,21(11):2802-2813
为寻求模型不匹配问题的一种恰当的解决途径,提出了基于语料分布特性的CADIC(clustering algorithm based on the distributions of intrinsic clusters)聚类算法。CADIC以重标度的形式隐式地将语料特性融入算法框架,从而使算法模型具备更灵活的适应能力。在聚类过程中,CADIC选择一组具有良好区分度的方向构建CADIC坐标系,在该坐标系下统计固有簇的分布特性,以构造各个坐标轴的重标度函数,并以重标度的形式对语料分布进行隐式的归一化,从而提高聚  相似文献   

12.
优化初始聚类中心的K-means聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于[α]([α]为样本集数据点数目与聚类的簇类数目的比值),再把该集合从样本集中删除,重复以上步骤得到K(K为簇类数目)个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。  相似文献   

13.
对k-means聚类算法的改进   总被引:17,自引:6,他引:17  
袁方  孟增辉  于戈 《计算机工程与应用》2004,40(36):177-178,232
提出了一种k-means聚类算法中寻找初始聚类中心的新方法。算法首先计算样本间的距离,然后根据样本点之间的距离寻找有可能是一类的数据,依据这些样本点形成初始聚类中心,从而得到较好的聚类结果。实验表明,改进后的方法相对于随机选取初始聚类中心具有较高的准确率。  相似文献   

14.
基于MATLAB的模糊聚类分析的传递方法   总被引:5,自引:1,他引:5  
聚类分析中的传递方法是直接通过模糊相似矩阵获得动态聚类图,该方法比通过传递闭包法求模糊等价矩阵而获得动态聚类图的方法在时间复杂度和空间复杂度要小,本文对重点介绍传递方法,并给出了由MATLAB语言实现的算法程序,并介绍了一个应用实例。  相似文献   

15.
模糊C均值(FCM)聚类算法采取随机选取聚类中心的方法,这种方法使得FCM算法在局部范围内容易获得最优解,但在全局范围内效果较差,且FCM算法中聚类簇的个数一般需要人为设定。面对上述种种问题,文中将蚁群聚类算法和FCM聚类算法进行结合,获得了一种改进的FCM聚类算法。该算法在初步聚类中利用蚁群聚类产生聚类中心和簇的个数,将产生的聚类中心提供给FCM算法进行再次聚类。利用蚁群聚类的全局搜索和并行运算的优点避免了聚类易陷入局部最优解的缺陷。经过实验验证,该算法较一般FCM算法具有更好的性能。  相似文献   

16.
李志华  王士同 《计算机工程》2007,33(23):189-190
介绍了量子势能、量子力学中粒子的分布机制和量子聚类算法,给出了量子聚类QC算法的物理理论根据,指出了量子聚类算法的优点和不足,提出了一种基于度量距离改变的量子聚类算法DQC,该算法对IRIS样本的聚类准确率比QC算法高出了8个百分点,实验结果证明了该算法的有效性。  相似文献   

17.
基于k均值分区的流数据高效密度聚类算法   总被引:2,自引:0,他引:2  
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的.  相似文献   

18.
类搜索算法     
陈皓  潘晓英 《软件学报》2015,26(7):1557-1573
提出利用类结构驱动的群体进化计算方法——类搜索算法(CSA).CSA在个体间构造簇类形态的虚拟连接关系,并通过对类组织的结构和类搜索过程进行动态调节来优化模拟进化系统的计算状态,提高群体的搜索效率.介绍了CSA的基本模型,并基于CSA融合进化算子与差分计算机制设计出数值优化算法CSA/DE.对多个典型高纬函数和复杂混合函数的仿真实验结果说明,CSA/DE是一种对高纬连续问题高效、稳定的搜索优化方法.该工作一方面验证了CSA的可行性和有效性;另一方面则显示:基于类搜索模型可有效融合异构且具有不同计算特性的搜索机制,形成对待求解问题更具针对性且协调性更佳的搜索计算方法.这为高性能优化算法的设计提供了一条新的途径.  相似文献   

19.
文档聚类中k-means算法的一种改进算法   总被引:14,自引:0,他引:14  
万小军  杨建武  陈晓鸥 《计算机工程》2003,29(2):102-103,157
介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感,为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法,实验表明,该改进算法比原k-means算法具有更高的准确性和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号