首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

2.
模糊聚类算法在汉语文本聚类中的应用   总被引:8,自引:2,他引:8  
应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。  相似文献   

3.
聚类技术就是将数据分为自然的群体,并给出每个群的特征描述的一种数据方法。但是传统的聚类算法对高维大规模数据的处理效率不高,张铃教授提出的交叉覆盖算法可以有效地处理大规模的聚类问题,因而本文提出基于覆盖算法的聚类。同时注意到可以用粒度来描述聚类粗细,因此在聚类中引入粒度。  相似文献   

4.
模糊聚类算法应用研究   总被引:2,自引:0,他引:2  
本文介绍了模糊C-均值聚类算法、遗传模糊C-均值聚类算法以及免疫进化模糊聚类算法的原理和应用,然后对其优缺点进行了分析比较.并给出了各自的适用领域。最后,总结了模糊聚类算法中存在的一些问题和发展前景。  相似文献   

5.
基于商空间粒度的覆盖聚类算法   总被引:1,自引:0,他引:1  
介绍了覆盖算法的基本思想,给出了商空间粒度的基本原理,提出了基于商空间粒度的覆盖聚类算法.通过实验验证了该算法的有效性和可行性,它适合处理大规模的数据样本.  相似文献   

6.
与传统的前向神经网络相比,覆盖算法具有运行速度快、精度高的特点,但覆盖算法的初始领域中心是随机选取的.实验表明网络性能与学习顺序有密切的关系.在前向神经网络交叉覆盖算法基础上提出了一种新型改进的交叉覆盖算法--基于聚类的交叉覆盖算法.该方法是一种根据聚类结果确定学习顺序的方法.实例表明这种改进的算法是确定性学习方法,可以有效减少覆盖数量,提高交叉覆盖算法的测试速度,减少拒识样本数,提高识别的精度.  相似文献   

7.
吴涛  ;尚丽  ;陈黎伟 《微机发展》2008,(11):113-116
与传统的前向神经网络相比,覆盖算法具有运行速度快、精度高的特点,但覆盖算法的初始领域中心是随机选取的。实验表明网络性能与学习顺序有密切的关系。在前向神经网络交叉覆盖算法基础上提出了一种新型改进的交叉覆盖算法——基于聚类的交叉覆盖算法。该方法是一种根据聚类结果确定学习顺序的方法。实例表明这种改进的算法是确定性学习方法,可以有效减少覆盖数量,提高交叉覆盖算法的测试速度,减少拒识样本数,提高识别的精度。  相似文献   

8.
本文在Fuzzy分割的表式定义基础上,提出依据原始数据自动生成初分类阵后,通过类内分范数|U^(1 1-U^(t)|和分类相似标准P,自动地判别分类数目C和C的最佳划分,与原有典型Fuzzy聚类算法相比其计算速度快,可自动计算聚类数目,使用方便,有较强的实用价值。  相似文献   

9.
聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。  相似文献   

10.
聚类算法在入侵检测中的应用   总被引:1,自引:0,他引:1  
入侵检测中对未知入侵的检测主要由异常检测完成,传统的异常检测方法需要构造一个正常行为特征轮廓的参考模型,但获取完全正常的数据比较困难。介绍的聚类技术是应用到入侵异常检测中的一种较为新颖的技术,是一种无需指导的异常检测技术,可以区分哪些是正常记录,哪些是异常记录。分析了将聚类方法应用于入侵检测中的可行性及对数据处理的标准化方法。另外,给出了基于覆盖的聚类算法与两种经典聚类算法的比较。  相似文献   

11.
模糊C-均值(FCM)算法是一种非监督的模式识别方法。由于该算法具有对数据集进行等划分的趋势,影响其聚类精度。利用数据点的密度大小作为权值,借助数据本身的分布特性,提出了一种点密度加权模糊C-均值算法。该方法不仅在一定程度上克服了FCM算法的缺陷,而且具有良好的收敛性。当以聚类已知的少量数据点作为监督信息指导聚类,聚类效果进一步改善。并用聚类有效性函数对算法的聚类有效性进行了评价,从而为算法的聚类性能提供了理论依据。  相似文献   

12.
通过对排样问题的需要进行分析,选取了有效的聚类特征;通过对模糊C-均值算法和减法聚类算法的比较,选取减法聚类实现对排样图形的聚类;给出了针对排样问题的参数选取,文末给出了实例.  相似文献   

13.
针对传统K均值聚类算法对初始值敏感、易陷入局部极值点,导致数据分类结果不理想的问题,本文提出一种基于犹豫模糊Canopy-K均值聚类算法。首先利用Canopy算法对原始数据进行初步分类,形成多个数据重合的Canopy中心集合,即得到K均值算法的初始聚类中心。然后再利用K均值聚类算法进行聚类,得到最终的聚类结果。最后结合疫情后复工复产企业评价信息数据进行实例分析,从6个方面对复工复产的5个企业发展情况进行评估。将新提出的算法和基于层次分析的K均值聚类算法进行对比分析。结果表明,新提出的方法较大地减少了迭代次数,聚类结果更加合理、稳定和有效。  相似文献   

14.
在分析军事装备物流中心选址问题基础上,构建了模糊聚类和遗传算法的混合算法模型,核心技术是把模糊聚类网络模型融合到遗传算法种群构建中,可以有效地避免遗传算法易出现早熟的现象,验证了算法具有很好的鲁棒性和可信度,仿真结果能够为决策者科学正确的选址提供一定的参考.  相似文献   

15.
模糊C-均值聚类算法是目前应用最广泛的聚类算法,但其仍然存在对孤立点敏感及对初始中心点依赖等问题.为此,提出了一种改进的基于样本加权的模糊聚类算法,该算法可以更加准确的获得初始中心点且去除噪声点.同时,针对Weka系统中聚类算法的薄弱性以及聚类问题在数据挖掘领域的广泛性,本文对此平台进行二次开发并对传统FCM算法与改进算法进行研究.研究发现,改进算法使得聚类结果稳定,且能准确获得聚类结果,提高了算法准确率.  相似文献   

16.
提出一种优化传统协同聚类中模糊点类别归属的改进算法,该算法引入基于清晰半径的新相似性距离公式,用超球体中心区域代替传统算法中的类中心,在各子集初始聚类结果的基础上,对容易导致类别归属错误的模糊点重新计算隶属度,得到较为清晰的聚类结果。实验结果显示,改进算法能很大程度地减少边界上的模糊点个数及纠正分类错误,清晰半径的引入还能弱化各子集之间协同系数的差异,使得参数设置更为简单。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号