首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 531 毫秒
1.
针对开源数据挖掘平台Weka在聚类方面只集成了少数聚类算法的缺点,对其进行二次开发,扩充其聚类算法。介绍FCM算法的基本思想和算法描述,将FCM算法嵌入到Weka平台,充分利用Weka的类和可视化功能。选取一种实例密度加权的方法对该算法进行改进,调整聚类中心位置,并将改进后的算法与原算法进行实验比较分析。实验结果表明,改进后的算法明显减少了迭代次数,并获得更好的聚类效果。  相似文献   

2.
针对K均值算法的缺陷,提出一种用于解决聚类问题的差分进化算法对聚类的准则函数进行优化,为了能够进一步增强算法的全局搜索能力,引入一种基于种群适应度方差的自适应策略来动态调整变异概率CR和规模因子F等参数,充分利用在Weka工具中的类和接口,并将新提出的算法嵌入到平台中.在Weka平台上将该算法与K均值算法在3个UCI数据集上进行比较.仿真实验结果表明,该算法能够有效克服K均值算法的缺陷,能够获得较高的聚类质量.  相似文献   

3.
介绍了K-means算法的思想,分析了在文档聚类中运用K-means算法的步骤。以开源的机器学习软件Weka为平台,详细论述在Weka上进行文档聚类的前端处理过程,利用搜狗语料库中的文档在Weka上进行了Kmeans算法的聚类测试。实验结果表明,K-means算法在Web文档聚类中表现出较好的效果。根据实验结果,分析了K-means算法存在的不足和聚类分析中特征选择的重要性。  相似文献   

4.
基于Chameleon算法的用户聚类的设计与实现   总被引:6,自引:0,他引:6  
用户聚类是Web挖掘的重要部分,而Chameleon算法是一种通用的聚类算法。文中把Chameleon算法应用于Web挖掘,设计了Web用户的聚类,采用J2EE体系架构实现了这一算法,并在此基础上做了改进,实验结果表明,该算法取得了良好的效果。  相似文献   

5.
用户聚类是Web挖掘的重要部分,而Chameleon算法是一种通用的聚类算法.文中把Chameleon算法应用于Web挖掘,设计了Web用户的聚类,采用J2EE体系架构实现了这一算法,并在此基础上做了改进,实验结果表明,该算法取得了良好的效果.  相似文献   

6.
Weka4WS采用WSRF技术用于执行远程的数据挖掘和管理分布式计算,支持分布式数据挖掘任务。基于Weka4WS和网格环境,尝试了一种新的分布式聚类方法,并成功地将其嵌入到Weka4WS框架中,借助Weka Library实现分布式数据挖掘算法,同时引入了距离代价和混合概率的概念,将网格与Web服务技术融合,以分布式问题求解环境和开源数据挖掘类库Weka为底层支持环境,构建了网格环境下面向服务的分布式数据挖掘体系,并以基于Weka4WS的分布式聚类算法验证了算法的有效性和体系结构的可行性。  相似文献   

7.
谱聚类方法研究及其在Weka中的实现   总被引:1,自引:1,他引:0  
介绍了谱聚类方法的基本原理和算法思想,针对谱聚类方法优化问题求解的困难,分析了一种有原则的求解策略,从而给出算法的具体描述,并作为一个插件在Weka上进行了实现.对实现的系统进行了实验和测试,指出了应用中的关键问题.实验结果表明,谱聚类方法效果优于K-means方法.  相似文献   

8.
Chameleon算法的改进   总被引:1,自引:1,他引:0  
结合Chameleon算法可以发现高质量的任意形状、大小和密度的自然簇及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进Chameleon算法,使之可以处理含分类属性的数据;进而提出一种两阶段聚类算法.第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用改进的Chameleon算法归并初始划分而得到最终聚类.在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的.  相似文献   

9.
一种改进的Chameleon算法   总被引:1,自引:1,他引:0       下载免费PDF全文
利用Chameleon算法进行K值选择、相似度函数阈值选择时需要人为给出一些参数,在没有先验知识的情况下,人为确定此类参数难度较大。针对该问题介绍模块度概念,根据结构等价相似度和模块度概念提出一种聚类算法——M-Chameleon。实验结果证明,M-Chameleon可以客观地反映实际聚类情况。  相似文献   

10.
提出一种新的聚类算法AIK-Means,利用CUDA技术加速算法执行效率,并优化内存方法,可在有限时间内进行多次聚类;将Chameleon层次聚类算法用于解决K-Means算法的初始聚类中心敏感问题;在多次聚类结果中用FP-Tree进行关联分析,提高聚类有效性。将算法应用到某集团心理学MMPI数据测试,实验结果表明AIK-Means算法在执行效率和聚类有效性上具有良好的效果。  相似文献   

11.
通过分析常见异常流量的内在特征,在Chameleon算法的基础上,设计了一种基于聚类的异常流量检测算法。通过对DARPA1998数据集的实验结果表明,该算法能够在没有先验知识的前提下,对影响正常网络性能的异常流量有较高的检测准确率。  相似文献   

12.
薛文娟  刘培玉  刘栋 《计算机应用》2012,32(10):2884-2887
针对Chameleon算法中采用距离函数度量数据点间的相似度,导致距离相近的两个点可能仅拥有很少的共同特征,最小二分实际操作困难,合并时需要人工指定阈值以及一旦合并完成后不能撤销的问题,对Chameleon算法进行改进,提出一种引入共享近邻加权图(WSnnG)的Chameleon算法。该算法以数据对象间的共享近邻数来衡量相似度,进一步构造WSnnG,再利用网络模块性评价函数指导最小二分,然后以结构等价相似度作为合并的依据,最后通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI数据集及4个二维人造数据集上的实验结果表明,该算法在聚类精度和运行时间方面具有更好的效果。  相似文献   

13.
模糊C-均值聚类算法是目前应用最广泛的聚类算法,但其仍然存在对孤立点敏感及对初始中心点依赖等问题.为此,提出了一种改进的基于样本加权的模糊聚类算法,该算法可以更加准确的获得初始中心点且去除噪声点.同时,针对Weka系统中聚类算法的薄弱性以及聚类问题在数据挖掘领域的广泛性,本文对此平台进行二次开发并对传统FCM算法与改进算法进行研究.研究发现,改进算法使得聚类结果稳定,且能准确获得聚类结果,提高了算法准确率.  相似文献   

14.
为了解决用户在室内定位中,依靠WiFi指纹定位存在精度不高、误差偏大的问题,提出一种基于改进二分K-means聚类算法的室内定位方法。通过层次聚类的思想对二分K-means聚类算法(BKM)进行改进,解决了BKM聚类算法需要提前确定聚类中心、导致指纹定位中聚类结果受初始聚类个数影响的缺陷,并结合变色龙算法(Chameleon),将部分划分过细的簇合并,优化定位指纹库的可靠性。仿真实验结果表明所提出的方法有效降低了计算复杂度,提高了定位精度。此外,该方法与目前常用的BKM聚类算法相比,具有更好的聚类效果和定位精度。  相似文献   

15.
一种面向态势估计中分群问题的聚类方法   总被引:9,自引:0,他引:9  
黄雷  郭雷 《计算机应用》2006,26(5):1109-1110
对目标分群技术问题进行了描述,分群或聚类问题是态势估计需要实现的一个重要功能,主要根据底层融合的结果应用聚类分析法实现战场目标分群。目标分群的结果有助于确定态势元素之间的相互关系,从而解释问题领域的各种行为,辅助指挥决策。提出使用CHAMELEON算法对战场目标或群进行划分,根据相对互连性RI和相对近似性RC所表征的相似度把它们形成更高层次的群。  相似文献   

16.
首先详细讨论了Chameleon算法,包括:Chameleon算法的基本思想、Gk图、图的划分、近似度的计算、层次合并等,然后给出了一个实现Chameleon算法的部分代码。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号