首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 703 毫秒
1.
《Planning》2014,(23)
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CAFCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。  相似文献   

2.
传统的k均值算法对初始聚类中心敏感。在实际应用中,找到一组初始中心点,从而获得一个较好的聚类效果并消除聚类结果的波动性对k均值算法具有重要意义。本文对文献提出的基于Huffman树构造的思想选取初始聚类中心、基于均值-标准差选取初始聚类中心、基于密度选取初始聚类中心、采用最大距离积法选取初始聚类中心等4个算法从算法思想、关键技术等方面进行了比较研究。  相似文献   

3.
《Planning》2020,(1)
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。  相似文献   

4.
《Planning》2019,(7)
针对k均值聚类算法对初始聚类中心位置敏感的问题,提出了一种基于灰狼优化的k均值聚类算法,通过灰狼优化算法对解空间的全局寻优能力得到α狼,实现对k均值聚类中心的初始化操作,并通过迭代更新α狼优化k均值聚类中心,直到达到最大迭代次数,以此改进k均值聚类算法。实验结果表明,在UCI(University of California Irvine)的4类数据集上,所提算法相比于传统的k均值聚类算法,获得了更好的聚类效果,其分类准确度平均提高10%左右,且算法较为稳定。  相似文献   

5.
《Planning》2016,(1)
在文本聚类中,基于向量空间模型(VSM)的文本特征空间存在高维度和稀疏空间、同义词与多义词干扰等问题;而K-means算法依赖于初始聚类中心,聚类结果随不同的初始输入而有所波动。针对这些问题,本文提出了一种基于潜在语义分析(LSA)与优化的模糊C均值(FCM)的文本聚类算法——LF。该算法首先采用一种新的词特征提取方法建立词-文本矩阵;然后对该词-文本矩阵进行奇异值分解在潜在语义空间进行降维;接着用优化的模糊C均值聚类算法实现对文本的聚类分析。最后通过实验,结果表明LF算法能更好地改善了文本聚类的结果,提高了文本的查全率和查准率。  相似文献   

6.
《Planning》2016,(14)
为解决传统K-means算法在处理海量数据时存在的不足,提出了1种适用于并行Canopy-Kmeans算法的迭代式MapReduce模型。通过Canopy算法对数据进行初始聚类,得到初始聚类中心,并按照初始聚类将数据存储于Mapper节点,减少Mapper和Reducer节点之间通信线路,减小运算量;在Mapper节点和Reducer节点之间建立互通信,将聚类中心作为迭代流通信息,减少信息流量;最终通过1次运算过程输出最终聚类结果。实验结果证明,改进的算法在时间、正确率和加速比性能方面,均优于传统的串行K-means算法,并在基于传统MapReduce模型的K-means算法基础上有所提高。  相似文献   

7.
《Planning》2017,(6)
针对模糊C均值(FCM)聚类法的性能依赖于初始聚类中心、迭代容易陷入局部极值、不能确保FCM收敛于一个最优解的问题,利用多岛遗传算法(MIGA)与序列二次规划法(SQP)组合优化,对FCM聚类的初始聚类中心进行优化,从而使聚类结果更加接近最优聚类。采用主成分分析和改进的FCM聚类分析,将运动学片段的特征值进行降维和分类处理,构建出基于大样本、符合郑州市交通特征的行驶工况。与试验数据对比表明:所构建的乘用车行驶工况与试验数据特征参数平均相对误差仅为2.097%,速度-加速度联合分布差异(SAFD_(diff))仅为1.74%,行驶工况拟合精度较高,更能综合反映郑州市交通真实状况。  相似文献   

8.
《Planning》2017,(4)
在锂电池化成管理的智能配组过程中,当处理大规模数据或锂电池结构较复杂时,速度和准确度不高。因此,提出了一种基于遗传算法与密度加权的改进模糊C均值聚类算法。首先,由遗传算法优化得到初始聚类中心。然后,将样本对象的高斯密度函数作为其权值,并采用Xie-Beni有效性指标改进目标函数。将改进的算法通过标准测试数据集Iris和锂电池配组进行实验验证。验证结果表明:本文算法改善了聚类效果,与模糊C均值聚类算法相比,锂电池配组的正确率提高了0.8%,并且计算迭代次数从14次降低到8次。  相似文献   

9.
《Planning》2019,(6)
本文提出了一种基于直方图峰值优化的阶梯k-means聚类算法,本算法能够根据给定的K值,较快的得到初始聚类中心,能够很有效的减少迭代次数,得到的聚类结果很接近真实数据。  相似文献   

10.
传统的K-means算法由于随机选取初始簇中心,造成聚类结果不稳定,容易陷入局部最优.针对这个问题,提出了一种优化初始中心的方法,即在高密度区域中以距离最远的两点作为初始的簇中心,然后再找到这两个初始中心距离和最大的点作为第3个初始中心,依此类推,直到找到k个初始中心.实验结果证明,改进的K-means算法,有较好的准确率,能够消除算法对初始中心的依赖,提高了聚类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号