期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《Planning》2014,(23)

针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CAFCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。相似文献

2.

几个初始聚类中心选取算法的比较研究

陆晶雒成翠苏海江汪彩霞《建造师》2013,(6)

传统的k均值算法对初始聚类中心敏感。在实际应用中，找到一组初始中心点，从而获得一个较好的聚类效果并消除聚类结果的波动性对k均值算法具有重要意义。本文对文献提出的基于Huffman树构造的思想选取初始聚类中心、基于均值-标准差选取初始聚类中心、基于密度选取初始聚类中心、采用最大距离积法选取初始聚类中心等4个算法从算法思想、关键技术等方面进行了比较研究。相似文献

3.

基于遗传算法的改进K-means算法

《Planning》2020,(1)

本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。相似文献

4.

灰狼优化的k均值聚类算法

《Planning》2019,(7)

针对k均值聚类算法对初始聚类中心位置敏感的问题,提出了一种基于灰狼优化的k均值聚类算法,通过灰狼优化算法对解空间的全局寻优能力得到α狼,实现对k均值聚类中心的初始化操作,并通过迭代更新α狼优化k均值聚类中心,直到达到最大迭代次数,以此改进k均值聚类算法。实验结果表明,在UCI(University of California Irvine)的4类数据集上,所提算法相比于传统的k均值聚类算法,获得了更好的聚类效果,其分类准确度平均提高10%左右,且算法较为稳定。相似文献

5.

一种基于LSA与FCM的文本聚类算法

《Planning》2016,(1)

在文本聚类中,基于向量空间模型(VSM)的文本特征空间存在高维度和稀疏空间、同义词与多义词干扰等问题;而K-means算法依赖于初始聚类中心,聚类结果随不同的初始输入而有所波动。针对这些问题,本文提出了一种基于潜在语义分析(LSA)与优化的模糊C均值(FCM)的文本聚类算法——LF。该算法首先采用一种新的词特征提取方法建立词-文本矩阵;然后对该词-文本矩阵进行奇异值分解在潜在语义空间进行降维;接着用优化的模糊C均值聚类算法实现对文本的聚类分析。最后通过实验,结果表明LF算法能更好地改善了文本聚类的结果,提高了文本的查全率和查准率。相似文献

6.

基于迭代式MapReducede的海量数据并行聚类算法研究

《Planning》2016,(14)

为解决传统K-means算法在处理海量数据时存在的不足,提出了1种适用于并行Canopy-Kmeans算法的迭代式MapReduce模型。通过Canopy算法对数据进行初始聚类,得到初始聚类中心,并按照初始聚类将数据存储于Mapper节点,减少Mapper和Reducer节点之间通信线路,减小运算量;在Mapper节点和Reducer节点之间建立互通信,将聚类中心作为迭代流通信息,减少信息流量;最终通过1次运算过程输出最终聚类结果。实验结果证明,改进的算法在时间、正确率和加速比性能方面,均优于传统的串行K-means算法,并在基于传统MapReduce模型的K-means算法基础上有所提高。相似文献

7.

改进模糊C均值聚类法的车辆实际行驶工况构建

《Planning》2017,(6)

针对模糊C均值(FCM)聚类法的性能依赖于初始聚类中心、迭代容易陷入局部极值、不能确保FCM收敛于一个最优解的问题,利用多岛遗传算法(MIGA)与序列二次规划法(SQP)组合优化,对FCM聚类的初始聚类中心进行优化,从而使聚类结果更加接近最优聚类。采用主成分分析和改进的FCM聚类分析,将运动学片段的特征值进行降维和分类处理,构建出基于大样本、符合郑州市交通特征的行驶工况。与试验数据对比表明:所构建的乘用车行驶工况与试验数据特征参数平均相对误差仅为2.097%,速度-加速度联合分布差异(SAFD_(diff))仅为1.74%,行驶工况拟合精度较高,更能综合反映郑州市交通真实状况。相似文献

8.

改进模糊C均值聚类算法及锂电池配组应用

《Planning》2017,(4)

在锂电池化成管理的智能配组过程中,当处理大规模数据或锂电池结构较复杂时,速度和准确度不高。因此,提出了一种基于遗传算法与密度加权的改进模糊C均值聚类算法。首先,由遗传算法优化得到初始聚类中心。然后,将样本对象的高斯密度函数作为其权值,并采用Xie-Beni有效性指标改进目标函数。将改进的算法通过标准测试数据集Iris和锂电池配组进行实验验证。验证结果表明:本文算法改善了聚类效果,与模糊C均值聚类算法相比,锂电池配组的正确率提高了0.8%,并且计算迭代次数从14次降低到8次。相似文献

9.

基于直方图峰值优化的阶梯k-means聚类算法

《Planning》2019,(6)

本文提出了一种基于直方图峰值优化的阶梯k-means聚类算法,本算法能够根据给定的K值,较快的得到初始聚类中心,能够很有效的减少迭代次数,得到的聚类结果很接近真实数据。相似文献

10.

一种优化初始中心的改进K-means算法

《青岛理工大学学报》2015,(6)

传统的K-means算法由于随机选取初始簇中心,造成聚类结果不稳定,容易陷入局部最优.针对这个问题,提出了一种优化初始中心的方法,即在高密度区域中以距离最远的两点作为初始的簇中心,然后再找到这两个初始中心距离和最大的点作为第3个初始中心,依此类推,直到找到k个初始中心.实验结果证明,改进的K-means算法,有较好的准确率,能够消除算法对初始中心的依赖,提高了聚类效果. 相似文献