共查询到18条相似文献,搜索用时 109 毫秒
1.
基于混合并行遗传算法的文本聚类研究 总被引:2,自引:0,他引:2
针对传统K-Means聚类算法对初始聚类中心的选择敏感,易陷入局部最优解的问题,提出一种基于混合并行遗传算法的文本聚类方法。该方法首先将文档集合表示成向量空间模型,并在文档向量中随机选择初始聚类中心形成染色体,然后结合K-Means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现。实验表明该算法相对于K-Means算法、简单遗传算法等文本聚类方法具有更高的精确度和全局寻优能力。 相似文献
2.
徐浙君 《计算机光盘软件与应用》2014,(14):128-129
由于文本呈现的多样性和大量性,模糊聚类在文本聚类中扮演着越来越重要的角色。而应用最广泛的FCM算法存在着初始中心敏感的问题,对此本文提出了一种基于采样遗传的FCM算法(SGFCM)。该方法通过遗传算法的全局寻优能力来优化FCM算法的初始聚类中心,由此来提高聚类的质量及聚类的速度。实验证明该方法在文本软聚类应用中是有效的。 相似文献
3.
基于遗传算法和模糊聚类的文本分类研究 总被引:2,自引:0,他引:2
鉴于模糊C-均值类型算法(FCM算法)对初始中心敏感的问题,提出了一种基于遗传算法和模糊聚类的文本分类方法.采用遗传算法初始聚类中心,并在适应度的计算中采用了一个可变值,用户可以在文本直接聚类时更改该值,产生用户满意的属性约简结果,极大地提高了系统的分类精度.最后通过实验给出了该算法性能的测试结果. 相似文献
4.
5.
6.
模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy C-Means),通过对能够代表文本主题的关键短语(salient phrase)的提取来建立主题子空间,利用主题子空间中的文本向量来提取初始中心和初始隶属度矩阵.实验表明,TS2FCM取得了较好的聚类效果. 相似文献
7.
模糊C均值聚类算法(FCM)是一种流行的聚类算法,在许多工程领域有着广泛的应用.密度加权的模糊C均值算法(Density Weighted FCM)是对传统FCM的一种改进,它可以很好的解决FCM对噪声敏感的问题.但是DWFCM与FCM都没有解决聚类结果很大程度上依赖初始聚类中心的选择好坏的问题.提出一种基于最近邻居节点对密度的FCM改进算法Improved-DWFCM,通过最近邻居节点估计节点密度的方法解决聚类结果对初始簇中心依赖的问题.仿真结果表明这种算法选择出来的初始聚类中心与最终结果的簇中心非常接近,大大提高了算法收敛的速度以及聚类的效果. 相似文献
8.
模糊C均值聚类(Fuzzy C-means Clustering, FCM)算法是分析医学数据的重要方法之一,FCM的聚类效果容易受初始聚类中心的影响;诸多研究人员往往采用多种群遗传算法(Multiple Population Genetic Algorithm, MPGA)解决上述问题,但MPGA的全局搜索能力不足并缺少自适应性、易过早收敛、初始聚类中心不佳.为此,本文提出一种DMGA-FCM:衍生多种群遗传进化(DMGA)的FCM自适应聚类算法.在DMGA-FCM中,本文首次提出的衍生算子,对初始化种群进行衍生操作,提升算法寻优能力,处理种群间寻优能力不足;利用模糊控制动态调节遗传概率,以提升算法自适应性,进而增强DMGA算法全局寻优能力,避免过早收敛;用DMGA优化FCM算法的初始聚类中心,以提升算法聚类效果.在仿真实验中,本文将该算法与其他相关FCM算法进行对比,可得到更优的医疗数据聚类效果和图像聚类分割效果. 相似文献
9.
基于蚁群和自适应滤波的模糊聚类图像分割 总被引:3,自引:0,他引:3
为了改进模糊C均值聚类(FCM)算法对初始聚类中心敏感、抗噪性能较差、运算量大的问题,提出一种新的基于蚁群和自适应滤波的模糊聚类图像分割方法(ACOAFCM).首先,该方法利用改进的蚁群算法确定初始聚类中心,作为FCM初始参数,克服FCM算法对初始聚类中心的敏感;其次,采用自适应中值滤波抑制图像噪声干扰,增强算法的鲁棒性;最后,用直方图特征空间优化FCM目标函数,对图像进行分割,减少运算量.实验结果表明,该方法克服了FCM算法对初始聚类中心的依赖,抗噪能力强,收敛速度快,分割精度高. 相似文献
10.
11.
一种遗传模糊聚类算法及其应用 总被引:2,自引:1,他引:1
研究一种基于遗传算法的模糊聚类方法,即将遗传算法得到的聚类中心作为模糊C-均值(FCM)聚类算法初值,这样既可以克服FCM算法对初始中心敏感的缺点,也可以解决遗传算法只能找到近似解的问题。将算法用于通信信号的星座聚类,根据聚类有效性函数自适应地确定聚类中心,并完成信号类型的识别。仿真实验证明,当存在较小的定时误差时,算法对PSK和QAM信号仍然是有效的。 相似文献
12.
Mohammad Taherdangkoo Mohammad Hadi Bagheri 《Engineering Applications of Artificial Intelligence》2013,26(5-6):1493-1502
One of the simple techniques for Data Clustering is based on Fuzzy C-means (FCM) clustering which describes the belongingness of each data to a cluster by a fuzzy membership function instead of a crisp value. However, the results of fuzzy clustering depend highly on the initial state selection and there is also a high risk for getting the best results when the datasets are large. In this paper, we present a hybrid algorithm based on FCM and modified stem cells algorithms, we called it SC-FCM algorithm, for optimum clustering of a dataset into K clusters. The experimental results obtained by using the new algorithm on different well-known datasets compared with those obtained by K-means algorithm, FCM, Genetic Algorithm (GA), Particle Swarm Optimization (PSO), Ant Colony Optimization (ACO), Artificial Bee Colony (ABC) Algorithm demonstrate the better performance of the new algorithm. 相似文献
13.
在模糊k平面聚类(KPC)算法的基础上,通过引入正交约束提出正交模糊k平面聚类算法(OFKPC)。与KPC及模糊KPC(FKPC)类似,OFKPC仍从原型出发,用k组超平面替代传统的点(类中心)作为聚类原型。同时根据KPC及FKPC的思想,中心超平面是用来尽量区分不同类样本,因此这些超平面法向量构成的矩阵可用来进行特征降维。在人工数据集和UCI数据集上实验表明,OFKPC算法不仅较FKPC算法有更好的聚类效果,且具有更强的特征降维能力。 相似文献
14.
15.
基于二阶模糊聚类算法的雷达目标距离像识别 总被引:1,自引:0,他引:1
针对于模糊C-均值(FCM)算法敏感于聚类中心初始值的缺点,提出一种基于二阶模糊聚类方法。该方法利用传递闭包(TC)算法无初始化的优点,先对样本集按一定分类水平进行划分,选取若干类,求得这些类的样本均值作为FCM算法的初始聚类中心。一方面能够获得理想的聚类中心初始值,同时还能通过分类水平值来优化聚类中心数和聚类中心,避免局部最优,克服一致性聚类。利用该算法对三类飞机目标的实测一维距离像数据进行了识别实验,实验结果表明,基于二阶模糊聚类方法的识别率比FCM有了明显的改善。 相似文献
16.
模糊聚类算法是一种有效的聚类手段,介绍了最大树模糊聚类算法。在商务网站中,以Web日志中数据为依据,基于访问模式对商品及用户进行模糊聚类处理,给出算法实现的步骤,讨论了实现的关键技术,并介绍了未来工作的发展方向。 相似文献
17.
针对FCM(Fuzzy C-Means)算法对于初始聚类中心敏感,并只适合于发现球状类型簇的缺陷,提出采用冗余聚类中心初始化的方法降低算法对初始聚类中心的依赖,并先暂时将大簇或者延伸形状的簇分割成用多个小类表示,再利用隶属度矩阵提供的信息合并相邻的小类为大类,对FCM算法进行改进。实验结果显示改进的FCM算法能够在一定程度上识别不规则的簇,并减小FCM算法对初始聚类中心的依赖。 相似文献
18.
针对聚类算法的聚类中心选取需要人工参与的问题,提出了一种基于拉普拉斯中心性和密度峰值的无参数聚类算法(ALPC)。首先,使用拉普拉斯中心性度量对象的中心性;然后,使用正态分布概率统计方法确定聚类中心对象;最后,依据对象到各个中心的距离将各个对象分配到相应聚类中心实现聚类。所提算法克服了算法需要凭借经验参数和人工选取聚类中心的缺点。在人工数据集和真实数据集上的实验结果表明,与经典的具有噪声的基于密度的聚类方法(DBSCAN)、密度峰值聚类(DPC)算法以及拉普拉斯中心峰聚类(LPC)算法相比,ALPC具有自动确定聚类中心、无参数的特点,且具有较高的聚类精度。 相似文献