共查询到17条相似文献,搜索用时 484 毫秒
1.
2.
3.
基于XML文档相似性的构件聚类分析 总被引:2,自引:2,他引:0
构件聚类时,提出了一种计算基于XML描述的构件问相似度的递归算法,能有效度量构件XML描述文档包含的结构和语义信息.构造文档相似矩阵,利用遗传算法将高维样本映射到二维平面上,使用k-means算法聚类,获得全局最优的构件聚类.最后,在构件库测试模型上进行实验,实验结果表明,基于XML相似度的构件聚类算法在构件查询实践中具有可行性和有效性. 相似文献
4.
模糊C-均值聚类算法是非监督模式识别中广泛应用的算法之一。但是,FCM算法在迭代过程中需要大量的计算,尤其当特征向量维数较高时,使用聚类分堆训练,不仅效率低下,还有可能导致“维数灾难”。针对该问题,分析模糊C-均值聚类算法在高维特征分析过程中,聚类中心的求解问题是一个np-hard问题,为了提高模糊C-均值聚类算法在高维特征分析中的实时性与有效性,结合界标等距映射(L-ISOMAP)算法,提出了改进算法FCM-LI,先对样本初步分析,利用聚类结果及样本数据相关性,使用界标等距映射(L-ISOMAP)算法降维,在此基础上进一步分析,获得最终分析结果。通过实验证明,FCM-LI算法在高维数据分析过程中的有效性与实时性。 相似文献
5.
利用核函数主元分析(KPCA)方法对大样本、高维数据进行特征提取预处理,并结合文化算法(CA)选择最优或接近最优的核函数,将其用于模糊C均值(FCM)聚类中,不但有效地提取了样本的非线性信息,而且使样本维数得到约简。实验表明该方法具有较好的聚类效果和更少的训练时间。 相似文献
6.
叶鹏 《电脑编程技巧与维护》2010,(20):20-22
介绍一种基于模糊逻辑的数据聚类技术,讨论了模糊C均值聚类方法。模糊C均值算法就是利用模糊逻辑理论和聚类思想,将n样本划分到c个类别中的一个,使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。 相似文献
7.
8.
《计算机应用与软件》2015,(12)
针对基于粒子群的模糊聚类算法运算效率较低的问题,提出隐隶属度模糊c均值聚类算法HMFCM(hidden-membership fuzzy c-means clustering)。HMFCM算法将FCM模糊隶属度迭代公式代入FCM目标函数中约简,得到无模糊隶属度的HMFCM目标函数,并利用PSO算法对聚类中心进行编码寻优,最后利用样本与聚类中心距离进行类别判决。HMFCM算法无需计算样本模糊隶属度,降低了聚类算法复杂度,提高了算法的计算效率及精度,而且该方法可以推广到其他基于生物寻优的聚类算法。通过仿真实验验证了所提出算法的有效性和时效性。 相似文献
9.
10.
介绍了一个与模糊C均值FCM算法等效的图像颜色分割的方法.首先利用进化聚类对图像中的像素依据其RGB的值进行进化聚类划分,对划分后的各个类的类中心用遗传算法进行优化,然后再对图像中像素进行归类划分,使其满足各类中元素具有较高的相似度,而不同类中的元素相似度差别较大的目标,并与FCM算法进行了实验对比,结果表明经人工评价该算法与模糊C均值FCM算法等效. 相似文献
11.
针对数据集中若存在孤立点或者是噪声数据会影响模糊C均值聚类算法(FCM)的聚类性能问题,本文将离群点的辨认方法与FCM算法相结合,提出一种改进的FCM聚类算法。该算法有效地降低了孤立点或噪声数据对正常数据的影响,提高了FCM算法的聚类精度。将该算法在入侵检测系统中进行实验验证,通过与FCM算法进行对比分析,证明了该算法的有效性和可行性。 相似文献
12.
13.
14.
经典模糊C均值聚类算法(FCM)基于欧氏距离,存在不同规模类簇不能正确聚类问题,针对此问题提出一种基于[K]近邻隶属度的模糊C均值聚类算法(KNN_FCM)。讨论了基于[K]近邻隶属度的粗糙C均值聚类算法(KNN_RCM)和粗糙模糊C均值聚类算法(KNN_RFCM),此方法避免了传统粗糙C均值聚类算法(RCM)和粗糙模糊C均值聚类算法(RFCM)中阈值选择问题。将KNN_FCM、KNN_RCM、KNN_RFCM分别与FCM、RFM、RFCM在UCI数据集上进行仿真比较,结果表明新方法是可行、有效的。 相似文献
15.
聚类分析在模式识别和图像处理领域中有着极为重要的意义和广泛的应用前景。常用的聚类分析的方法是模糊C均值算法(FCM),但是FCM算法容易陷入局部最优解。提出一种基于FCM和遗传算法对图像进行模糊聚类分析的方法。对输入图像进行纹理特征提取,通过主成分分析法对提取的特征向量进行降维处理,降低图像聚类分析算法的复杂度,提高结果的精确度,结合FCM和遗传算法对图像数据进行模糊聚类分析。实验结果表明该方法可以得到较好的分类效果。 相似文献
16.
相比于k-means算法,模糊C均值(FCM)通过引入模糊隶属度,考虑不同数据簇之间的相互作用,进而避免了聚类中心趋同性问题.然而模糊隶属度具有拖尾和翘尾的结构特征,因此使得FCM算法对噪声点和孤立点很敏感;此外,由于FCM算法倾向于将各数据簇均等分,因此算法对数据簇大小也很敏感,对非平衡数据簇聚类效果不佳.针对这些问题,本文提出了基于可靠性的鲁棒模糊聚类算法(RRFCM).该算法基于当前的聚类结果,对样本点进行可靠性分析,利用样本点的可靠性和局部近邻信息,突出不同数据簇之间的可分性,从而提高了算法对噪声的鲁棒性,并且降低了对非平衡数据簇大小的敏感性,得到了泛化性能更好的聚类结果.与相关算法进行对比,RRFCM算法在人造数据集,UCI真实数据集以及图像分割实验中均取得最优的结果. 相似文献