首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 138 毫秒
1.
针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。  相似文献   

2.
李丛  王云  胡文军  丁勇 《计算机与数字工程》2014,(12):2235-2238,2340
模糊核C‐均值聚类(KFCM )的主要思想是在模糊C‐均值聚类(FCM )中引入核函数,样本点被非线性变换映射到高维特征空间进行聚类,解决了高维数据空间的聚类问题。同经典的 FCM 算法及其派生算法一样,KFCM 算法对噪声或野值数据敏感。论文在KFCM基础上,利用鲁棒统计观点对目标函数进行改进,通过引入非欧式距离度量代替欧氏距离度量,提高其对噪声或野值数据的抗干扰能力。将该算法用于构建入侵检测系统模型并通过模拟仿真实验表明,改进算法有效解决了传统的聚类算法在入侵检测中稳定性差,检测准确率低的问题。  相似文献   

3.
针对传统模糊C-均值聚类算法(FCM算法)初始聚类中心选择的随机性和距离向量公式应用的局限性,提出一种基于密度和马氏距离优化的模糊C-均值聚类算法(Fuzzy C-Means Based on Mahalanobis and Density,FCMBMD算法)。该算法通过计算样本点的密度来确定初始聚类中心,避免了初始聚类中心随机选取而产生的聚类结果的不稳定;采用马氏距离计算样本集的相似度,以满足不同度量单位数据的要求。实验结果表明,FCMBMD算法在聚类中心、收敛速度、迭代次数以及准确率等方面具有良好的效果。  相似文献   

4.
经典模糊C均值聚类算法(FCM)基于欧氏距离,存在不同规模类簇不能正确聚类问题,针对此问题提出一种基于[K]近邻隶属度的模糊C均值聚类算法(KNN_FCM)。讨论了基于[K]近邻隶属度的粗糙C均值聚类算法(KNN_RCM)和粗糙模糊C均值聚类算法(KNN_RFCM),此方法避免了传统粗糙C均值聚类算法(RCM)和粗糙模糊C均值聚类算法(RFCM)中阈值选择问题。将KNN_FCM、KNN_RCM、KNN_RFCM分别与FCM、RFM、RFCM在UCI数据集上进行仿真比较,结果表明新方法是可行、有效的。  相似文献   

5.
提出了建立在概率典型性和聚类排斥基础上的一个新型无噪声模糊聚类方法RTCM,给出了它的迭代算法过程,并验证了它的收敛性.首先引述了一般的聚类方法,它们主要分为两种:噪声聚类,如模糊c均值(FCM)、可能模糊c均值(FPCM);无噪声聚类,如NC、PCM等,然后给出了RTCM算法模型和过程,并验证了它的局部收敛性.该算法解决噪声环境下的数据聚类问题,避免了重叠聚类.对比试验表明,该算法改善了噪声环境下FCM,NC、PCM、FPCM的聚类中心质量,有效地解决了PCM在近邻聚类数据中的聚类重叠问题.  相似文献   

6.
新的K-均值算法最佳聚类数确定方法   总被引:8,自引:0,他引:8       下载免费PDF全文
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。  相似文献   

7.
模糊C均值算法(FCM)是一种用于聚类的最流行的技术。不过,传统的FCM使用欧氏距离作为数据集的相似准则,从而导致数据集的划分有相等的趋势。而数据集的形状和簇的密度对聚类性能有高度影响。为了解决这个问题,提出基于簇密度的距离调节因子以修正相似性度量。同时,针对模糊C-均值(FCM)聚类算法对初始聚类中心选择敏感,易陷入局部最优的问题,采用量子粒子群优化算法以获取全局最优解。仿真实验证明,改进的聚类算法(QPSO-FCM-CD)具有良好的性能。  相似文献   

8.
王治和  王淑艳  杜辉 《计算机工程》2021,47(5):88-96,103
模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征。提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法。通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题。在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数。基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度。  相似文献   

9.
经典的模糊c均值聚类算法对非球型或椭球型分布的数据集进行聚类效果较差。将经典的模糊c均值聚类中的欧氏距离用Mahalanobis距离替代,利用Mahalanobis距离的优点,将其用于增量学习中,提出一种基于马氏距离的模糊增量聚类学习算法。实验结果表明该算法能较有效地解决模糊聚类方法中的缺陷,提高了训练精度。  相似文献   

10.
张瑞丽  张继福 《计算机应用》2012,32(7):1978-1982
针对模糊C-均值(FCM)算法易陷入局部最优值以及对聚类中心和噪声数据敏感问题,提出了一种基于w-距离均值的模糊聚类算法。首先根据数据自身的分布规律,依据样本间距离均值思想确定初始聚类中心,并引入了调衡因子w来调节距离均值阈值;其次为每个样本赋予权值,并利用样本权值修改了聚类中心公式和目标函数公式,提高了算法的抗噪性;最后实验结果验证了所提算法可以有效地解决聚类效果往往受初始聚类中心的影响的问题,避免了局部收敛,增强了抗噪性,准确率和效率较高。  相似文献   

11.
基于马氏距离特征加权的模糊聚类新算法   总被引:2,自引:0,他引:2       下载免费PDF全文
模糊聚类分析是模糊模式识别中一个重要研究领域,而其中最经典的模糊C均值算法认为样本矢量各特征对聚类结果贡献均匀,没有考虑不同的属性特征对模式分类的不同影响,在处理属性高相关的数据集时,该算法分错率增加。针对这些问题,提出了一种基于马氏距离特征加权的模糊聚类算法,利用自适应马氏距离的优点对特征加权处理,对高属性相关的数据集进行更有效的分类。实验证明该方法的可行性和有效性。  相似文献   

12.
基于马氏距离的FCM图像分割算法   总被引:1,自引:1,他引:0       下载免费PDF全文
基于模糊C均值聚类的图像分割是应用较为广泛的方法之一,但大多数模糊C均值聚类方法都是基于欧式距离,且存在运算时间过长等问题。提出了一种基于Mahalanobis距离的模糊C均值聚类图像分割算法。实验分析表明,提出的算法在保证分割质量的前提下,能较快提高分割速度。实验结果表明了该方法的有效性。  相似文献   

13.
利用模糊聚类算法对图像进行分割是一种比较经典的方法,但是标准的FCM算法并没有考虑像素的空间信息对聚类结果的影响。利用S函数将空间信息转为模糊聚类算法的目标函数的权值,从而使目标函数更合理。实验结果表明,改进算法较标准的FCM算法具有更好的分割效果。  相似文献   

14.
针对现有协同模糊C均值算法(CFC)的协同系数不能充分描述数据子集间协同关系的问题,提出K-近邻估计协同系数的协同模糊C均值算法[(βK-CFC)]。用模糊C均值算法(FCM)求出各数据子集的隶属度和聚类中心;其次设定近邻数,求出子集在各聚类中心处的密度,形成密度矩阵;根据密度矩阵的相关性设定变化的协同系数;最后用变化的协同系数进行协同聚类。实验证明K-近邻估计协同系数的协同模糊C均值算法[(βK-CFC)]能够充分描述数据子集间的协同关系,聚类性能较好。  相似文献   

15.
针对传统模糊C-均值聚类算法对初始值和噪声敏感的缺点,提出了一种基于多链量子蜂群算法的模糊C-均值聚类算法。首先,将多链拓展编码方案应用到量子蜂群算法中,提出了多链量子蜂群算法;其次,利用多链量子蜂群算法来优化模糊C-均值聚类的初始聚类中心;最后,设计一种新的利用多链量子蜂群算法优化模糊C-均值聚类中心的图像分割算法。实验结果表明,所提出的基于多链量子蜂群算法的模糊C-均值聚类图像分割算法是有效的,相对于传统模糊C-均值聚类算法及基于模糊的人工蜂群算法,所提算法在分割正确率、分割速度及鲁棒性上均更有效。  相似文献   

16.
模糊C均值聚类(FCM)和可能性模糊C均值聚类(PFCM)没有考虑样本特征项及每个样本对聚类的贡献程度,存在对噪声较敏感的问题。特征减少的模糊聚类算法FRFCM可剔除数据集中无效特征量,且考虑了剩余特征量的权重,具有更好的聚类性能。对此,在可能性模糊C均值聚类算法(PFCM)的基础上将其与FRFCM算法相结合,提出新的特征逐减的可能性模糊C均值聚类算法(FRPFCM)。该算法解决了PFCM算法参数依赖的问题,且在迭代过程中可自动淘汰无效特征项并更新各特征项对聚类的贡献程度。对人工数据集以及UCI数据集进行测试的结果表明,提出的FRPFCM算法可得到更高的聚类准确率,所需迭代次数更少,算法收敛速度更快。  相似文献   

17.
随着工业生产和工艺的进步,人们对产品的质量要求越来越高。为提高光缆表面瑕疵分割的效果,克服模糊C均值聚类算法对噪声敏感的不足,提出了一种新的模糊C均值聚类(FCM)的瑕疵图像分割方法。该方法一方面考虑样本的邻域像素信息,使FCM的隶属度函数中包含像素的邻域信息,另一个方面使用一种新的距离度量方式代替传统的欧式距离。利用以上两种方法来增加算法的鲁棒性,此外,通过直方图法给聚类中心赋初值,使分割效果稳定。最后,分别对CCD相机获取的光缆图像添加椒盐噪声和高斯白噪声,使用改进的FCM算法和传统的FCM算法、FCMM算法进行光缆表面瑕疵分割实验。图像和分割正确率的对比实验结果表明,使用改进的FCM算法能更好地克服噪声,精确地将瑕疵从图像上提取出来,瑕疵轮廓更为清晰,提高了光缆表面瑕疵检测的效果。  相似文献   

18.
针对FCM聚类算法容易陷入局部最优且对初始点很敏感的问题,提出基于搜索空间平滑技术的点密度加权FCM算法以获得最优解。以所得的聚类中心作为输入,再次执行FCM算法,对于隶属度小于阈值的数据样本进行检测;如果该数据样本被删除,目标函数值变化明显,则该数据样本为异常数据样本,并且聚类最后产生的小的簇中的数据样本也是异常数据样本。在KDDCUP99数据集上进行检测,实验结果表明该算法具有较高的检测率及较低的误检率。  相似文献   

19.
模糊C均值聚类算法是目前使用最广泛的模糊聚类算法,但是该算法也有其局限性,比如在迭代过程中对初始值非常敏感,极容易陷入局部极小值,以至于得不到最佳聚类结果。将粒子群优化算法应用到模糊C均值聚类算法中,提出一种基于混沌粒子群的模糊C均值聚类算法。它能够利用粒子群算法强大的全局寻优能力避免算法收敛于局部极值,最大程度上达到全局最佳聚类结果。为了避免粒子在迭代过程中停滞,该算法引入了混沌变量,以当前的全局最优位置来产生一个混沌序列,用混沌序列中拥有最优适应值的粒子随机代替当前粒子群中的一个粒子。将基于混沌粒子群的模糊C均值聚类算法应用于图像分割中,实验结果表明该算法能够有效地分割图像,并具有良好的鲁棒性和适应性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号