期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机科学与探索》2016,(2):230-247

针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。相似文献

2.

基于二阶模糊聚类算法的雷达目标距离像识别 总被引：1，自引：0，他引：1

彭翔周代英《计算机应用》2011,31(2):399-401

针对于模糊C-均值(FCM)算法敏感于聚类中心初始值的缺点,提出一种基于二阶模糊聚类方法。该方法利用传递闭包(TC)算法无初始化的优点,先对样本集按一定分类水平进行划分,选取若干类,求得这些类的样本均值作为FCM算法的初始聚类中心。一方面能够获得理想的聚类中心初始值,同时还能通过分类水平值来优化聚类中心数和聚类中心,避免局部最优,克服一致性聚类。利用该算法对三类飞机目标的实测一维距离像数据进行了识别实验,实验结果表明,基于二阶模糊聚类方法的识别率比FCM有了明显的改善。相似文献

3.

基于层次划分的密度优化聚类算法

逄琳刘方爱《计算机应用》2016,36(6):1634-1638

针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)。该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类。首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后,根据曲线的极值点对应的划分估计最佳聚类数和初始聚类中心。实验结果表明,所提CODHD算法与预处理阶段的聚类优化(COPS)算法相比,聚类准确度提高了30%,聚类算法效率至少提高14.24%。所提算法具有较强的可行性和实用性。相似文献

4.

FCM算法用于灰度图像分割的初始化方法的研究 总被引：1，自引：1，他引：1

匡泰朱清新孙跃《计算机应用》2006,26(4):784-786

模糊C均值聚类(FCM)算法是一种经典的模糊聚类分析方法，但其算法初始聚类中心集是随机选取的，从而造成算法的性能强烈的依赖聚类中心集的初始化。提出了一种改进的基于多项式求解的FCM(PFCM)算法，该算法基于求解多项式的根来确定数据集初始聚类中心集，很好地解决了数据初始聚类中心集问题，使数据初始聚类中心集代表了数据集类别的特征，在此基础上，采用FCM算法得到聚类中心集的近似最优解。相似文献

5.

一种基于核的快速可能性聚类算法 总被引：1，自引：1，他引：0

下载免费PDF全文

韩旭东夏士雄刘兵周勇《计算机工程与应用》2011,47(6):176-180

传统的快速聚类算法大多基于模糊C均值算法（Fuzzy C-means,FCM）,而FCM对初始聚类中心敏感,对噪音数据敏感并且容易收敛到局部极小值,因而聚类准确率不高。可能性C-均值聚类较好地解决了FCM对噪声敏感的问题,但容易产生一致性聚类。将FCM和可能性C-均值聚类结合的聚类算法较好地解决了一致性聚类问题。为进一步提高算法收敛速度和鲁棒性,提出一种基于核的快速可能性聚类算法。该方法引入核聚类的思想,同时使用样本方差对目标函数中参数η进行优化。标准数据集和人造数据集的实验结果表明这种基于核的快速可能性聚类算法提高了算法的聚类准确率,加快了收敛速度。相似文献

6.

模糊C-均值聚类算法的优化

熊拥军刘卫国欧鹏杰《计算机工程与应用》2015,51(11):124-128

针对传统模糊C-均值聚类算法（FCM算法）初始聚类中心选择的随机性和距离向量公式应用的局限性,提出一种基于密度和马氏距离优化的模糊C-均值聚类算法（Fuzzy C-Means Based on Mahalanobis and Density,FCMBMD算法）。该算法通过计算样本点的密度来确定初始聚类中心,避免了初始聚类中心随机选取而产生的聚类结果的不稳定;采用马氏距离计算样本集的相似度,以满足不同度量单位数据的要求。实验结果表明,FCMBMD算法在聚类中心、收敛速度、迭代次数以及准确率等方面具有良好的效果。相似文献

7.

新的K-均值算法最佳聚类数确定方法 总被引：8，自引：0，他引：8

下载免费PDF全文

周世兵徐振源唐旭清《计算机工程与应用》2010,46(16):27-31

K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。相似文献

8.

云环境下基于Canopy聚类的FCM算法研究

余长俊张燃《计算机科学》2014,41(Z2)

FCM算法是目前广泛使用的算法之一。,针对FCM聚类质量和收敛速度依赖于初始聚类中心的问题,结合Canopy聚类算法能够粗略快速地对数据集进行聚类的优点,提出了一种基于Canopy聚类的FCM算法。该算法通过将Canopy算法快速获取到的聚类中心作为FCM算法的输入来加快FCM算法收敛速度。并在云环境下设计了其MapReduce化方案,实验结果表明,MapReduce化的基于Canopy聚类的FCM算法比MapReduce化的FCM聚类算法具有更好的聚类质量和运行速度。相似文献

9.

基于核密度估计的K-CFSFDP聚类算法

董晓君程春玲《计算机科学》2018,45(11):244-248

快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依赖于数据集的密度估计和截断距离(dc)的人为选择问题,提出一种基于核密度估计的K-CFSFDP算法。该算法利用无参的核密度估计分析数据点的分布特征并自适应地选取dc,从而搜索和发现数据点的密度峰值,并以峰值点数据作为初始聚类中心。基于4个典型数据集的仿真结果表明,K-CFSFDP算法比CFSFDP,K-means和DBSCAN算法具有更高的准确度和更强的鲁棒性。相似文献

10.

面向混合属性数据集的改进半监督FCM聚类方法 总被引：1，自引：0，他引：1

李晓庆唐昊司加胜苗刚中《自动化学报》2018,44(12):2259-2268

针对混合属性数据集聚类精度低的问题,本文提出一种基于改进距离度量的半监督模糊均值聚类（Fuzzy C-means,FCM）算法.首先,在数据集中针对类别属性进行预处理,并设置相应的相异度阈值;将传统聚类距离度量与改进的Jaccard距离度量结合,确定混合属性数据集的距离度量函数;最后,将所得距离度量函数与传统半监督FCM算法相结合,并在滚动轴承的不同复合故障数据的特征集中进行聚类.实验表明,该算法能在含无序属性的混合属性数据集的聚类中取得更好的聚类效果. 相似文献

11.

基于距离和权重改进的K-means算法

下载免费PDF全文

王子龙李进宋亚飞《计算机工程与应用》2020,56(23):87-94

K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用维度加权的欧氏距离来度量样本点之间的远近,计算出所有样本的密度和权重后,令密度最大的点作为第一个初始聚类中心,并剔除该簇内所有样本,然后依次根据上一个聚类中心和数据集中剩下样本点的权重并通过引入的参数[τi]找出下一个初始聚类中心,不断重复此过程直至数据集为空,最后自动得到[k]个初始聚类中心。在UCI数据集上进行测试,对比经典K-means算法、WK-means算法、ZK-means算法和DCK-means算法,基于距离和权重改进的K-means算法的聚类效果更好。相似文献

12.

基于特征散度的自适应FCM图像分割算法 总被引：4，自引：0，他引：4

下载免费PDF全文

王向阳王春花《中国图象图形学报》2008,13(5):906-910

图像分割是模式识别、图像理解、计算机视觉等领域的重要研究内容。基于模糊C均值聚类(FCM)的图像分割是应用较为广泛的方法之一,但其存在距离测度鲁棒性差、需预先给出初始聚类数目、未考虑图像局部相关特性等问题。为克服上述缺点,通过引入特征散度进行距离测度,并结合聚类有效性指数自适应确定初始聚类数目和根据Laws纹理测度提取图像特征等措施,提出了一种新的FCM图像分割算法。实验结果表明,该新算法可以有效地提高图像的分割效果(特别是纹理图像),其分割结果优于现有FCM图像分割方案。相似文献

13.

基于量子粒子群优化的改进的模糊C-均值聚类算法

汤官宝《数字社区&智能家居》2014,(5):3084-3087

模糊C均值算法（FCM）是一种用于聚类的最流行的技术。不过,传统的FCM使用欧氏距离作为数据集的相似准则,从而导致数据集的划分有相等的趋势。而数据集的形状和簇的密度对聚类性能有高度影响。为了解决这个问题,提出基于簇密度的距离调节因子以修正相似性度量。同时,针对模糊C-均值（FCM）聚类算法对初始聚类中心选择敏感,易陷入局部最优的问题,采用量子粒子群优化算法以获取全局最优解。仿真实验证明,改进的聚类算法（QPSO-FCM-CD）具有良好的性能。相似文献

14.

基于连通距离和连通强度的BIRCH改进算法

樊仲欣王兴苗春生《计算机应用》2019,39(4):1027-1031

为解决利用层次方法的平衡迭代规约和聚类（BIRCH）算法聚类结果依赖于数据对象的添加顺序，且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题，提出一种改进的BIRCH算法。该算法用描述数据对象个体间连通性的连通距离和连通强度阈值替代簇直径阈值，还将簇合并的步骤加入到聚类特征树的生成过程中。在自定义及iris、wine、pendigits数据集上的实验结果表明，该算法比多阈值BIRCH、密度改进BIRCH等现有改进算法的聚类准确率更高，尤其在大数据集上比密度改进BIRCH准确率提高6个百分点，耗时降低61%。说明该算法能够适用于在线实时增量数据，可以识别非球形簇和体积不均匀簇，具有去噪功能，且时间和空间复杂度明显降低。相似文献

15.

基于加权改进模糊C均值聚类的欠定混合矩阵估计

孙建军徐岩《计算机应用》2020,40(6):1769-1773

语音欠定混合矩阵估计问题中，针对模糊C均值聚类(FCM)算法对初始聚类中心敏感、易受噪声点干扰、鲁棒性差的缺陷，提出一种基于加权的进化规划与FCM相结合的改进算法(WE-FCM)。首先，利用进化规划(EP)算法强大的搜索能力优化FCM得到基于进化规划的FCM算法(EP-FCM)，以获得较佳的初始聚类中心；然后，利用局部离群点检测(LOF)算法对EP-FCM加权以降低噪声点的影响。通过仿真实验得出，所提算法在源信号数为3路和4路时归一化均方误差值与偏离角度值均远小于经典的K均值聚类(K-means)算法、K-Hough、基于遗传算法的FCM算法(GAFCM)和基于密度峰值的FCM算法(FDP-FCM)。实验结果表明，所提算法明显提高了FCM算法的鲁棒性和混合矩阵的估计精度。相似文献

16.

优化初始聚类中心的K-means聚类算法 总被引：1，自引：0，他引：1

下载免费PDF全文

郭永坤章新友刘莉萍丁亮牛晓录《计算机工程与应用》2020,56(15):172-178

针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于[α]（[α]为样本集数据点数目与聚类的簇类数目的比值）,再把该集合从样本集中删除,重复以上步骤得到K（K为簇类数目）个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。相似文献

17.

基于可拓距的改进k-means聚类算法

下载免费PDF全文

赵燕伟朱芬桂方志任设东谢智伟徐晨《智能系统学报》2020,15(2):344-351

针对现有聚类算法在初始聚类中心优化过程中存在首个初始聚类中心点落于边界非密集区域的不足,导致出现算法聚类效果不均衡问题,提出一种基于可拓距优选初始聚类中心的改进k-means算法。将样本经典距离向可拓区间映射,并通过可拓侧距计算方法得到可拓左侧距及可拓右侧距;引入平均可拓侧距概念,将平均可拓左侧距和平均可拓右侧距分别作为样本密集度和聚类中心疏远度的量化指标;在此基础上,给出初始聚类中心选取准则。通过与传统k-means聚类算法进行对比,结果表明改进后的k-means聚类算法选取的初始聚类中心分布更加均匀,聚类效果更好,尤其在对高维数据聚类时具有更高的聚类准确率和更好的均衡性。相似文献

18.

基于密度的改进K均值算法及实现 总被引：4，自引：1，他引：3

傅德胜周辰《计算机应用》2011,31(2):432-434

传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消除对初始聚类中心的依赖,聚类结果有了较大的改进。相似文献

19.

结合蚁群聚类算法的模糊C均值聚类

周峰李龙澍《微机发展》2012,(7):45-48

模糊C均值（FCM）聚类算法采取随机选取聚类中心的方法,这种方法使得FCM算法在局部范围内容易获得最优解,但在全局范围内效果较差,且FCM算法中聚类簇的个数一般需要人为设定。面对上述种种问题,文中将蚁群聚类算法和FCM聚类算法进行结合,获得了一种改进的FCM聚类算法。该算法在初步聚类中利用蚁群聚类产生聚类中心和簇的个数,将产生的聚类中心提供给FCM算法进行再次聚类。利用蚁群聚类的全局搜索和并行运算的优点避免了聚类易陷入局部最优解的缺陷。经过实验验证,该算法较一般FCM算法具有更好的性能。相似文献