期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李家成苏一丹覃华吴丹《计算机技术与发展》2013,(9)

K调和均值算法(KHM)用数据点与所有聚类中心的距离的调和平均值替代了数据点与聚类中心的最小距离,是一种对初始值不敏感、收敛速度快的有效聚类算法,但它容易陷入局部最小值。而遗传算法具有良好的全局优化能力。文中结合了KHM和遗传算法各自的优点,采用KHM计算每一代种群的聚类中心,并构造适应度函数,通过遗传算法进行一系列择优操作,成功地解决了KHM容易陷入局部最小值的问题。实验结果表明,所提出的算法不仅优化了聚类中心,而且还改善了聚类质量。相似文献

2.

基于遗传算法的K调和均值聚类算法

李家成苏一丹覃华吴丹《微机发展》2013,(9):55-58

K调和均值算法(KHM)用数据点与所有聚类中心的距离的调和平均值替代了数据点与聚类中心的最小距离,是一种对初始值不敏感、收敛速度快的有效聚类算法,但它容易陷入局部最小值。而遗传算法具有良好的全局优化能力。文中结合了KHM和遗传算法各自的优点,采用KHM计算每一代种群的聚类中心,并构造适应度函数,通过遗传算法进行一系列择优操作,成功地解决了KHM容易陷入局部最小值的问题。实验结果表明,所提出的算法不仅优化了聚类中心,而且还改善了聚类质量。相似文献

3.

一种改进的模糊C-均值聚类算法 总被引：1，自引：0，他引：1

李柏年《计算机应用与软件》2008,25(6):98-99

模糊C-均值聚类是一种经典的聚类方法.针对模糊C-均值算法对初始值敏感、收敛结果易陷入局部极小的问题,通过对原始数据的预处理,将欧氏距离推广到广义欧氏距离,得到了加权模糊C-均值聚类的迭代公式,实证分析表明改进后的方法得到的分类结果与嵌入遗传算法的分类基本一致,而且通过非参数检验证实分类效果良好. 相似文献

4.

基于模拟退火与K均值聚类的入侵检测算法 总被引：4，自引：0，他引：4

胡艳维秦拯张忠志《计算机科学》2010,37(6):122-124

K均值聚类算法时初始值的选取依赖性极大,易陷入局部极值.为此,结合模拟退火算法和K均值聚类思想,提出一种新的入侵检测方案.算法利用模拟退火算法时聚类分析中的聚类准则进行优化,以获得全局最优解,并进一步开拓模拟退火算法的并行性以加快算法收敛速度.在KDD CUP 1999上进行了仿真测试,实验结果表明该方案优于基于K均值聚类的入侵检测算法,有较低的误检率与虚警率. 相似文献

5.

基于犹豫模糊Canopy-K均值聚类算法的研究与应用

张子璇沙秀艳肖霏粟宝婵隋雨陆孟子宸《计算机与现代化》2022,(11):17-21

针对传统K均值聚类算法对初始值敏感、易陷入局部极值点,导致数据分类结果不理想的问题,本文提出一种基于犹豫模糊Canopy-K均值聚类算法。首先利用Canopy算法对原始数据进行初步分类,形成多个数据重合的Canopy中心集合,即得到K均值算法的初始聚类中心。然后再利用K均值聚类算法进行聚类,得到最终的聚类结果。最后结合疫情后复工复产企业评价信息数据进行实例分析,从6个方面对复工复产的5个企业发展情况进行评估。将新提出的算法和基于层次分析的K均值聚类算法进行对比分析。结果表明,新提出的方法较大地减少了迭代次数,聚类结果更加合理、稳定和有效。相似文献

6.

一种新的聚类算法--粒子群聚类算法 总被引：12，自引：0，他引：12

刘靖明韩丽川侯立文《计算机工程与应用》2005,41(20):183-185

在分析K均值聚类算法存在不足的基础上,该文提出了一种新的聚类算法:基于粒子群的K均值聚类算法。实验结果证明,该算法有很好的全局收敛性,不仅有效地克服了传统的k均值算法易陷入局部极小值和对初始值敏感的问题,而且具有较快的收敛速度。相似文献

7.

基于遗传算法的一种改进的K-均值聚类算法

张春凯王丽君《计算机工程与应用》2012,48(26):144-147

传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值.将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的.同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度. 相似文献

8.

基于均值与最大距离乘积的初始聚类中心优化 K-means 算法*

段桂芹《计算机与数字工程》2015,(3):379-382

针对K‐means算法随机选择初始聚类中心所出现的样本聚类结果随机性强、稳定性低、容易陷入局部最优和得不到全局最优解等问题,提出一种基于均值与最大距离乘积的初始聚类中心优化K‐means算法。该算法首先选择距离样本集均值最远的数据对象加入聚类中心集合,再依次将与样本集均值和当前聚类中心乘积最大的数据对象加入聚类中心集合。标准数据集上的实验结果表明,与原始K‐means的算法以及另一种改进算法相比,新提出的聚类算法具有更高的准确率。相似文献

9.

基于模糊K-调和均值的单词-文档谱聚类方法

刘娜肖智博鲁明羽《控制与决策》2012,27(4):501-506

在分析单词-文档谱聚类方法的基本步骤,找出其对初始值敏感的根本原因的基础上,提出一种基于模糊-调和均值的单词-文档谱聚类方法.首先从矩阵相似的角度对谱聚类中的Laplacian矩阵进行处理,使其满足对初始值不敏感的条件;然后通过加入模糊的概念,用模糊K-调和均值算法代替K-均值算法,使聚类结果对初始值不敏感.实验结果表明,所提出的方法不仅使聚类结果对初始值不敏感,而且在一定程度上提高了数据的鲁棒性. 相似文献

10.

基于粒群优化的K均值算法及其应用 总被引：3，自引：0，他引：3

宋凌李枚毅李孝源《计算机工程》2008,34(16):201-203

针对K均值聚类算法依赖于初始值的选择,且容易收敛于局部极值的缺点,提出一种基于粒群优化的K均值算法。利用粒群优化指导K均值算法的初始值选择,使其容易收敛到全局极值。将该算法应用到入侵检测中,实验结果表明该算法聚类效果好、收敛快、容易实现。相似文献

11.

最优聚类个数和初始聚类中心点选取算法研究 总被引：2，自引：0，他引：2

张素洁赵怀慈《计算机应用研究》2017,34(6)

传统k-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。本文基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集,其次聚类中心点之间距离相对较远的选取原则用来选取初始聚类中心点,避免初始聚类中心点集中在一个小的范围,防止陷入局部最优。试验证明,本文能选取最优的k值,通过用标准的 UCI数据库进行试验,本文采用的算法能选择出唯一的初始中心点,聚类准确率较高,误差平方和较小。相似文献

12.

改进K-means聚类算法行驶工况及油耗研究

苏小会张玉西徐淑萍尚煜《计算机工程与科学》2021,42(11):2020-2026

为解决传统聚类算法初始中心易陷入局部最优、耗时长的问题，提出一种改进的K-means聚类优化算法。该算法引入最大最小距离和加权欧氏距离，从剩余聚类点距离均值和出发，避免孤立点和边缘数据的影响。利用比重法对主成分进行改进，以由此获得的特征影响因子作为初始特征权重，构建一种加权欧氏距离度量。根据特征贡献率对聚类的影响，筛选具有代表性的特征因子凸显聚类效果，最终合成汽车行驶工况，分析瞬时油耗。结果表明，所提算法构建行驶工况的速度-加速度联合分布差异值仅为105%，比传统K-means聚类省时44.2%，行驶工况拟合度较高，能反映实际车辆的运行特征及油耗。相似文献

13.

基于最大最小距离和动态隧道的聚类算法 总被引：2，自引：0，他引：2

吕佳《计算机工程与设计》2010,31(8)

针对K-means聚类算法对初值敏感和易陷入局部最小值的缺陷,提出了一种基于最大最小距离和动态隧道的聚类算法.该算法首先利用最大最小距离法来优选初始聚类中心以避免由于聚类中心过于随机而导致其分布较为集中的情形,以提高划分初始数据集的效率.动态隧道法具有全局寻优能力,利用钻隧过程可跳出局部极小点得到更小值点,再由K-means聚类算法对其迭代优化,如此反复直至得到全局极值.实验结果表明了该算法的可行性和有效性. 相似文献

14.

K-Harmonic means type clustering algorithm for mixed datasets

《Applied Soft Computing》2016

K-means type clustering algorithms for mixed data that consists of numeric and categorical attributes suffer from cluster center initialization problem. The final clustering results depend upon the initial cluster centers. Random cluster center initialization is a popular initialization technique. However, clustering results are not consistent with different cluster center initializations. K-Harmonic means clustering algorithm tries to overcome this problem for pure numeric data. In this paper, we extend the K-Harmonic means clustering algorithm for mixed datasets. We propose a definition for a cluster center and a distance measure. These cluster centers and the distance measure are used with the cost function of K-Harmonic means clustering algorithm in the proposed algorithm. Experiments were carried out with pure categorical datasets and mixed datasets. Results suggest that the proposed clustering algorithm is quite insensitive to the cluster center initialization problem. Comparative studies with other clustering algorithms show that the proposed algorithm produce better clustering results. 相似文献

15.

一种基于大密度区域的模糊聚类算法 总被引：1，自引：0，他引：1

李鑫张继福蔡江辉《小型微型计算机系统》2012,33(6):1310-1315

针对模糊C-均值(FCM)算法对初始聚类中心和噪声数据敏感的缺陷,提出一种基于大密度区域的模糊聚类算法.该算法首先利用大密度区域以及样本的密度值变化方法,选取初始聚类中心以及候选初始聚类中心,并依据初始聚类中心与候选初始聚类中心的距离,确定初始聚类中心点,从而有效的克服了随机给定初始聚类中心容易使算法收敛到局部极小的缺陷;其次,分别利用密度函数为样本加权和引用改进的隶属度函数进行优化,有效地提高了模糊聚类的抗噪性;最后实验验证了算法在初始聚类中心的确定,聚类效果和抗噪性方面具有良好的效果. 相似文献

16.

基于密度敏感距离的改进模糊C均值聚类算法

王治和王淑艳杜辉《计算机工程》2021,47(5):88-96,103

模糊C均值（FCM）聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征。提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法。通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题。在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数。基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度。相似文献

17.

粒子群模糊聚类算法在入侵检测中的研究

李锋《微机发展》2014,(12):138-141

目前模糊C均值聚类算法广泛应用于入侵检测算法中,但是存在聚类数目难以确定,目标函数的局部极小点使得算法容易陷入局部最优的现象,影响入侵检测的准确率。鉴于此,文中提出一种基于粒子群算法的模糊聚类算法,引入PSO全局搜索能力和粒子翻转变异操作,避免传统C均值聚类算法对孤立点敏感,容易陷入局部最优,过早收敛的问题。最后通过实验结果表明,新算法检测率明显优于C均值聚类算法,能很好地应用于目前入侵检测系统之中。相似文献

18.

半监督的改进K-均值聚类算法 总被引：4，自引：1，他引：3

下载免费PDF全文

汪军王传玉周鸣争《计算机工程与应用》2009,45(28):137-139

K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心。在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性。相似文献

19.

一种基于核的快速可能性聚类算法 总被引：1，自引：1，他引：0

下载免费PDF全文

韩旭东夏士雄刘兵周勇《计算机工程与应用》2011,47(6):176-180

传统的快速聚类算法大多基于模糊C均值算法（Fuzzy C-means,FCM）,而FCM对初始聚类中心敏感,对噪音数据敏感并且容易收敛到局部极小值,因而聚类准确率不高。可能性C-均值聚类较好地解决了FCM对噪声敏感的问题,但容易产生一致性聚类。将FCM和可能性C-均值聚类结合的聚类算法较好地解决了一致性聚类问题。为进一步提高算法收敛速度和鲁棒性,提出一种基于核的快速可能性聚类算法。该方法引入核聚类的思想,同时使用样本方差对目标函数中参数η进行优化。标准数据集和人造数据集的实验结果表明这种基于核的快速可能性聚类算法提高了算法的聚类准确率,加快了收敛速度。相似文献

20.

改进的模糊C-均值聚类算法 总被引：3，自引：1，他引：2

下载免费PDF全文

关庆邓赵红王士同《计算机工程与应用》2011,47(10):27-29

为了克服模糊C-均值（FCM）聚类算法易陷入局部极小值和对初始值敏感的缺点,提出了一种基于改进量子蚁群的模糊聚类算法。将量子计算原理和蚁群算法相结合来改进FCM算法。初期采用量子遗传算法生成信息素分布,后期利用蚁群算法的全局搜索性、并行计算性等特点避免聚类陷入局部最优解。实验证明该算法保证了种群的多样性,有较好的全局收敛性,克服了模糊C-均值聚类算法的不足,能有效解决未成熟收敛的问题,使聚类问题最终快速、有效地收敛到全局最优解。相似文献