共查询到10条相似文献,搜索用时 15 毫秒
1.
石杰 《电子技术与软件工程》2023,(4):233-236
本文将介绍K-means算法的一般执行流程、云环境下K-means算法的实现、以及云环境下K-means算法的改进方法,还将从云计算环境下的数据挖掘算法、数据存储和管理技术、数据预处理技术、分类、聚类、关联规则挖掘和时序数据挖掘算法等方面进行探讨。 相似文献
2.
基于划分的数据挖掘K-means聚类算法分析 总被引:1,自引:0,他引:1
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 相似文献
3.
基于云计算的大数据聚类挖掘,需要结合改进粒子群算法、k-means算法的优势,提出基于改进粒子群优化(Particle Swarm Optimization,PSO)的k-means聚类算法,设置自调节惯性权重、云变异算子,根据数据集种群的进化程度,调整粒子群算法的全局搜索、局部搜索能力,追踪数据粒子的个体极值、全局极值,更新每个数据个体在解空间中的点位置、更新速度,并在数据种群进化到一定程度时进行变异操作,选择全局极值作为期望Ex来控制种群迭代次数,避免数据挖掘陷入早熟收敛、局部最优解的情况。 相似文献
4.
本文对传统蚂蚁聚类算法易出现早熟和收敛速度慢的问题,提出了基于改进K-means蚂蚁聚类算法,并将优化后的聚类算法与优化填充策略结合,对半失能老人远程健康监测缺失数据进行填充。仿真结果说明:改进K-means蚂蚁聚类算法的分类精度有所提高,基于改进K-means蚂蚁聚类的缺失数据填充算法的填充效果有所改善,可以有效填充半失能老人远程健康监测的缺失数据。 相似文献
5.
6.
随着信息技术、网络技术、云计算技术以及数据技术等多种技术的迅速发展,对于急速增长的数据量进行相应的分析与处理的要求也越来越高,数据挖掘便是其产物之一,在数据挖掘过程中,聚类算法则是挖掘领域中非常重要的手段和方法,因此,如何在云计算平台之下对聚类算法性能的提高有着非常重要的意义。 相似文献
7.
8.
9.
一种改进的特征加权K-means聚类算法 总被引:4,自引:0,他引:4
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据. 相似文献