首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
科学、准确的用户用电特征分析对掌握负荷发展变化规律,提高电力需求预测的准确性,保障系统规划和经济运行具有重要意义。文中在对K-means算法深入研究的基础上,结合电力负荷数据海量、多维等特点,通过归一化处理,异常数据剔除,改进的二分K-means算法进行自聚类,对各优化算法进行分析,克服了传统K-means算法对异常数据敏感和初始聚类中心的随机性问题。实验结果表明,优化的自聚类算法能够提高分类的准确性,提高收敛效率,实现用户数据特征自动辨识分类。  相似文献   

2.
为了解决公共自行车调度过程中调度路径过长的问题,文章提出了一种改进的K-means聚类算法。该算法通过数据分析估算出k个中心点作为初始中心点,在一次K-means算法聚类划分后,引进调度需求量参数,将边缘站点做二次K-means算法,得到新的区域划分结果。实例分析表明,该算法有良好的全局收敛性,能有效地改善调度路径过长,调度效率低下等问题。  相似文献   

3.
聚类分析技术是数据挖掘中一个重要的分析手段,聚类结果要求数据组内的对象相似性较高,数据组对象之间的相似性较低。到目前为止,有各种各样的聚类算法,其中K-means算法最为广泛,它是采用误差平方和准则函数作为聚类准则函数。但是K-means算法也有不足之处,比如k值无法确定,时间开销很大等。针对这些缺点,文章提出了一种改进的基于K-means的信息聚类算法研究。  相似文献   

4.
本文为了研究K-means算法在互联网有害信息挖掘中应用价值。首先分析了K-means算法核心原理,该算法是将相似的数据分类聚集在一起。其次研究了K-means算法在舆情监管中应用,结果表明K-means算法应用到舆情监测领域比较广,但是需要解决K-means算法局部最优问题。最后分析了K-means算法在互联网有害信息监管应用,拓展了K-means算法应用领域。  相似文献   

5.
一种改进的特征加权K-means聚类算法   总被引:4,自引:0,他引:4  
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据.  相似文献   

6.
基于CHAMELEON算法构建自适应网站研究   总被引:2,自引:0,他引:2  
本文把CHAMELEON算法应用于自适应网站的设计中,通过对算法的分析具体给出了算法在聚类过程中的实现细节,并按数据挖掘的过程对自适应Web站点设计中的关键问题进行了研究。经试验验证.效果明显优于其它算法。  相似文献   

7.
在传统的K-means聚类算法基础上提出了一种基于均方差属性加权的MWS-K-means算法.引入特征权重以提高聚类结果的类内相似度(intra-similarities),从而提高聚类精度.考虑到K-means算法采用误差平方和作为聚类准则函数, 而误差平方和与概率论中数字特征的基本描述方法--均方差具有较高相似性,算法中特征权重的计算采用均方差法.根据属性的离散程度对欧氏距离进行加权处理,从而用相对距离代替绝对距离来计算类间相似度.实验结果表明:MWS-K-means算法在聚类精度方面优于标准的K-means算法.  相似文献   

8.
《现代电子技术》2018,(10):164-168
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。  相似文献   

9.
文章提出了一种基于改进SVD++算法和K-means++算法的小文件合并方案。通过引入自适应学习率函数和基于并行分组的SVD++算法,优化了小文件的合并过程,以提高Hadoop存储小文件的效率。同时,利用K-means++算法对合并后的文件进行聚类,优化了数据存储方式,降低了存储空间的浪费。在Hadoop平台上进行的实验表明,该方案在保持数据处理准确性和稳定性的同时,显著提升了Hadoop存储与处理小文件的性能。  相似文献   

10.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

11.
《现代电子技术》2019,(7):32-34
为了提高档案馆信息管理系统进行统计及分析的效率,提出一种基于数据挖掘技术的档案馆信息快速分析算法。对档案馆信息数据挖掘的工作流程进行阐述。分析典型K-means性,并采用熵加权对典型K-means及运行效率较高,从而在更深层次上发挥档案信息的作用。  相似文献   

12.
针对机器学习中聚类算法参数多样调参复杂的问题,分析了基于PSO算法在机器学习参数组合寻优方面的可行性,设计了一种基于PSO算法的K-means机器学习聚类算法的参数寻优策略。通过PSO算法找到模型最佳的参数组合,提高K-means机器学习模型的性能。通过对算法调优策略进行测试结果表明,使用PSO算法对K-means机器学习聚类算法进行参数调优,不仅能够找到适于该数据的最佳参数组合提高聚类算法的性能,也可以减少经验调参所带来的误差和成本。  相似文献   

13.
基于划分的K-均值初始聚类中心优化算法   总被引:8,自引:2,他引:6  
提出了一种新的初始化K-means的聚类算法,该算法通过区域划分方法估算出K个中心点作为初始聚类中心,从初始聚类中心出发,应用K-means聚类算法,得到聚类结果,实验表明,该算法能产生高质量的聚类结果、较少的迭代次数,优于K-means算法中传统的聚类中心初始化算法.  相似文献   

14.
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足的问题,提出一种基于Hadoop的改进灰狼优化K-means的IGWO-KM算法.首先,该算法将灰狼优化算法和K-means算法相结合,利用灰狼优化算法收敛速度快和可全局寻优的优势为K-means搜索最佳聚类中心,减小随机选取初始中心点而导致的聚类结果不稳定性,以获取更好的聚类结果.其次,使用非线性收敛因子改进灰狼优化算法,协调算法的全局和局部的搜索能力.然后,引入正弦余弦算法并进行改进,增强灰狼优化算法的全局搜索能力,优化寻优精度和收敛速度,避免陷入局部最优.之后,使用近邻空间球减少K-means聚类过程中冗余的距离计算加快算法收敛.最后,利用Hadoop集群可批量处理数据的特性,实现算法的并行化.实验结果表明,IGWO-KM算法具有更好的寻优精度和稳定性,相比于GWO-KM算法和K-means,该算法在查准率、召回率和F值均有明显提高,且具有良好的收敛速度和拓展性.  相似文献   

15.
《现代电子技术》2019,(8):145-150
针对传统K-means聚类算法对高维非线性数据聚类效果不佳、聚类时间消耗大的问题,文中对高维数据的预处理进行研究,提出一种基于深度信念网络(DBN)的K-means聚类算法(DBNOK)。此算法首先使用多层受限玻尔兹曼机(RBM)对数据进行特征学习,并将学习到的隐含特征进行K-means相关参数和初始聚类中心进行交叉迭代优化。用DBNOK算法分别在低维数据集和高维数据集上进行实验,结果表明,DB-NOK算法聚类准确率优于标准的K-means算法和模糊均值聚类(FCM)算法。  相似文献   

16.
K-means聚类算法研究综述   总被引:5,自引:0,他引:5  
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。  相似文献   

17.
《现代电子技术》2019,(7):177-180
为研究聚类算法在高校学生微博的应用情况,针对K-means算法和分层聚类算法在聚类中心选择不精确的问题,基于高校学生使用微博的背景,对微博文本挖掘应用中聚类算法的应用进行改进。通过文本的矢量表示、文本相似度计算和聚类算法的实现,验证了聚类算法在微博热门话题检测的准确性和效率,并针对实验数据提出几点针对性的措施。  相似文献   

18.
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。  相似文献   

19.
本文对传统的K-means聚类算法进行了深入的分析研究,发现了算法当中的一些缺陷和漏洞,并且找出可以改进K-means聚类算法的方法,使聚类分析的结果更具有实际意义,保证了聚类结果的高质量。  相似文献   

20.
K-means++算法是近年来发展起来的一种聚类分析方法,解决了经典K-means算法的初始聚类中心随意确定的问题,在一定程度上提高了收敛速度.本文针对K值难以确定的问题,采用拐肘法、轮廓系数法和CH指标法联合确定K值,从而优化了 K-means++算法,并用于地震地磁数据聚类分析中.计算结果表明,优化后的K-means++聚类算法,能够较好地发现离群点,并与发生的地震对应,明显优于经典K-means算法,对于地震监测预报工作具有重要的现实意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号