共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
尚秋明 《电子技术与软件工程》2021,(4):164-165
本文为了研究K-means算法在互联网有害信息挖掘中应用价值。首先分析了K-means算法核心原理,该算法是将相似的数据分类聚集在一起。其次研究了K-means算法在舆情监管中应用,结果表明K-means算法应用到舆情监测领域比较广,但是需要解决K-means算法局部最优问题。最后分析了K-means算法在互联网有害信息监管应用,拓展了K-means算法应用领域。 相似文献
5.
一种改进的特征加权K-means聚类算法 总被引:4,自引:0,他引:4
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据. 相似文献
6.
基于CHAMELEON算法构建自适应网站研究 总被引:2,自引:0,他引:2
本文把CHAMELEON算法应用于自适应网站的设计中,通过对算法的分析具体给出了算法在聚类过程中的实现细节,并按数据挖掘的过程对自适应Web站点设计中的关键问题进行了研究。经试验验证.效果明显优于其它算法。 相似文献
7.
在传统的K-means聚类算法基础上提出了一种基于均方差属性加权的MWS-K-means算法.引入特征权重以提高聚类结果的类内相似度(intra-similarities),从而提高聚类精度.考虑到K-means算法采用误差平方和作为聚类准则函数, 而误差平方和与概率论中数字特征的基本描述方法--均方差具有较高相似性,算法中特征权重的计算采用均方差法.根据属性的离散程度对欧氏距离进行加权处理,从而用相对距离代替绝对距离来计算类间相似度.实验结果表明:MWS-K-means算法在聚类精度方面优于标准的K-means算法. 相似文献
8.
《现代电子技术》2018,(10):164-168
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。 相似文献
9.
文章提出了一种基于改进SVD++算法和K-means++算法的小文件合并方案。通过引入自适应学习率函数和基于并行分组的SVD++算法,优化了小文件的合并过程,以提高Hadoop存储小文件的效率。同时,利用K-means++算法对合并后的文件进行聚类,优化了数据存储方式,降低了存储空间的浪费。在Hadoop平台上进行的实验表明,该方案在保持数据处理准确性和稳定性的同时,显著提升了Hadoop存储与处理小文件的性能。 相似文献
10.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。 相似文献
11.
12.
针对机器学习中聚类算法参数多样调参复杂的问题,分析了基于PSO算法在机器学习参数组合寻优方面的可行性,设计了一种基于PSO算法的K-means机器学习聚类算法的参数寻优策略。通过PSO算法找到模型最佳的参数组合,提高K-means机器学习模型的性能。通过对算法调优策略进行测试结果表明,使用PSO算法对K-means机器学习聚类算法进行参数调优,不仅能够找到适于该数据的最佳参数组合提高聚类算法的性能,也可以减少经验调参所带来的误差和成本。 相似文献
13.
基于划分的K-均值初始聚类中心优化算法 总被引:8,自引:2,他引:6
提出了一种新的初始化K-means的聚类算法,该算法通过区域划分方法估算出K个中心点作为初始聚类中心,从初始聚类中心出发,应用K-means聚类算法,得到聚类结果,实验表明,该算法能产生高质量的聚类结果、较少的迭代次数,优于K-means算法中传统的聚类中心初始化算法. 相似文献
14.
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足的问题,提出一种基于Hadoop的改进灰狼优化K-means的IGWO-KM算法.首先,该算法将灰狼优化算法和K-means算法相结合,利用灰狼优化算法收敛速度快和可全局寻优的优势为K-means搜索最佳聚类中心,减小随机选取初始中心点而导致的聚类结果不稳定性,以获取更好的聚类结果.其次,使用非线性收敛因子改进灰狼优化算法,协调算法的全局和局部的搜索能力.然后,引入正弦余弦算法并进行改进,增强灰狼优化算法的全局搜索能力,优化寻优精度和收敛速度,避免陷入局部最优.之后,使用近邻空间球减少K-means聚类过程中冗余的距离计算加快算法收敛.最后,利用Hadoop集群可批量处理数据的特性,实现算法的并行化.实验结果表明,IGWO-KM算法具有更好的寻优精度和稳定性,相比于GWO-KM算法和K-means,该算法在查准率、召回率和F值均有明显提高,且具有良好的收敛速度和拓展性. 相似文献
15.
16.
17.
18.
林龙成 《电子技术与软件工程》2020,(1):111-112
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。 相似文献
19.
本文对传统的K-means聚类算法进行了深入的分析研究,发现了算法当中的一些缺陷和漏洞,并且找出可以改进K-means聚类算法的方法,使聚类分析的结果更具有实际意义,保证了聚类结果的高质量。 相似文献
20.
K-means++算法是近年来发展起来的一种聚类分析方法,解决了经典K-means算法的初始聚类中心随意确定的问题,在一定程度上提高了收敛速度.本文针对K值难以确定的问题,采用拐肘法、轮廓系数法和CH指标法联合确定K值,从而优化了 K-means++算法,并用于地震地磁数据聚类分析中.计算结果表明,优化后的K-means++聚类算法,能够较好地发现离群点,并与发生的地震对应,明显优于经典K-means算法,对于地震监测预报工作具有重要的现实意义. 相似文献