首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
基于混合差分进化的滑动窗口数据流聚类算法研究   总被引:1,自引:0,他引:1  
针对传统的基于滑动窗口的数据流聚类算法存在的算法执行效率低、聚类质量较差等缺点,提出了一种基于混合差分进化的滑动窗口数据流聚类算法。该算法将数据流聚类过程分为两个部分:在线的时序窗口数据信息微簇特征向量生成和离线阶段的聚类优化。对在线生成的微簇进行微簇集合的更新与维护,利用改进的粒子群算法对离线的微簇数据信息进行适应度值的计算,将种群分为优势子种群和普通子种群,然后利用个体适应度值和平均适应度值的判别来生成当前个体环境的最优候选解,并迭代地对个体进行进化,输出具有最优适应度值的聚类集合,完成对数据流的聚类。仿真实验结果表明,算法在对数据流执行聚类时具有较高的执行效率,并且最后聚类的质量较好,算法实用性强。  相似文献   

2.
基于衰减滑动窗口数据流聚类算法研究   总被引:2,自引:0,他引:2  
朱琳  刘晓东  朱参世 《计算机工程与设计》2012,33(7):2659-2662,2796
数据流具有数据流量大、流量连续且快速、难以存储和恢复等特性,其挖掘质量和效率是检验挖掘算法的重要标准.传统的数据流聚类挖掘算法是基于界标窗口、滑动窗口和衰减窗口模型,其算法的聚类质量较差,时间复杂度高等不足,就此类问题,研究一种滑动衰减窗口的数据流聚类算法,并对算法进行了设计与实现,有效的改善传统数据流算法聚类质量和时间效率的问题.仿真实验结果表明了该算法的有效性,达到了较满意的效果.  相似文献   

3.
为了解决滑块窗口的数据流聚类算法中的聚类质量和算法执行效率问题,提出了基于微簇进化学习的数据流快速聚类算法.首先在在现阶段以时间滑块窗口的时间快照窗口周期为时间单位进行数据流粒度快照获取,并进行微簇的实时生成,依据微簇更新机制进行微簇维护;然后在离线阶段对微簇数据信息进行实时获取,利用改进的粒子群算法对数据进行聚类,根据粒子速度进行粒距划分和粒子权重系数的映射与调整,并计算粒子的适应度值;最后迭代地对粒子的局部极值和全局极值进行更新,输出聚类好的类别.实验证明改进算法具有较好的算法执行效率,并且有较优的负载能力.  相似文献   

4.
在数据流聚类算法中,滑动窗口技术可以及时淘汰历史元组、只关注近期元组,从而改善数据流的聚类效果。如果同时数据流流速无规律地随时间动态变化,原来单纯的滑动窗口技术在解决这类问题时存在缺陷,所以,在充分考虑了滑动窗口大小和数据流流速之间关系的前提下,提出了基于动态可调衰减滑动窗口的变速数据流聚类算法。该算法对历史元组和近期元组分别赋予一定的权重进行处理,然后依据数据流流速的不同函数改变窗口的大小,从而实现数据流的聚类。提出了该数据流聚类算法的数据结构——变异数据流聚类的数据结构。通过真实数据和模拟数据来构造动态变速数据流从而作为验证算法的原始数据。实验结果表明,与Clu Stream聚类算法相比,该方法具有较高的聚类质量、较小的内存开销和较少的聚类处理时间。  相似文献   

5.
在实际应用中,人们往往比较关心最近一段时间内数据流的分布状况.在传统的基于界标模型的聚类算法CluStream中,没有淘汰过期元组,不能准确反映当前数据流的数据分布状况.滑动窗口是数据流中一种关注近期数据的近似方法.为了提高对流数据聚类分析的质量及效率,对算法clustream进行了改进,采用滑动窗口来支持数据处理.为了减少聚类操作中每次迭代的计算次数,算法采用改进的k-means来执行聚类操作.优化后的算法能及时淘汰过期元组,同时对新到达的元组不断进行实时处理,可以获得更准确的分析结果.与聚类算法CluStream相比,优化算法可获得较小的内存开销和快速的数据处理能力,聚类结果更合理清晰.  相似文献   

6.
基于滑动窗口的流数据聚类算法研究   总被引:1,自引:1,他引:0  
为提高对进化数据流的聚类质量及效率,改进了基于滑动窗口的数据流聚类算法,采用聚类特征指数直方图来支持数据处理,减少了直方图结构的维护数,并在复杂度、聚类效果上得到了进一步改善.理论及验证表明,与传统基于界标模型的聚类算法相比,优化算法可获得较好的工作效率、较小的内存开销和快速的数据处理能力,拓展了数据流挖掘技术的应用领域.  相似文献   

7.
针对传统入侵检测系统难于适应日益增长数据量对实时处理能力的需求问题,运用滑动窗口、数据流聚类技术,设计了基于滑动窗口数据流聚类算法,并构建了基于该算法的IDS网络安全防御模型。通过对该模型仿真验证,证明该网络安全防御模型能较好地适应高速网络的入侵检测需求。  相似文献   

8.
把粒子群算法应用到多阈值图像分割中,结合已有的模糊C-均值聚类法提出了一种基于模糊技术的粒子群优化多阈值图像分割算法。FCM聚类算法是一种局部搜索算法,对初始值较为敏感,容易陷入局部极小值而不能得到全局最优解。PSO算法是一种基于群体的具有全局寻优能力的优化方法。将FCM聚类算法和PSO算法结合起来,将FCM聚类算法的聚类准则函数作为PSO算法中的粒子适应度函数。仿真实验表明新算法在最大熵评判准则下能够得到最优阈值。  相似文献   

9.
一种基于改进PSO的K—means优化聚类算法   总被引:1,自引:0,他引:1  
针对传统的K—means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K—means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等参数增强PSO算法的性能;利用群体适应度方差决定算法中前部分PSO算法和后部分K—means算法的转换时机;设置变量实时监控各个粒子和粒子群的最优值变化情况,及时地对出现早熟收敛的粒子进行变异操作,从而为K—means算法搜索到全局最优的初始聚类中心,使聚类结果不受初始聚类中心影响,易于获得全局最优解。实验结果表明文中提出的改进算法与传统聚类算法相比具有更高的聚类正确率、更好的聚类质量及全局搜索能力。  相似文献   

10.
基于粒子群优化的项聚类推荐算法   总被引:3,自引:2,他引:1       下载免费PDF全文
针对传统推荐算法的数据稀疏性问题和推荐准确性问题,提出基于粒子群优化的项聚类推荐算法。采用粒子群优化算法产生聚类中心,在此基础上搜索目标项目的最近邻居,并产生推荐,从而提高了传统聚类算法的推荐准确性及响应速度。实验表明改进的项聚类协同过滤算法能有效提高推荐精度。  相似文献   

11.
传统K-means算法对初始聚类中心选择较敏感, 结果有可能收敛于一般次优解, 为些提出一种结合双粒子群和K-means的混合文本聚类算法。设计了自调整惯性权值策略, 根据最优适应度值的变化率动态调整惯性权值。两子群分别采用基于不同惯性权值策略的粒子群算法进化, 子代间及子代与父代信息交流, 共享最优粒子, 替换最劣粒子, 完成进化, 该算法命名为双粒子群算法。将能平衡全局与局部搜索能力的双粒子群算法与高效的K-means算法结合, 每个粒子是一组聚类中心, 类内离散度之和的倒数是适应度函数, 用K-means算法优化新生粒子, 即为结合双粒子群和K-means的混合文本聚类算法。实验结果表明, 该算法相对于K-means、PSO等文本聚类算法具有更强鲁棒性, 聚类效果也有明显的改善。  相似文献   

12.
In this paper, we present a particle swarm optimizer (PSO) to solve the variable weighting problem in projected clustering of high-dimensional data. Many subspace clustering algorithms fail to yield good cluster quality because they do not employ an efficient search strategy. In this paper, we are interested in soft projected clustering. We design a suitable k-means objective weighting function, in which a change of variable weights is exponentially reflected. We also transform the original constrained variable weighting problem into a problem with bound constraints, using a normalized representation of variable weights, and we utilize a particle swarm optimizer to minimize the objective function in order to search for global optima to the variable weighting problem in clustering. Our experimental results on both synthetic and real data show that the proposed algorithm greatly improves cluster quality. In addition, the results of the new algorithm are much less dependent on the initial cluster centroids. In an application to text clustering, we show that the algorithm can be easily adapted to other similarity measures, such as the extended Jaccard coefficient for text data, and can be very effective.  相似文献   

13.
面向大数据集管理的数据聚类方法研究在模式识别、故障诊断和数据挖掘等领域具有重要的研究意义。传统的大数据聚类算法采用混合差分进化的粒子群算法,因数据信息流分量之间的交叉作用而出现的类间交叉项干扰影响了聚类分量的正确判断,聚类效果不好。提出了一种基于时频聚集交叉项干扰抑制的大数据聚类算法。在面向传播学视域下物联网大数据库中生成大数据聚类的信息特征向量,对任意两个分簇矢量进行近邻样本的隶属度训练,在时间滑动窗口模型中进行信息调度,采用高频分量抑制方法实现对时频聚集交叉项的干扰抑制,通过频域卷积相似度融合处理,采用粒子群优化算法进行聚类适应度计算,以实现数据聚类算法改进。仿真结果表明,采用该算法进行大数据聚类,具有较好的抗干扰性和自适应性,聚类准确度较高。  相似文献   

14.
一种基于聚类的小生境微粒群算法   总被引:6,自引:0,他引:6  
在小生境微粒群算法中引入一种简单的聚类算法,替换了原算法中依赖于圆形拓扑领域的小生境产生方法,构建出一种基于聚类的小生境微粒群算法.该算法在对主微粒群进行l best PSO寻优的同时对其中的微粒进行聚类,当聚类簇中的个体数目达到规定的子微粒群最小规模时形成一个小生境.用这种算法能够产生大小和形状不同的小生境,克服了NichePSO算法的不足.  相似文献   

15.
针对近邻传播(AP)算法中偏向参数与收敛系数对AP算法的聚类效果的局限性的问题,提出了一种基于粒子群的近邻传播算法(Pso—AP算法).通过将AP算法中的偏向参数与收敛系数作为粒子,然后使用粒子群算法来对其进行智能地调整,进而提高AP算法的聚类效果.实验结果表明,该算法能有效地解决偏向参数与收敛系数对AP算法的聚类效果局限性,提高了聚类效果与收敛精度.  相似文献   

16.
This paper presents selective regeneration particle swarm optimization (SRPSO), a novel algorithm developed based on particle swarm optimization (PSO). It contains two new features, unbalanced parameter setting and particle regeneration operation. The unbalanced parameter setting enables fast convergence of the algorithm and the particle regeneration operation allows the search to escape from local optima and explore for better solutions. This algorithm is applied to data clustering problems for performance evaluation and a hybrid algorithm (KSRPSO) of K-means clustering method and SRPSO is developed. In the conducted numerical experiments, SRPSO and KSRPSO are compared to the original PSO algorithm, K-means, as well as, other methods proposed by other studies. The results demonstrate that SRPSO and KSRPSO are efficient, accurate, and robust methods for data clustering problems.  相似文献   

17.
在对基于异常的入侵检测进行训练时,缺少一个实时有效的训练集,提出了一种融合自控粒子群和免疫进化的入侵数据分类方法,对网络数据进行聚类分析,生成可靠的训练数据。粒子群模糊C均值聚类算法需要提前确定聚类数目,这在网络数据分析处理中是很难把握的,引入自控粒子群的方法根据迭代演算情况自动调节不同聚类数目的粒子群规模,使数据最后聚合在一个数目最优的聚类集中,同时为了克服陷入局部最优的问题,引入免疫进化机制,使部分粒子在当前最优指导下进行合理变异和替换,跳出局部最优解。  相似文献   

18.
针对基于粒子群的模糊聚类算法以隶属度编码时对噪音敏感,以及处理样本数小于样本维数的数据集效果较差等问题,通过改进其中的模糊聚类约束方法,提出一种改进的基于粒子群的模糊聚类方法.当样本对各类的隶属度之和不为1时,新方法在粒子群优化得出的隶属度基础上,根据样本与各类之间的距离对隶属度进一步分配,以使隶属度满足模糊聚类约束条件.新方法显著地改善了在隶属度编码下使用粒子群进行模糊聚类的效果,并通过典型的数据集进行了验证.  相似文献   

19.
为了解决电力系统的节能优化问题,本文在传统的PSO节能控制方法的基础上,提出了一种多重自适应的粒子群优化算法,应用分散控制系统设计与实现了一种新的电力节能优化控制系统。数值仿真的结果说明了使用所提出的粒子群算法的基于DCS的电力节能优化控制系统在电力调度最佳节点的搜索精确度要高于相同条件下的一般的电力控制系统。使用所提算法的电力节能优化控制系统,能有效地对电力能耗进行优化,且具有较高的实用性。  相似文献   

20.
基于混合粒子群优化算法的聚类分析   总被引:3,自引:0,他引:3  
针对模糊C-均值聚类算法易陷入局部最优和算法收敛速度慢等问题,提出了一种新的基于混合粒子群优化的模糊C-均值聚类算法.新算法在基本粒子群优化的模糊C-均值聚类算法的基础上结合了遗传算法的交叉、变异算子及混沌优化算法,并引入逃逸算子.仿真结果表明,该算法有效地避免了通常聚类方法易出现的早熟现象,同时也具有较快的收敛速度和较高的准确度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号