首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
针对聚类神经网络初始权值与样本分类数的设定问题,提出一种基于网格和密度的聚类神经网络结构优化算法.以网格和密度为工具提取聚类样本的聚类中心,并由此确定样本分类数,从而对聚类神经网络结构进行优化,可以有效地提高神经网络的聚类效果,缩短样本聚类时间.  相似文献   

2.
针对海量实时数据流,提出了一种基于密度和网格划分相结合的聚类算法.首先对数据空间进行划分,判断每个单元格中数据点的属性.如果单元格内数据点密度高于阈值,则判定这些点为核心点;否则,根据单元格邻居内数据点的数量对数据点进行再次判断,以确定单元格内的数据点是边界点还是噪声点.算法克服了基于密度的算法运行效率低的缺点,又弥补了基于网格的算法精度较低的不足.通过实验验证了算法的效率和性能,并与经典的DBSCAN和CLIQUE算法进行了对比分析.最后分析了算法在面向海量实时数据流方面所具有的优势,并提出了进一步的研究方向.  相似文献   

3.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

4.
一种基于网格和密度凝聚点的快速聚类算法   总被引:10,自引:1,他引:10  
提出的快速聚类算法通过凝聚点来准确反映数据空间的几何特征,然后采用网格和密度相结合的方法,利用爬山法和连通性原理进行聚类处理,克服了传统网格聚类算法聚类质量降低的缺点.实验结果证明,本算法的聚类效率优于传统爬山法、Clique算法和DBSCAN算法.  相似文献   

5.
针对密度聚类算法无法应用于大规模数据集的问题,提出一种基于划分网格的密度聚类算法(GDSCAN)。将大规模二维点阵图划分为若干网格,网格最短边不小于给定邻域半径,目标点所在网格中任意点的邻域范围不会超过与该网格直接连接的网格,只需在保留网格内寻找邻域点,从而减少计算量;聚类从任意无类别核心点开始,将该点的所有密度可达组成一个簇,以此类推直至所有核心点都有类别;采用提出的GDSCAN算法对不同数量级的二维路网节点进行聚类验证。结果表明,GDSCAN算法可有效解决大规模二维点阵数据集中密度聚类的效率问题,数据量越大,效果越明显,且时间复杂度明显降低。  相似文献   

6.
分析了数据流的特点,针对数据流聚类算法CluStream对数据流中非球形聚类效果不好的情况,提出了基于数据流的不规则网格增量聚类算法IIGStream.IIGStream算法具备了传统网格聚类算法处理速度快的优点.同时能够动态增量地调整网格结构.对新到来的数据点,通过判断网格是否相连,保证了对于不同形状聚类的聚类效果.IIGStream在聚类时无需预先指定聚类数目.且对孤立点不敏感.在真实数据集与仿真数据集上的实验结果表明,IIGStream算法具有良好的适用性和有效性,在聚类精度以及速度上均优于CluStream算法.  相似文献   

7.
针对传统K-means算法初始中心选取的随机性导致算法聚类效果不佳的问题,提出一种基于网格密度距离的K-means算法,即GDD-K-means。该算法先把数据点放入网格空间内,以网格为单元进行数据处理,遍历网格得到网格密度,根据密度阈值筛选出高密度网格并进行降序排序;再在高密度网格中引入K-means++思想,选取k个距离较远的网格点;最后进行K-means算法聚类的k个初始中心点将确定在上述网格点中。仿真实验结果表明,GDD-K-means算法减少了聚类中心选取的随机性,改善了聚类的效果。  相似文献   

8.
基于网格的参数自动化聚类算法   总被引:9,自引:1,他引:9  
提出了一种基于网格的参数自动化聚类算法PAG,主要目的是解决传统的网格聚类算法对参数敏感的问题.算法采用参数自动化技术来处理参数,即算法开始运行时所需的参数直接由参数自动化技术中的公式计算得出,不需要用户输入任何参数.通过对大量数据集的实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,并且有很好的精度.  相似文献   

9.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

10.
基于相对密度的聚类算法研究   总被引:1,自引:0,他引:1  
基于相对密度的聚类算法Red的基本思想是,根据给定的半径参数求出每个点的密度,并据其对数据集中的点按照从大到小的顺序进行排序,每次均从未被聚类的点中找出密度最大的点开始聚类。聚类时,先找出一个未被聚类的密度最大的点,找到所有可达该点的点作为一类,再对剩余未被聚类的数据集中找到一个密度最大的点用同样的方法继续聚类,最后输出各个类,将不属于任何类的点作为孤立点。  相似文献   

11.
针对现有热点路径探测算法需要路网拓扑结构的支持,以及难以准确识别热点路径的复杂耦合现象的问题,提出了一种基于网格聚类的热点路径探测算法。算法将移动轨迹映射为网格序列,以邻接网格间的共有轨迹量来定义网格间的密度可达性,并据此将网格分划抽象为图模型。然后以图论中的相关理论为基础提出了网格聚类算法Grid Growth,即热点路径探测算法。实验结果表明:本文算法能有效探测热点路径,且能准确识别热点路径的复杂耦合现象。  相似文献   

12.
分析TCP流模式及传统网络资源分配中存在的问题,建立理想网络环境中的资源分配模型.提出一种新的流标记与分类方法,采用K均值算法对流进行聚类,改善运行besteffort服务的IP网络中TCP流量资源分配的合理性和公平性.该方法具有较低的节点间通信代价和节点计算量,适合大型互联网络,且对网络用户透明.模拟实验证明该方法有效.  相似文献   

13.
为减少社区发现算法中参数的选择对社区划分的影响,同时使算法能够自适应地进行社区划分,本文提出一种基于核密度估计的密度峰值聚类的社区发现算法KDED.首先,定义一种基于信任度的距离度量,将社交网络中的用户关系量化为距离矩阵,使用矩阵元素的大小度量用户关系的紧密程度;然后对距离矩阵进行核密度估计,统计各个节点在网络中的影响大小,结合热扩散模型改进计算流程,使其自适应不同规模的数据集以提高计算精度;结合密度峰值聚类原理和社区属性确定社区中心节点后,可根据节点间的距离得到社区内部层次结构和社区外部的自然结构;最后将剩余节点按距离分配到相应的社区当中以完成社区划分.仿真结果表明:通过可视化软件可观察到,通过KDED算法得到的社区划分结果具有清晰的自然结构和内部层次结构;随着社区规模的提升以及划分难度增加,KDED算法具有出色的稳定性;在真实数据集以及LFR基准网络上均得到较为接近真实划分结果的社区划分,自适应性良好,验证算法的可行性与有效性.  相似文献   

14.
提出一种基于扩展凝聚点和网格的快速聚类算法CECPG(c lustering using extended condensation pointand grid).在CECPG算法的基础上提出一种基于扩展凝聚点和网格的增量聚类算法ICECPG(increm entalc lustering using extended condensation point and grid).通过扩张凝聚点准确反映数据空间的几何特征,然后采用网格和密度相结合的方法,利用爬山法和连通性原理进行聚类处理,并在差分数据的指导下进行增量聚类.实验结果证明,CECPG算法的聚类效果优于模糊聚类算法FCM和C lique算法.  相似文献   

15.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

16.
基于WFMC的工作流参考模型提出了网格工作流体系结构,扩展了基于遗传算法技术的规划算法以支持网格工作流自动建模,给出了基于市场驱动策略的动态调度算法以提高网格应用的服务质量,并介绍了在Globus上实现的原型系统JLGridFlow和其在大文件下载中的应用。  相似文献   

17.
提出了一种带有启发信息的邻接表结点存储结构模型,给出了结点间权值计算的具体评判函数,依据评判函数值优化邻接表中节点的相对位置.基于最短路径问题提出了带有启发信息的遗传算法思想,将启发信息加入到了初始种群生成过程中,提出了新的交叉方法.通过模拟仿真得到了算法的性能参数,并将本文算法和Dijkstra算法进行比较,结果表明...  相似文献   

18.
针对蜻蜓算法(DA)收敛速度慢、收敛精度低、全局搜索能力差等不足,提出新的蜻蜓优化算法. 利用tent混沌初始化种群并对种群进行K-Means++聚类,根据聚类的结果分别对种群个体进行反向学习和高斯变异以增强种群的多样性,提高搜索效率. 引入非线性自适应因子加快收敛速度,使用探测精英引导策略增强算法跳出局部收敛的能力. 引入平方散列探测增加收敛精度. 将该优化算法应用于8个典型复杂函数优化问题,并与原蜻蜓算法,以及其他仿生计算算法对比,实验结果表明该改进算法具有良好的全局收敛性和寻优精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号