首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
一种基于近似EMD的DBSCAN改进算法   总被引:2,自引:2,他引:0  
DBSCAN(density based spatial clustering of applications with noise)算法是基于密度的经典聚类算法,但是该算法应用于高维数据时,常用距离函数不能很好地反映出数据点之间的关系, 从而可能导致聚类簇不够精确。如果能在高维空间中采用合适的距离度量,将会改善聚类结果。针对上述问题,提出利用近似EMD(earth mover’s distance,堆土机距离)作为距离测度,通过迭代搜索的方法找出所有直接密度可达对象实现聚类。实验结果表明:在高维文本数据的聚类中,和原来算法相比,改进算法的正确率提高了6%,两者在时间上相差不大;而对低维的Iris数据,改进算法通过EMD改善了实体间的相似性度量,减少了划分为噪声点的数据点个数,平均正确率提高了10%。实验结果表明了改进算法对高维数据的有效性,并可以改善聚类性能。  相似文献   

2.
针对DBSCAN算法时间开销大的缺点,提出了基于网格单元的DBSCAN算法,通过对数据空间进行网格单元划分来优化DBSCAN算法中最耗时的区域查询过程,省去了大量不必要的查询操作,并分析了网格单元的划分方式对本文算法的影响,通过选取最优划分方式,提高整个算法的运行效率。通过仿真实验,验证了基于网格单元的DBSCAN算法具有较高的准确率和较低的时间复杂度。  相似文献   

3.
4.
近年来,在HDFS上的小文件聚类存储问题引起了广泛关注.针对传统聚类算法DB-SCAN在聚类过程中,出现数据密度不均匀时造成聚类效果粗糙及时间开销较大等问题,提出了一种基于经改进网格单元的DBSCAN聚类算法.该算法首先使用网格单元划分及爬山法辨别出局部次优区域来缩小搜索范围,进而再从所选局部次优区域执行宽度优先搜索法...  相似文献   

5.
障碍约束下的空间聚类问题具有很强的实用价值,是近几年来空间数据挖掘研究领域的一个热点,研究和分析了现有的障碍约束空间聚类算法,针对其中存在的问题,提出了一种新的基于密度和网格的障碍约束下空间聚类算法,该算法在CLICQU算法的基础上,引入障碍网格的概念和障碍物的网格化表达,使其能够处理任意形状的障碍约束聚类,通过理论分析和实验验证,该算法具有较好的时间复杂度和聚类效果。  相似文献   

6.
DBSCAN聚类算法的研究与改进   总被引:4,自引:1,他引:4  
针对“基于密度的带有噪声的空间聚类”(DBSCAN)算法存在的不足,提出“分而治之”和高效的并行方法对DBSCAN算法进行改进.通过对数据进行划分,利用“分而治之”思想减少全局变量Eps值的影响;利用并行处理方法和降维技术提高聚类效率,降低DBSCAN算法对内存的较高要求;采用增量式处理方式解决数据对象的增加和删除对聚类的影响.结果表明:新方法有效地解决了DBSCAN算法存在的问题,其聚类效率和聚类效果明显优于传统DBSCAN聚类算法.  相似文献   

7.
针对云计算环境中任务调度中存在的执行效率低的问题,提出了一种基于改进的基于密度的聚类算法(DB-SCAN)的云任务调度策略.首先使用改进的基于密度的聚类算法DBSCAN对云任务进行聚类,然后与已经分类的资源进行匹配,解决资源与任务匹配程度低的问题.实验结果表明,对任务进行聚类后进行任务调度,任务在终端上的平均执行时间减少了大约35.2%,任务的调度时间也有了明显减少.  相似文献   

8.
传统的K-means算法是一种常用的聚类算法,但它对于初始聚类中心敏感,容易受到"噪声"和孤立点的影响,由此提出了一种基于网格的二次K-means聚类算法.此算法先将空间划分为多个大小相等的网格,然后根据给定的密度阈值来计算出密集网格,对密集网格中的点进行初次聚类,将初次聚类结果的均值点作为第二次聚类的初始均值点,从而消除了"噪声"和孤立点的影响,并且保证了信息的完整,实验证明此算法是有效的.  相似文献   

9.
针对基于密度带有“噪声”的空间聚类应用(DBSCAN)聚类算法存在的3个主要问题: 输入参数敏感、对内存要求高、数据分布不均匀时影响聚类效果,提出了一种基于遗传方法的DBSCAN算法改进方案数据分区中使用遗传思想的DBSCAN算法(DPDGA)来提高聚类质量.利用遗传算法改进K-means算法来获取初始聚类中心;对数据进行划分,在此基础上对划分的每一部分使用DBSCAN算法进行聚类;合并聚类的结果.仿真实验表明,新方法较好解决了传统DBSCAN聚类算法存在的问题,在聚类效率和聚类效果方面均优于传统DBSCAN聚类算法.  相似文献   

10.
针对凝聚式的层次聚类算法在聚类过程中层次化的迭代运算使误差不断累积,导致聚类结果较差的问题,在GN快速算法基础上提出了一种改进的凝聚式层次聚类算法,即网状聚类算法。实验结果表明,该改进算法避免了误差的积累,可以获得更高质量的聚类结果。  相似文献   

11.
DBSCAN算法是一种典型的基于密度的聚类算法,具有速度快、可以发现噪声的优点,但在处理大规模数据时出现聚类效率低、内存和I/O消耗大、聚类精度降低的问题,集群式计算机技术特别是云计算技术的发展提供了解决DBSCAN算法缺陷的方案.文中提出了数据预分区的并行PMDBSCAN算法,该算法在聚类之前对数据分区预处理,利用并行编程模型MapReduce实现DBSCAN算法并行化,结合重叠分区思想,减少I/O消耗.实验结果表明,在大规模数据集上,PMDBSCAN算法聚类有效提高了聚类的速度、减少了I/O消耗、改善了聚类的质量.  相似文献   

12.
根据具有噪声的基于密度聚类(DBSCAN)算法提出一种轨道结构故障诊断方法.首先,以轨道结构第99号轨枕振动信号为例,基于信号稀疏表示,实现降低原始信号冗余度;接着,对轨枕振动信号进行特征指标提取,构造出偏斜度等9类特征指标;然后,通过多次仿真计算不同工况下k-距离图,选取合适的邻域半径(ε)和最小核心点数(min Pts),研究轨枕振动信号在不同特征指标下的数据演变规律;最后,根据聚类评价指标描述不同特征指标间的离散程度.算例表明,该方法可识别不同工况下轨枕故障模式,为轨道结构故障诊断智能化、无损化提供理论依据.  相似文献   

13.
预置地图的激光导航是目前变电站智能巡检机器人较为常用的一种导航方式,其优点在于维护成本低,但是容易受到异物的干扰。DBSCAN聚类算法可以正确区分噪声点,利用这个特性,准确区分了变电站内的异物,可以有效提高激光导航的可靠性。  相似文献   

14.
针对现有的数据流聚类算法不能在线实时生成用户需要的聚类结果问题,提出一种基于滑动窗口的数据流在线聚类算法.该算法采用密度网格存储结构,实现了数据流的在线聚类过程,能实时地向用户提供聚类结果,动态地检测数据流的进化情况.实验结果表明,该方法具有快速在线聚类能力,并能保证良好的聚类质量.  相似文献   

15.
为使网格资源的充分,对网格资源进行了分类研究。提出了基于AGNES算法的网格资源分析法,其目地在于使网格资源得到合理的整合归类,通过大量实验证明了其有效性、正确性,效果非常理想。并用一个实例详细说明了这种方法。  相似文献   

16.
为提高网格资源的安全性,将数据挖掘算法应用到对网格日志的分析上,通过对网格日志的分析挖掘,从中发现用户的非法行为,实现对用户的限制性访问控制。用一个例子对这种方法进行了描述。该方法的提出增强了网格的安全性。  相似文献   

17.
阐述了当前栅格图像处理存在的问题,针对集群环境下空间信息的并行存取与处理的研究与应用,分析了栅格图像的分割方法,并提出了一种分割栅格图像的Kc算法.其基本思想是在集群各计算节点上通过Kc值与TK=μK ασK比较,并行处理图像的不同对象.根据该算法设计了实验,通过实验验证了Kc算法能够加快图像处理的速度.  相似文献   

18.
针对传统分簇算法(LEACH)在选取簇头时,网络能耗消耗过快的问题,提出一种改进的分簇算法(U-LEACH)。该算法在簇头选取阶段,新增节点与传感器网络重心的距离和节点的剩余能量两个影响因子,优化LEACH算法中簇头节点的选取函数,保证簇头选取的合理性。仿真结果表明,改进的U-LEACH算法相比于原算法减少了网络的能量消耗,延长了网络生命周期。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号