首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 656 毫秒
1.
基于信息熵的空间对象群聚类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘建兴  鲍培明 《计算机工程》2011,37(16):176-178
针对利用空间关系建立空间对象群聚类的问题,提出一种基于信息熵的空间对象群聚类算法ESOGC。该算法考虑空间数据的复杂性和数据之间的联系,根据邻域范围内信息熵的变化情况,捡起或放下当前空间对象群,从而实现对空间对象群的聚类。实验结果表明,该算法能解决空间对象群中对象类型、对象属性值和对象数量不一致性的问题。  相似文献   

2.
经典的聚类方法(如划分方法、层次方法等)的聚类相似度由点与点之间的距离决定。但在空间数据的分布中,数据间的方向变化往往产生不同的类簇。空间离散点的方向可以是空间的任意方向,通过将空间离散点的方向转换为其所在三角面的方向,设计并实现了空间离散点在一定方向变化阈值内的方向聚类。设计各点间等间距的金字塔形实验数据,使用空间离散点方向聚类算法成功实现了对实验数据进行聚类。以内蒙古某露天煤矿的实际测量点数据为例,使用该聚类算法成功实现对露天矿采场的测量点进行聚类。  相似文献   

3.
多代表点特征树与空间聚类算法   总被引:1,自引:0,他引:1  
空间数据具有海量、复杂、连续、空间自相关、存在缺损与误差等的特点,要求空间聚类算法具有高效率,能处理各种复杂形状的簇,聚类结果与数据空间分布顺序无关,并且对离群点是健壮的等性能,已有的算法难以同时满足要求。本文提出了一个适合处理海量复杂空间数据的数据结构一多代表点特征树。基于多代表点特征树提出了适合挖掘海量复杂空间数据聚类算法CAMFT,该算法利用多代表点特征树对海量的数据进行压缩,结合随机采样的方法进一步增强算法处理海量数据的能力;同时,多代表点特征树能够保存复杂形状的聚类特征,适合处理复杂空间数据。实验表明了算法CAMFT能够快速处理带有离群点的复杂形状聚类的空间数据,结果与对象空间分布顺序无关,并且效率优于已有的同类聚类算法BLRCH与CURE。  相似文献   

4.
现有子空间聚类算法不能很好地平衡子空间数据的稠密性和不同子空间数据稀疏性的关系,且无法处理数据的重叠问题。针对上述问题,提出一种稀疏条件下的重叠子空间聚类(OSCSC)算法。算法利用L1范数和Frobenius范数的混合范数表示方法建立子空间表示模型,并对L1范数正则项进行加权处理,提高不同子空间的稀疏性和同一子空间的稠密性;然后对划分好的子空间使用一种服从指数族分布的重叠概率模型进行二次校验,判断不同子空间数据的重叠情况,进一步提高聚类的准确率。在人造数据集和真实数据集上分别进行测试,实验结果表明,OSCSC算法能够获得良好的聚类结果。  相似文献   

5.
DBSCAN在非空间属性处理上的扩展   总被引:1,自引:1,他引:0  
孙志伟  赵政 《计算机应用》2005,25(6):1379-1381
在很多有效的聚类算法中,DBSCAN算法对于聚类空间数据有着非常好的性能,依赖于基于密度的聚类定义,DBSCAN可以发现任意形状的聚类,而且执行效率很高。但是,DBSCAN没有考虑非空间属性,而非空间属性对聚类的结果也起着十分重要的作用。在DBscAN的基础上,参考DBRS的概念,进一步考虑了非空间属性的数据类型,从而提出了可以处理空间和非空间数据的新的聚类方法,并给出了主要的算法。  相似文献   

6.
一种基于密度的空间数据流在线聚类算法   总被引:2,自引:0,他引:2  
于彦伟  王沁  邝俊  何杰 《自动化学报》2012,38(6):1051-1059
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial datastream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033 ms.  相似文献   

7.
基于不确定性的空间聚类   总被引:8,自引:0,他引:8  
空间数据挖掘是指从空间数据库(空间数据仓库)中提取用户感兴趣的空间的和非空间的模式和规则的过程,空间聚类是空间数据挖掘最基本的任务。本文首先分析了空间数据挖掘过程中的不确定性,并以空间聚类为例具体分析空间聚类过程中的数据预处理方法。在此基础上,以EM算法为基础,顾及空间聚类的随机性和模糊性以及基于Delaunay图的空间对象的空间邻近关系,构建了基于不确定性的空间聚类算法。  相似文献   

8.
基于模糊c-means算法的空间数据分类和预测   总被引:2,自引:0,他引:2  
空间分类和预测是空间数据挖掘中一个非常重要的方法,但对它们的研究目前尚处于初始阶段.通过引入空间对象对模糊聚类的模糊隶属度的概念,提出了基于模糊c-means算法的空间数据分类和预测的方法(SFCM),该方法首先用模糊c-means方法对数据集论域空间进行聚类,但由于空间数据具有空间自相关的特性,在用模糊c-means算法进行空间聚类时加入了空间信息,然后计算每个空间对象对所有聚类的模糊隶属度并从中找出模糊隶属度最大的聚类,最后用该聚类中心对象的因变量的值作为该空间对象的因变量的估计值,理论分析和实验结果表明,该算法是有效可行的.  相似文献   

9.
传统的空间聚类算法解决的是未带障碍约束的空间数据聚类问题,而现实的地理空间中经常会存在河流、山脉等阻碍物,因此,传统空间聚类算法不适用于带障碍数据约束的现实空间.在解析了带障碍空间聚类相关概念和定义的前提下,对带障碍约束条件的空间聚类算法进行梳理,给出了这类算法的研究历史和沿袭关系,并把这类算法按七个维度分为四大类,分析了每类的技术优缺点,最后给出了带障碍约束的空间聚类算法的未来研究趋向.  相似文献   

10.
数据挖掘空间聚类   总被引:1,自引:1,他引:0  
聚类分析在数据挖掘领域中得到了广泛的应用,对空间数据的聚类是其中的一个重要研究方向。文章提出了对空间数据聚类的6个标准,并基于这6个标准对一些传统的空间数据聚类算法作了分析比较。在分析的基础上指出没有一种老的算法能同时处理大量数据点、高维数据和多噪声的问题。接着对近年来改进或创新的聚类算法作了简要分析,并对未来发展方向进行了简要展望,目的主要是便于研究者全面了解和掌握空间数据聚类的现有算法,发现更高性能的聚类算法,也使用户能方便快速地找到适合特定问题的聚类方法。  相似文献   

11.
实时视频中的车辆运动轨迹的提取和聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
利用运动物体轨迹的方向性、运动性和相互关系等典型特征对物体的运动轨迹进行聚类。首先利用改进的加权矢量Hausdorff距离作为度量运动物体轨迹相似度的方法,从而使之适用于空间距离有差别的运动物体轨迹的谱聚类问题;然后基于等周分割(ISO)算法,构造轨迹相似度矩阵,完成轨迹的粗聚类;最后利用轨迹的方向性特征和轨迹类间距对轨迹进行二次聚类,得到最终的轨迹聚类结果。  相似文献   

12.
由于空间数据库通常蕴含海量数据,因此一个普通的空间查询很可能会导致多查询结果问题。为了解决上述问题,提出了一种空间查询结果自动分类方法。在离线阶段,根据空间对象之间的位置相近度和语义相关度来评估空间对象之间的耦合关系,在此基础上利用概率密度评估方法对空间对象进行聚类,每个聚类代表一种类型的用户需求;在在线查询处理阶段,对于一个给定的空间查询,在查询结果集上利用改进的C4.5决策树算法动态生成一棵查询结果分类树,用户可通过检查分类树分支的标签来逐步定位到其感兴趣的空间对象。实验结果表明,提出的空间对象聚类方法能够有效地体现空间对象在语义和位置上的相近性,查询结果分类方法具有较好的分类效果和较低的搜索代价。  相似文献   

13.
Spatial access methods (SAMs) are often used as clustering indexes in spatial database systems. Therefore, a SAM should have the clustering property both in the index and in the data file. In this paper, we argue that corner transformation preserves the clustering property such that objects having similar sizes and positions in the original space tend to be placed in the same region in the transform space. We then show that SAMs based on corner transformation are able to maintain clustering both in the index and in the data file for storage systems with fixed object positions and propose the MBR-MLGF as an example to implement such an index. In the storage systems with fixed object positions, the inserted objects never move during the operation of the system. Most storage systems currently available adopt this architecture. Extensive experiments comparing with the R1-tree show that corner transformation indeed preserves the clustering property, and therefore, it can be used as a useful method for spatial query processing. This result reverses the common belief that transformation will adversely affect the clustering and shows that the transformation maintains as good clustering in the transform space as conventional techniques, such as the R1-tree, do in the original space.  相似文献   

14.
一种基于空间邻接关系的k-means聚类改进算法   总被引:3,自引:0,他引:3       下载免费PDF全文
王海起  王劲峰 《计算机工程》2006,32(21):50-51,75
空间对象不仅具有非空间的属性特征,而且具有与空间位置、拓扑结构相关的空间特征。利用传统的聚类方法对空间对象进行聚类时,由于没有考虑空间关系,同一类的对象可能出现在空间不相邻的位置。基于空间邻接关系的k-means改进算法将相邻对象的空间邻接关系作为约束条件加以考虑,使聚类结果既反映了属性特征的相似程度,又反映了对象的空间相邻状态,从而可以揭示不同类别对象的空间分布格局,因此其比传统的k-means方法更适合于空间对象的聚类分析。  相似文献   

15.
一种基于网格索引的数据聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为了提高基于密度聚类算法的效率,避免算法在执行过程中的多余搜索,提出了一种基于DBSCAN算法的改进的空间数据聚类算法。该算法采用对象邻域空间进行划分的方法,将网格索引结构应用于该算法。在核心对象的邻域内选择八个方向上未标记且距离核心对象最边缘的对象来扩展种子对象,减少查询次数,降低聚类的时间复杂度。在实验中,利用海量数据集对算法进行测试,测试结果证明新算法在保证聚类精度的情况下时间效率显著高于DBSCAN算法。  相似文献   

16.
针对现有空间对象多尺度索引结构聚簇性不高的问题,在R树索引的基础上提出一种基于聚类的空间数据多比例尺索引结构。利用树的层次结构反映空间数据的多比例尺特性,用k-means算法对相同等级的空间对象进行聚类分组,减少空间区域覆盖和重叠。实验结果表明,该方法与基于四叉树的多比例尺索引相比,能有效提高空间数据多比例尺显示的性能。  相似文献   

17.
吴玲玉  白尘 《计算机应用研究》2013,30(11):3283-3286
传统属性空间的密度聚类算法仅考虑对象属性取值相似度, 网络空间密度聚类算法仅关注对象间关系紧密度。针对两类算法的不足, 提出一种兼顾属性距离及关系强度的密度聚类算法。在构建兼顾属性距离及关系强度的网络之后, 完善了近邻对象及核心对象的概念, 并给出了相应的聚类策略。理论分析和实验结果表明, 由于综合考虑了属性、关系及关系强度信息, 算法规避了对象属性值分布对聚类过程的影响, 改善了聚类效果, 并能有效识别枢纽点和孤立点。  相似文献   

18.
传统的Hilbert Packed R-树是利用Hilbert值对空间实体依次进行压缩,算法简单快速,然而空间位置上邻近的空间实体的Hilbert值并不一定相邻,使得在数据分布不均匀时,查询效率开始下降;递归聚类的算法虽然解决了以上问题,但是它计算复杂,而且容易造成R-树的不平衡,以至降低了存储利用率和检索的效率。文中对两种方法加以综合,提出了一种新的批量加载R-树的算法—HilCluster。实验结果表明,新算法不仅继承了Hilbert Packed R-树构造过程时间消耗低、存储利用率高的优点,还使得查询效率进一步提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号