首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 122 毫秒
1.
一个好的聚类算法应该是用户输入参数少,对噪声不敏感,能够发现任意形状,可以处理高维数据,具有可解释性和可扩展性.将聚类分析应用于地理信息系统中,可以实现对GIS数据信息概括和综合.文中提出一种基于距离阈值相邻的聚类算法,通过距离阈值可达的方式逐个将对象加入到已知聚类中,可以发现任意形状的聚类并对噪声数据有很好的分离效果,实验中将该算法应用于地理信息系统中的数据挖掘实现上,结果证明此算法对于实现GIS聚类具有满意的效果.  相似文献   

2.
利用PB的函数或数据管道可以导入外部数据,但当外部数据源结构发生变化并和数据窗口或数据管道原先定义的结构不同时,直接利用上述方法无法成功导入.文章介绍如何通过动态数据窗口技术实现字段一一匹配的导入方法.  相似文献   

3.
基于GIS的空间位置关系聚类研究与应用   总被引:6,自引:0,他引:6  
李宁宁  刘玉树 《微机发展》2004,14(6):8-9,12
聚类分析是空间数据挖掘的一种方法,聚类算法能从空间数据库中直接发现一些有用的聚类结构。为实现空间复杂地理对象的聚类分析,文中给出了GIS及空间聚类分析技术.介绍了一种基于GIS的空间位置关系聚类分析算法。该算法按照空间相邻关系,将空间相邻的空间目标聚类成一类。在具体应用实例中利用本聚类算法将空间上相邻的大片阵地地域连成整块地域,并去掉了不符合条件的小块地域,形成阵地聚类,取得了满意的效果.实现了能够发现任意形状、并满足特定约束条件的聚类。  相似文献   

4.
动态滑动窗口的数据流聚类方法   总被引:2,自引:0,他引:2       下载免费PDF全文
数据流聚类是聚类分析中的重要问题。针对数据流的流速是变化的问题,在两阶段聚类框架基础上提出基于动态滑动窗口的数据流聚类算法。在线阶段,引入微聚类特征来存储数据流的概要信息,利用存储的概要信息动态调整滑动窗口规模,并计算数据点与微聚类中心的距离,以维护微聚类特征;离线阶段,对在线聚类阶段的聚类结果采用K-means算法进行宏聚类,生成最终聚类。实验结果表明,该算法具有较高的聚类质量和较好的伸缩性。  相似文献   

5.
聚类分析是空间数据挖掘的一种方法,聚类算法能从空间数据库中直接发现一些有用的聚类结构.为实现空间复杂地理对象的聚类分析,文中给出了GIS及空间聚类分析技术,介绍了一种基于GIS的空间位置关系聚类分析算法.该算法按照空间相邻关系,将空间相邻的空间目标聚类成一类.在具体应用实例中利用本聚类算法将空间上相邻的大片阵地地域连成整块地域,并去掉了不符合条件的小块地域,形成阵地聚类,取得了满意的效果,实现了能够发现任意形状、并满足特定约束条件的聚类.  相似文献   

6.
基于密度的DBSCAN聚类算法的研究及应用   总被引:3,自引:0,他引:3       下载免费PDF全文
首先对DBSCAN(Density Based Spatial Clustering of Applications with Noise)聚类算法进行了深入研究,分析了它的特点、存在的问题及改进思想,提出了基于DBSCAN方法的交通事故多发点段的排查方法及其改进思路,并且给出了实例以说明处理过程及可行性。实验结果表明本文提出的方法可以大大提高交通事故黑点排查效率。  相似文献   

7.
基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计了新的基于网格的聚类算法,利用CD-Tree的优点提高了传统的基于网格的聚类算法的效率.此外,该算法聚类时只需访问稠密单元,设计了优化策略,在聚类之前剪枝掉非稠密单元,进一步提高了算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法有更好的可伸缩性.  相似文献   

8.
基于K-均值聚类和凝聚聚类的离群点查找方法   总被引:1,自引:1,他引:1       下载免费PDF全文
离群点发现是数据挖掘研究的一个重要方面。根据数据流的特点,给出了一种基于K-均值聚类和凝聚聚类的离群点发现方法,先用K-均值聚类对数据流进行处理,生成中间聚类结果,然后用凝聚聚类对这些中间结果进行再次选择,最后找出可能存在的离群点。  相似文献   

9.
一种优化的基于网格的聚类算法   总被引:5,自引:0,他引:5  
聚类是数据挖掘领域中一个重要的研究课题.与其它算法相比,基于网格的聚类算法可以高效处理低维的海量数据.然而,由于划分的单元数与数据的维数呈指数增长,因此对于维数较高的数据集,生成的单元数过多,导致算法的效率较低.本文基于CD—Tree设计了新的基于网格的聚类算法,该算法的效率远高于传统的基于网格聚类算法的效率.此外,本文设计了一种剪枝优化策略,以提高算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法在数据集的大小及维度的可伸缩性方面均有显著提高.  相似文献   

10.
一种带约束的最小离差平方和系统聚类法及应用   总被引:2,自引:0,他引:2  
针对异常数据的不利影响和类数难以判别的问题提出了一种带约束的最小离差平方和系统聚类法,包括对初始数据进行线性变换、聚类检验指标分析、主因素分析等。通过对实际调查样本数据进行聚类,挖掘和分析客户群中所存在的不同特征的组群,得到了直观的聚类过程和较合理的分组结果。  相似文献   

11.
针对无线传感器网络节点能耗的限制以及通信数据的隐私问题,提出一种基于分簇技术的数据融合算法(Data Fusion Algorithm based on Clustering Technology, DFACT)。算法通过分簇技术解决通信数据的时延,簇内利用算法选择合适簇头,并构造数据融合树结构进行数据融合,减少数据通信量,保护数据隐私;簇间采用基于移动代理模型选择最佳路径提高通信效率。实验结果表明,DFACT算法可以有效地降低大规模无线传感器网络节点耗能,提高数据的安全性,延长网络生命周期。  相似文献   

12.
BIRCH: A New Data Clustering Algorithm and Its Applications   总被引:14,自引:0,他引:14  
Data clustering is an important technique for exploratory data analysis, and has been studied for several years. It has been shown to be useful in many practical domains such as data classification and image processing. Recently, there has been a growing emphasis on exploratory analysis of very large datasets to discover useful patterns and/or correlations among attributes. This is called data mining, and data clustering is regarded as a particular branch. However existing data clustering methods do not adequately address the problem of processing large datasets with a limited amount of resources (e.g., memory and cpu cycles). So as the dataset size increases, they do not scale up well in terms of memory requirement, running time, and result quality.In this paper, an efficient and scalable data clustering method is proposed, based on a new in-memory data structure called CF-tree, which serves as an in-memory summary of the data distribution. We have implemented it in a system called BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), and studied its performance extensively in terms of memory requirements, running time, clustering quality, stability and scalability; we also compare it with other available methods. Finally, BIRCH is applied to solve two real-life problems: one is building an iterative and interactive pixel classification tool, and the other is generating the initial codebook for image compression.  相似文献   

13.
为在数据收集和传输中保证数据的准确性和实时性,提出一种基于分簇的模糊加权数据融合算法(FWADF)。在簇内利用模糊逻辑控制器分析节点数据的可信度,确保数据的可信性,同时加入对数据优先级的考虑,减少网络时延。在簇间采用模糊加权矩阵方法提高数据的准确性。在NS-2仿真工具上的实验结果表明,在同等数据流量的前提下,采用FWADF算法时数据到达基站的时间延迟最短,在节点收集相同数据量的情况下,与Proposed DF、VWFFA、FIM等算法相比,基站获得数据的平均准确率分别提高5.0%、16.1%、9.5%。  相似文献   

14.
为了解决数据流动态聚类问题,提出了一种概率化的基于代表点聚类算法.首先,基于概率框架给出了AP(affinity propagation)聚类算法和EEM(enhanced α-expansion move)聚类算法的联合目标函数,提出了概率化的基于代表点聚类算法;其次,根据样本与其代表点之间的概率,提出了基于概率的漂移动态α-expansion数据流聚类算法.该算法使得新数据的代表点尽可能贴近原始数据的代表点,从而提高聚类性能;另一方面,考虑到原始数据与新数据的相似性,该算法能够处理2种漂移过程中的动态聚类问题:1)新数据与原始数据分享部分数据,其余数据与原始数据相似;2)没有相同的数据,新数据与原始数据有相似关系.在人工合成数据集D31,Birch3以及真实数据集Forest Covertpye,KDD CUP99的实验结果均显示出了所提之算法能够处理数据流聚类问题,并保证聚类性能稳定.  相似文献   

15.
一种无线传感器网络动态成簇数据融合算法   总被引:1,自引:0,他引:1  
李敏  罗挺  周俊 《计算机系统应用》2011,20(7):61-64,25
针对无线传感器网络应用于突发事件的场合,提出一种基于事件驱动的动态成簇数据融合算法。在综合考虑事件严重程度及节点剩余能量等因素的基础上,算法选择刺激强度大且剩余能量多的节点担当簇头。簇头节点通过广播成簇消息实现动态成簇,并动态调整每一轮数据融合延迟时间,提高了数据融合效率。仿真实验结果表明,与TEEN协议相比,该算法具有较低的节点平均能耗和较佳的网络数据融合延迟时间。  相似文献   

16.
聚类问题是近几年来机器学习和数据挖掘领域研究的热点问题,由于获取大量监督信息费时费力,目前国内外研究的重点是如何获得少量但对聚类性能提高显著的监督信息,再加上实际问题中存在的动态模糊性,故本文提出一种结合主动学习的动态模糊聚类算法DF-DBSCAN,通过引入动态模糊等价关系、动态模糊信任测度和动态模糊似然测度这3个约束信息来指导DBSCAN的聚类过程,以提高聚类的性能。实验结果表明,DF-DBSCAN算法不仅解决了实际问题中存在的动态模糊性数据的描述和表示问题,而且能够高效地进行数据聚类,显著地提高聚类性能。   相似文献   

17.
基于ART2网络聚类分析的数据融合算法研究   总被引:1,自引:1,他引:0  
人工神经网络为数据融合提供了新的理论方法和技术手段,在数据融合的各个方面具有广泛的应用前景。自适应共振理论(ART)是一种无监督神经网络,能够实现对输入的任何模拟信号的自动识别和分类。据此提出了一种以ART2网络聚类分析为核心的数据融合算法,探讨了ART2网络用于特征层数据融合实现模式识别/分类的机理,最后给出该算法在一例模式识别/分类中的应用-实现对工业控制系统中设备运行状态的实时监测和故障诊断,验证了该算法的有效性和可行性。  相似文献   

18.
窗口式聚类算法的基本思想是用窗口表示一个聚类,通过窗口的平移和扩大达到快速聚类的目的.针对聚类分析中特殊的样本数据集合--图像,提出一种基于样本缩减策略的窗口式聚类算法PRWC(patterns reduction-based window clustering),并应用于图像分割领域.通过实验测试表明,与FCM等常用于图像分割的聚类算法相比,PRWC算法可以在保证基本分割质量的同时,极大地提高图像的分割效率.  相似文献   

19.
研究海洋参数数据检测评价融合问题。在海洋环境监测系统中,由于监测项目繁多,测量数据存在着大量的冗余,使海洋环境的监测准确性差。传统的数据融合算法复杂度较高,难以实时利用,为了消除数据冗余性,针对钦州湾海洋数据的特点,提出了一种粗糙集的属性约简改进算法。结合贪心算法和遗传算法,在编码、交叉、变异、选择方面做了改进,能生成属性个数较少的约简,提高算法效率。通过钦州湾海洋数据融合实例,提出的算法可有效挖掘钦州湾海洋数据间的关联性,通过实验,结果表明了算法的有效性,为海洋环境监测及后续处理提供有力的决策依据。  相似文献   

20.
陆林花 《计算机仿真》2009,26(7):122-125,158
为了在聚类数不明确的情况下实现聚类分析,提出一种新的结合最近邻聚类和遗传算法的动态聚类算法.新算法包括两个阶段:第一阶段用最近邻聚类算法根据最近邻方法把最相似的实例分到同一个簇中并根据一些相似性或相异性度量过滤掉噪声数据从而得到初始聚类集,第二阶段是遗传优化阶段,利用动态聚类评估函数,动态地合并初始聚类集,从而获得接近最优的解.最后对算法进行了实验仿真,实验结果表明方法在事先不知道聚类数的情况下能够有效地进行聚类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号