首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
一个好的聚类算法应该是用户输入参数少,对噪声不敏感,能够发现任意形状,可以处理高维数据,具有可解释性和可扩展性.将聚类分析应用于地理信息系统中,可以实现对GIS数据信息概括和综合.文中提出一种基于距离阈值相邻的聚类算法,通过距离阈值可达的方式逐个将对象加入到已知聚类中,可以发现任意形状的聚类并对噪声数据有很好的分离效果,实验中将该算法应用于地理信息系统中的数据挖掘实现上,结果证明此算法对于实现GIS聚类具有满意的效果.  相似文献   

2.
现有的数据流聚类方法很难兼顾数据稀疏和子空间聚类等高维数据难题,而分布式数据流对数据流聚类提出包括在线计算效率、通信开销以及多路数据的融合等更多挑战。提出分布式数据流聚类方法,采用全局统一的网格划分和衰退时间以支持多路数据流融合,并周期性检查和删除过期网格来控制概要规模。通过对多路高维数据流的一遍扫描,发现高维数据流子空间任意形状的聚类,并反映数据分布随时间的演化。在线组件效率高开销低,概要信息简洁,通信代价低。实验表明,该方法能够对分布式数据流正确聚类并演进,在线组件效率高,概要规模小。  相似文献   

3.
如何从海量的样本数据中挖掘出具有共性的顾客需求信息,帮助商家识别出潜在的客户群,并提高对市场活动的响应效率,是当前国内外市场研究的一个重点和难点。以新产品开发策划中的新产品市场定位为研究对象,提出了一种基于网格的聚类算法(meshbased clustering algorithm, MCA)。此算法可以在市场调查数据中深度挖掘顾客潜在需求,根据顾客评价对产品进行竞争性分析,采用积极的营销策略,不断挖掘新客户群体,从而为企业制定新产品开发战略和产品市场定位提供科学决策依据。  相似文献   

4.
一种基于网格和密度的数据流聚类算法   总被引:1,自引:0,他引:1  
在"数据流分析"这一数据挖掘的应用领域中,常规的算法显得很不适用.主要是因为这些算法的挖掘过程不能适应数据流的动态环境,其挖掘模型、挖掘结果不能满足实际应用中用户的需求.针对这一问题,本文提出了一种基于网格和密度的聚类方法,来有效地完成对数据流的分析任务.该方法打破传统聚类方法的束缚,把整个挖掘过程分为离线和在线两步,最终通过基于网格和密度的聚类方法实现数据流聚类.  相似文献   

5.
地理信息系统存储了大量的二维空间对象,对这些对象进行聚类分析是数据挖掘的一项重要任务.本文提出一种针对二维空间对象的聚类算法.该算法引用层次聚类方法的思想,将子聚类信息用一个聚类特征表示.采用基于密度的方法,发现任意形状的簇,能较好地处理孤立点,并且支持增量式聚类.实验证明该算法是有效的.  相似文献   

6.
网格聚类以网格为单位学习聚簇,速度快、效率高。但它过于依赖密度阂值的选择,并且构造的每个聚簇边界呈锯齿状,不能很好地识别平滑边界曲面。针对该问题,提出一种新的面向网格问题的聚类融合算法(RG) . RG不是通过随机抽样数据集或随机初始化相关参数来创建有差异的划分,而是随机地将特征划分为K个子集,使用特征变换得到K个不同的旋转变换基,形成新的特征空间,并将网格聚类算法应用于该特征空间,从而构建有差异的划分。实验表明,RU能够有效地划分任意形状、大小的数据集,并能有效地解决网格聚类过分依赖于密度阂值选择以及边界处理过于粗糙的问题,其精度明显高于单个网格聚类。  相似文献   

7.
一种高维空间数据的子空间聚类算法   总被引:6,自引:1,他引:6  
王生生  刘大有  曹斌  刘杰 《计算机应用》2005,25(11):2615-2617
传统网格聚类方法由于没有考虑到相邻网格内的数据点对考查网格的影响,存在不能平滑聚类以及聚类边界判断不清的情况。为此提出了一种高维空间数据的子空间聚类算法,扩展了相邻聚类空间。实验结果显示,克服了传统聚类的不平滑现象,使聚类边界得以很好的处理。  相似文献   

8.
针对基于密度的空间聚类及其变种提出了拓扑的概念。给出了聚类拓扑结构的定义,把簇定义为多种拓扑连通集合。此外,运用全新的拓扑思想改进典型的算法,提出了一种拓扑聚类的新算法。实例证明此算法有效。  相似文献   

9.
网格聚类算法   总被引:3,自引:0,他引:3  
聚类分析有广泛的应用,是数据挖掘中非常重要的方法。聚类分析算法有多种分类,每种方法在不同领域发挥了不同的作用。以研究网格聚类算法为目的,介绍了聚类分析算法的要求以及常见的聚类算法;针对基于网格方法的聚类算法进行专门研究,比较分析了传统的和改进的基于网格方法的聚类算法。介绍的各种网格聚类算法都有自身的优点和不足。通过对这些网格聚类算法的学习便于深入研究网格聚类算法,以便将其与实际问题相结合,设计更好的算法。  相似文献   

10.
随着多媒体技术的发展,许多领域产生大量的高维数据集。为了有效地检索这些高维数据,高维索引成为人们研究的热点。聚类树是一种有效地支持高维数据检索的索引结构。提出了一种基于子空间聚类的聚类树结构,该索引结构基于一种改进的CLIQUE聚类算法,利用小波变换的多尺度特性对图像特征分布曲线进行不同尺度的小波变换,去除一些小的分类和可能的噪声干扰,从而得到不同粒度下的层次聚类。在层次聚类的基础上,建立起分层索引结构。由于改进的聚类算法使用爬山法确定子空间聚类,因而有效地避免了用户参数的定义。实验结果证明,该方法在不需要用户设定聚类参数下能够进行有效聚类,在不同尺度下构建的聚类结构能够有效地组织图像关系,大大提高图像的检索效率。  相似文献   

11.
聚类算法分析及在GIS中心选址中的仿真研究   总被引:1,自引:1,他引:0  
通过对聚类算法初始点选择策略的分析和比较,经典k-means算法在GIS海量数据处理上的效率问题,提出了随机采样的k-means算法来进行坐标聚类;并将随机采样k-means算法应用于GIS中心选址,充分利用GIS数据分析和处理能力,以城市间的欧几里得距离为相似条件,采用最大最小原则选取初始点进行聚类,从而缓解局部最优解产生的概率;选取中心城市作为目标对象,从而提高商业决策的充分性和可靠性;经仿真结果验证了所提出的随机取样k-means算法的有效性和正确率。  相似文献   

12.
一种改进的模糊C均值聚类算法   总被引:5,自引:0,他引:5  
针对经典的C均值聚类算法以及模糊C均值聚类算法所存在的两个方面的问题:一是算法对初始聚类中心的过分依赖性,通常的聚类算法往往对于不同的初始聚类中心会得到不同的聚类结果;二是算法需要预先知道实际的聚类数目,而在实际应用中,聚类数目却是未知的。基于此提出了模糊C均值聚类算法的一种改进算法,即在标准的模糊C均值聚类算法的基础上,给目标函数加入了一个惩罚项,使得上述问题得以解决。并通过仿真实验证实了新算法的可行性和有效性。  相似文献   

13.
基于GIS的空间聚类算法研究   总被引:1,自引:1,他引:0  
面对目前的聚类方法的局限性和空间聚类的特殊性,从基于目标函数聚类的概念出发,以GIS的空间数据管理和空间分析为技术支持,探讨了空间样本间直接可达距离、间接可达距离和可达成本的计算方法。随机选择k个样本作为聚类中心点,以空间样本到各聚类中心点的可达距离为样本划分依据,以空间样本到其聚类中心点的可达成本的总和为聚类目标函数,引入遗传算法,提出一种基于GIS的空间聚类算法。最后,通过实例进行了算法测试。  相似文献   

14.
基于GIS的空间位置关系聚类研究与应用   总被引:6,自引:0,他引:6  
李宁宁  刘玉树 《微机发展》2004,14(6):8-9,12
聚类分析是空间数据挖掘的一种方法,聚类算法能从空间数据库中直接发现一些有用的聚类结构。为实现空间复杂地理对象的聚类分析,文中给出了GIS及空间聚类分析技术.介绍了一种基于GIS的空间位置关系聚类分析算法。该算法按照空间相邻关系,将空间相邻的空间目标聚类成一类。在具体应用实例中利用本聚类算法将空间上相邻的大片阵地地域连成整块地域,并去掉了不符合条件的小块地域,形成阵地聚类,取得了满意的效果.实现了能够发现任意形状、并满足特定约束条件的聚类。  相似文献   

15.
使用支撑集和模糊待分集的概念来描述数据集的分布,在此基础上提出了一种区域型模糊聚类算法———re-gionalfuzzyclusteringalgorithm。仿真结果表明该算法有比常用的模糊C均值更好的聚类性能。  相似文献   

16.
传统聚类方法将对象严格地划分到某一类,但很多时候边界对象不能被严格地划分.粗糙集用上近似集和下近似集表示一个类,对这种边界不确定的处理非常有效,典型算法有基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法.本文针对RFA(R0ughFuzzyApproach)算法存在的不足,提出了一种新的基于粗糙集的leader聚类算法(NRL,Novel Rough-based Leader).其基本思想是首先数据项由于与其最近类中心的距离不同,分别被划分到leader集或者supporting leader集,然后对leader集和supporting leader集进行标号,得到聚类结果.实验结果表明NRL算法非常有效.  相似文献   

17.
陆林花 《计算机仿真》2009,26(7):122-125,158
为了在聚类数不明确的情况下实现聚类分析,提出一种新的结合最近邻聚类和遗传算法的动态聚类算法.新算法包括两个阶段:第一阶段用最近邻聚类算法根据最近邻方法把最相似的实例分到同一个簇中并根据一些相似性或相异性度量过滤掉噪声数据从而得到初始聚类集,第二阶段是遗传优化阶段,利用动态聚类评估函数,动态地合并初始聚类集,从而获得接近最优的解.最后对算法进行了实验仿真,实验结果表明方法在事先不知道聚类数的情况下能够有效地进行聚类.  相似文献   

18.
最短路径分析是GIS网络分析的基础。传统的最短路径算法中,比较经典的算法是Dijkstra算法。由于地理信息系统中的数据具有不确定性、数据量庞大等特点,因此采用传统的Dijkstra算法进行最短路径分析就不适应。为此本文分析了传统网络中的最短路径算法-Dijkstra算法在时变权值网络结构中的局限性,给出了一种适应于时变权值网络的最短路径算法,并且利用改进的邻接表作为存储结构对算法进行了优化。  相似文献   

19.
一种新的中心对称聚类算法   总被引:2,自引:0,他引:2  
Data clustering is an important reserch field in data mining.The key of the clustering algorithm is the distance measure.In this paper,we put forward a new distance measure based on central symmetry,Then we apply it to data clustering.The experimental studies prove the feasibility of this algorithm and get a satisfied result in face detection.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号