期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

聚类是数据挖掘领域中的一个重要研究方向,聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用,迄今为止人们提出了许多用于大规模数据库的聚类算法。基于密度的聚类算法DBSCAN就是一个典型代表。以DBSCAN为基础,提出了一种基于密度的快速聚类算法。新算法以核心对象领域中所有对象的代表对象为种子对象来扩展类,从而减少区域查询次数,降低I/O开销,实现快速聚类,对二维空间数据测试表明：快速算法能够有效地对大规模数据库进行聚类,速度上数倍于已有DBSCAN算法。相似文献

6.

一种新的中心对称聚类算法 总被引：2，自引：0，他引：2

林嘉宜许剑峰彭宏《计算机科学》2003,30(6):136-138

Data clustering is an important reserch field in data mining.The key of the clustering algorithm is the distance measure.In this paper,we put forward a new distance measure based on central symmetry,Then we apply it to data clustering.The experimental studies prove the feasibility of this algorithm and get a satisfied result in face detection. 相似文献

7.

聚类算法研究

刘凤芹《计算机光盘软件与应用》2012,(21):60-61

聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。相似文献

8.

一种网格聚类的边缘检测算法

张鸿雁刘希玉付萍《控制与决策》2011,26(12):1846-1850

提出一种应用在基于密度的网格聚类算法中的边缘检测方法．通过对密集单元格周围的稀疏单元格进行检测,将符合条件的稀疏单元格归并到密集单元格中．该方法不仅可以修正由于网格划分失去的数据边缘部分,而且可以修正由于网格间隔和密度阈值设置不合理所导致的误差,同时所消耗的时间对整个聚类过程影响不大,是一种效果明显的网格聚类的改进方法．相似文献

9.

一种有效的增量聚类算法

许毕峰冯少荣薛永生刘笑锋翁伟《计算机科学》2004,31(11):93-96

聚类是数据挖掘领域中最活跃的研究分支之一,聚类技术在其他的科学领域也有广泛的应用。迄今为止已经提出了大量的聚类算法,其中基于密度的DBSCAN算法因其很多优点而备受关注,为了减少DBSCAN的区域查询次数,降低I／O开销而提出的改进算法有FDBSCAN、LSNCCP等。随着应用的发展,增量聚类显得越来越重要,而现有的增量聚类算法存在很大的局限性。基于LSNCCP,提出了一种有效的增量聚类算法,同时它也可以用于对LSNCCP进行性能优化。相似文献

10.

数据挖掘中聚类算法研究

周妍孔晓玲张然《福建电脑》2007,(8):9-10,21

聚类分析是数据挖掘的核心技术之一。本文介绍了当前最具代表性的聚类算法,分析它们各方面的特性,总结了聚类方法发展的趋势,并对聚类算法的研究提出了展望,便于研究者对已有算法应用与改进。相似文献

11.

初始聚类中心优化的k-means算法 总被引：37，自引：0，他引：37

下载免费PDF全文

袁方周志勇宋鑫《计算机工程》2007,33(3):65-66

传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。相似文献

12.

NLOF:一种新的基于密度的局部离群点检测算法 总被引：1，自引：0，他引：1

王敬华赵新想张国燕刘建银《计算机科学》2013,40(8):181-185

基于密度的局部离群点检测算法(LOF)的时间复杂度较高且不适用于大规模数据集和高维数据集的离群点检测。通过对LOF算法的分析,提出了一种新的局部离群点检测算法NLOF,该算法的主要思想如下:在数据对象邻域查询过程中,尽可能地利用已知信息优化邻近对象的邻域查询操作,有关邻域的计算查找都采用这种思想。首先通过聚类算法DBSCAN对数据集进行预处理,得到初步的异常数据集。然后利用LOF算法中计算局部异常因子的方法计算初步异常数据集中对象的局部异常程度。在计算数据对象的局部异常因子的过程中,引入去一划分信息熵增量,用去一划分信息熵差确定属性的权重,対属性的权值做具体的量化,在计算各对象之间的距离时采用加权距离。在真实数据集上对NLOF算法进行了充分的验证。结果显示,该算法能够提高离群点检测的精度,降低时间复杂度,实现有效的局部离群点的检测。相似文献

13.

一种分层聚类模型及其在电信行业的应用

苏进张佑生《计算机工程》2005,31(22):110-112

提出一种分层聚类算法,该算法可识别任意形状、大小的类,在某电信企业的客户分析中取得了较好的结果。算法首先从不同的角度对电信客户进行聚类或分类,然后以这些类为基础,实行自底向上的层次聚类得到最终的聚类结果。算法执行效率高,适合大规模数据的聚类问题。相似文献

14.

关于数据挖掘中聚类分析算法的比较 总被引：3，自引：0，他引：3

谷淑化吕维先马于涛《现代计算机》2005,17(3):26-29

聚类分析是数据挖掘领域中一个非常活跃的研究课题,应用于各个领域的聚类算法非常多.本文介绍了衡量聚类算法性能的几个衡量指标,对聚类分析进行了分类,列举了每个类型的聚类分析的典型算法,并就其性能做了比较,以便于人们更容易、更快速地找到一种适用于特定问题的聚类算法. 相似文献

15.

一种基于主成分分析的异常点挖掘方法 总被引：2，自引：0，他引：2

王洪春彭宏《计算机科学》2007,34(10):192-194

在对现有异常点挖掘算法分析的基础上,给出了一种异常点挖掘的新方法一基于主成分分析方法,该方法先用基于密度的聚类算法进行聚类,然后把不包含在任何聚类中的周围稀疏的样本对象用主成分分析（PCA）方法进行检验,确定是否为异常点,并通过实验数据验证了算法的可行性和有效性。相似文献

16.

基于人工鱼群算法的聚类挖掘

苏锦旗吴慧欣薛惠锋《计算机仿真》2009,26(2)

聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同种类.目前聚类分析算法普遍存在对初始参数敏感,难以找到最优聚类以及聚类有效性等问题.人工鱼群算法作为一种新型仿生优化算法,具有良好的克服局部极值和获得全局极值的能力.引入聚类数学模型,结合现有人工鱼群算法的特点和聚类算法理论,通过模拟鱼群的智能行为进行聚类分析,提出了一种基于人工鱼群算法的聚类挖掘方法.对空间数据的实验和蚁群算法的对比研究表明,该算法具有良好的聚类效果. 相似文献

17.

一种基于密度的高性能增量聚类算法 总被引：4，自引：1，他引：4

下载免费PDF全文

刘建晔李芳《计算机工程》2006,32(21):76-78

提出并证明了一种基于密度的高性能增量聚类算法，算法的主要工作包括：(1)利用分区和抽样技术对数据进行抽取和清理。(2)利用密度和网格技术对数据进行聚类。(3)改变阈值后提出一种增量算法，只对受影响的点重新计算聚类。(4)在动态环境下，数据增删后的增量聚类算法。实验证明，该算法能很好地处理高维数据，有效过滤噪声数据，大大节省聚类时间。相似文献

18.

基于遗传算法的K均值聚类分析 总被引：11，自引：0，他引：11

王敞陈增强等《计算机科学》2003,30(2):163-164

1 前言聚类分析就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同的簇中的对象差别较大。聚类分析目前应用广泛,已经成为数据挖掘主要的研究领域。通过聚类,人们能够识别密集的和稀疏的区域,从而发现数据的整体分布模式,还能找到数据间的有趣的相互关系。关于聚类分析目前已经有K均值,CURE等很多算法, 相似文献

19.

一种混合约束的半监督聚类算法

李雪梅王立宏宋宜斌《模式识别与人工智能》2011,24(3):452-456

提出一种混合约束的半监督聚类算法(HCC),综合考虑标号点和成对点约束信息的作用,使两种先验信息在聚类的过程中能以不同的方式发挥作用.给出理论推导、具体算法步骤、实验及分析.实验表明在HCC算法中,标号点对提高聚类结果的作用要比成对点约束信息的作用更明显,算法得到的CRI、聚类数、运行时间等多项指标都比对比算法好. 相似文献