共查询到17条相似文献,搜索用时 78 毫秒
1.
数据挖掘领域中已提出了很多聚类算法及其改进形式,但对增量式聚类方法的研究较少。当数据集因为更新而发生了变化,那么数据挖掘结果也要进行必要的更新。由于数据量大,如果在新增数据后再对所有数据运用聚类算法进行聚类,效率显然不高,因此进一步研究增量式聚类算法是很有必要的。在一种改进的基于遗传算法的粗糙聚类方法(IRCBGA)的基础上,提出了一种增量式粗糙聚类方法。数值仿真表明该算法能很好地解决传统聚类算法的数据更新的聚类问题。 相似文献
2.
为了有效聚类动态数据,妥善处理已存在的类簇与新增数据的关系,高效利用计算资源,提高聚类的效率,扩散涌现的增量聚类算法被提出.该算法在扩散涌现聚类算法的基础上,利用近邻传播算法完善了算法的分裂机制,实现了新旧数据的有效聚合.实验结果表明,该算法有效实现了动态数据的聚类,提高了聚合动态数据的效率和资源的利用率. 相似文献
3.
聚类是数据挖掘领域中最活跃的研究分支之一,聚类技术在其他的科学领域也有广泛的应用。迄今为止已经提出了大量的聚类算法,其中基于密度的DBSCAN算法因其很多优点而备受关注,为了减少DBSCAN的区域查询次数,降低I/O开销而提出的改进算法有FDBSCAN、LSNCCP等。随着应用的发展,增量聚类显得越来越重要,而现有的增量聚类算法存在很大的局限性。基于LSNCCP,提出了一种有效的增量聚类算法,同时它也可以用于对LSNCCP进行性能优化。 相似文献
4.
传统的基于密度的带噪声空间数据聚类算法主要存在以下问题:聚类只对具有数值属性的数据有效,而对具有非数值属性的数据失效;参数设置困难且聚类结果对参数较为敏感;聚类的度量以绝对密度值为标准,无法发现密度等级不同的聚类结果.针对以上问题,提出一种面向混合属性数据的、基于相对密度的聚类算法 RDBC M,同时提出解决这类问题的增量式聚类算法,并从理论和仿真实验两方面分析、验证了算法的有效性和加速效果. 相似文献
5.
针对时间序列数据流的增量聚类研究较少的现状,采用多维时态子空间聚类对数据流的增量聚类进行探究。多维时态子空间聚类是指在连续一段时间内,数据流中的值的距离小于2α,它的另一个要求是最后的聚类结果必须包含一定数量的数据流。聚类结果随时间的演变能持续增量地更新,这个更新机制采用滑动窗口的形式,把最早时刻的数据删除后,添加入新到达的数据。采用股票数据对算法进行测试与验证,实验证明,该算法效果较好。 相似文献
6.
针对传统的聚类算法存在开销大、聚类质量差、聚类速度慢等问题,提出一种新的云计算环境下高复杂度动态数据的增量密度快速聚类算法。首先,依据密度对云计算环境下高复杂度动态数据进行聚类,从数据空间中找到部分子空间,使得数据映射至该空间后可产生高密度点集区域,将连通区域的集合看作聚类结果;其次,通过DBSCAN算法进行增量聚类,并对插入或删除数据导致的原聚类合并或分裂进行研究;最后,在更新的过程中通过改变核心状态数据的邻域中含有的全部核心数据进行处理,从插入或删除数据两方面进行增量聚类分析。实验结果表明,所提算法开销低、聚类速度快、聚类质量高。 相似文献
7.
对于大型数据库,如空间数据库和多媒体数据库,传统聚类算法的有效性和可扩展性受到限制。通过动态增量的方法,在基于密度和自适应密度可达聚类算法的基础上,根据BIRCH算法中聚类特征的概念,利用簇特征设计与实现了一种新的动态增量聚类算法,解决了大型数据库聚类的有效性以及空间和时间复杂度问题。理论分析和实验结果证明该算法能够有效地处理大型数据库,使聚类算法具有良好的可扩展性。 相似文献
8.
在分析常用聚类算法的特点和适应性基础上提出一种基于密度与划分方法的聚类算法。该算法根据数据对象密度分布状态来自动确定聚类簇密度吸引中心点和聚类簇的初始划分;然后利用划分的方法,根据密度可达定义来寻找密度可达数据对象簇,从而完成数据对象簇的最终聚类。实验证明该算法能够很好地处理具有任意形状和大小的簇,能够有效地屏蔽噪声和离群点的影响和发现孤立点;同时也减小了输入参数对领域知识的依赖性。 相似文献
9.
10.
11.
聚类算法在模式识别、数据分析、图像处理、以及市场研究的应用中,需要解决的关键技术是如何有效地聚类各种复杂的数据对象簇。在分析与研究现有聚类算法的基础上,提出了一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够有效聚类任意分布形状、不同密度、不同尺度的簇;同时,算法的计算复杂度与传统基于密度的聚类算法相比有明显的降低。 相似文献
12.
13.
14.
针对FCM算法的缺点,提出了一种基于改进的FCM的增量式聚类方法。该算法首先对模糊C均值算法进行加权,并将权系数归一化,然后将改进的算法与增量式聚类算法结合。改进的方法既提高了FCM算法的性能,避免了FCM算法的缺陷,并能够实现增量式聚类,避免了大量的重复计算,并且不受孤立点的影响。实验表明该算法的有效性。 相似文献
15.
目前的动态文摘方法几乎都是基于文档批处理机制的,无法适应实际应用中文档数据是以不稳定的数据流形式到来,需要实时更新摘要的需求。针对上述问题,提出一种利用K近邻思想对句子进行建模,再增量聚类句子实现子主题划分的动态文本摘要方法。该方法根据K近邻基本思想形成两层句子图模型,用增量图聚类方法对句子进行处理,同时考虑结合时间因素提高句子新颖度来抽取动态文摘。该方法能基于文档数据流增量式地抽取动态文摘,实现文摘内容的实时更新。通过在TAC2008和TAC2009的Update Summarization数据集上的测试,证明本文方法在动态文摘抽取上的有效性。 相似文献
16.
基于动态粗集理论,提出了一种改进的动态粗集K-均值算法。改进后的算法依据数据对象的迁移系数大小,被划分到某一类的膨胀上近似集或膨胀下近似集;在计算类的质心时采用其中数据对象集的迁移系数的平均值作为权值来衡量它对质心的贡献。在UCI机器学习数据库原始数据集及其噪音数据集上的实验结果表明,改进后的动态粗集K-均值算法提高了聚类的准确性,降低了迭代次数。 相似文献
17.
针对小型无人机模型参数精度不高的问题,提出一种速度分段的增量非线性动态逆姿态控制方法。该方法根据无人机力矩方程,用非线性动态逆构建出角加速度为隐式输入,舵面偏转量为输出的关系式;运用小扰动原理计算角加速度,并通过在不同的速度区间内计算机体力矩对角速度的偏导,并将该结果作为角加速度修正因子的方法,得到舵面偏转增量与角加速度的直接关系式;基于新发现的关系式构建了内、外环控制律,角加速度作为反馈降低了对模型参数的敏感性,修正因子的引入提高了控制精度。仿真实验表明了该方法的有效性。 相似文献