排序方式: 共有8条查询结果,搜索用时 140 毫秒
1
1.
2.
聚类是数据挖掘中一个非常活跃的研究分支,任意形状的聚类则是一个有待研究的开放问题。提出一种包含分类属性取值频率信息的类间差异性度量和一种对象与类的相似度定义,在此基础上提出一种能处理任意形状的聚类算法,可处理混合属性数据集。在人造数据集和真实数据集上检验了提出的算法,并与相关算法进行了对比,实验结果表明,提出的算法是有效可行的。 相似文献
3.
从数据集中挖掘数据间的相互关系及其关联规则是数据挖掘研究领域的核心内容之一,为了挖掘实体表现出的数据特征与实体具备因素间的关系,提出了一种挖掘方法.先采用聚类分析的方法对实体的数据进行了聚类,再通过关联分析的方法分析聚类簇中实体的因素,继而得出实体具备的因素与实体数据间的相互影响及其关联规则.通过该方法分析了学生具有的因素对学生学习成绩的影响,分析结果表明了方法的可行性. 相似文献
4.
为解决大规模数据集聚类过程中内存容量受限问题,提出了一种基于聚类个数约束的快速聚类算法,只需扫描一趟原始数据集,半径阈值随聚类过程动态变化;同时定义了一种包含分类属性取值频率信息的类间差异性度量,可用于混合属性数据集,时间复杂度与空间复杂度同数据集大小,属性个数近似成线性关系.在KDDCUP99数据集上的实验结果表明,提出的算法输入参数少,具有良好的聚类特性,可用于大规模数据集. 相似文献
5.
离群检测是数据挖掘领域的一个重要内容,它为分析各种海量、复杂、含有噪声的数据提供了新的方法.对离群簇进行了定义并据此提出一种离群检测方法,该方法增量式地对原始数据集进行聚类,在得到的簇中寻找离群簇.根据提出的簇间差异性度量,新方法可处理混合属性数据集.同时探讨了参数取值.基于人工数据集和真实数据集上的实验表明,新方法检测离群点具有精度高、速度快的优点,适用于大规模数据集. 相似文献
6.
7.
针对任意形状聚类算法用于异常检测时参数设置困难的问题,提出一种基于聚类融合的异常检测算法:设置不同的半径阈值进行多次聚类,统计每次聚类中标记为异常的簇频率,将频率高的簇作为真正的异常.在UCI数据集上对该算法进行实验,结果表明:本算法可降低直接将小簇作为异常的高误报率,并且能提供给用户更为友好的操作. 相似文献
8.
1