共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
魏丽 《数字社区&智能家居》2007,(11):637-639
聚类分析技术是数据挖据中的一种重要技术。本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类,研究分析了聚类的主要算法.并从多个方面对这些算法的性能进行比较。 相似文献
3.
数据挖掘中聚类算法比较研究 总被引:16,自引:0,他引:16
聚类算法是数据挖掘的核心技术,本文结合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中常用聚类算法作了比较分析,以便于人们更容易,更快捷地找到一种适用于特定问题的聚类算法。 相似文献
4.
数据挖掘已经被广泛的应用于商业银行,电信行业,心理学,生物医学等各行各业中。由于数据挖掘涉及的学科领域和方法很多,所以就有多种分类方法。这里介绍了聚类方法的要求以及常见的聚类算法。现在还有很多改进的聚类算法,对H—K算法做了主要介绍。 相似文献
5.
6.
魏丽 《数字社区&智能家居》2007,(21)
聚类分析技术是数据挖据中的一种重要技术.本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类,研究分析了聚类的主要算法,并从多个方面对这些算法的性能进行比较. 相似文献
7.
数据挖掘中聚类算法的综述 总被引:5,自引:0,他引:5
聚类算法是数据挖掘领域中非常重要的技术。本综述按照聚类算法的分类,对每一类中具有代表性的算法进行了介绍,分析和评价。最后从发现聚类形状、所适用的数据库和输人数据顺序的敏感性等方面进行了算法推荐,供大家在选择聚类算法时参考。 相似文献
8.
数据挖掘已经被广泛的应用于商业银行,电信行业,心理学,生物医学等各行各业中。由于数据挖掘涉及的学科领域和方法很多,所以就有多种分类方法。这里介绍了聚类方法的要求以及常见的聚类算法。现在还有很多改进的聚类算法,对H-K算法做了主要介绍。 相似文献
9.
数据挖掘中聚类算法研究 总被引:13,自引:7,他引:13
聚类分析是数据挖掘领域中一个非常热门的研究课题,应用于各个领域的聚类算法非常多。本文介绍了衡量聚类算法性能的几个指标,对聚类分析进行了分类,列举了每类中典型的聚类算法,重点分析了神经网络中的自组织特征映射(SOM)算法。最后提及了聚类分析方法的应用范围以及今后需要解决的问题和发展方向。 相似文献
10.
聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法。本文介绍了聚类算法的发展史和概况,详细说明了聚类算法的分类,最后总结了聚类算法的应用。 相似文献
11.
张军 《网络安全技术与应用》2014,(11):171-171
随着我国现代化的迅速发展,伴随着快速发展的脚步其数据也越来越多,如何处理这些数据成为了越来越受人关注的问题。因为大数据多,种类复杂的特征,使得数据挖掘越来越重要,而自我学习可以对数据进行分析,并找出其相关模式,因此在商业领域应用广泛。本文主要就是研究数据挖掘中的自我学习算法,了解自我学习算法的特征,并分析在实际中可以应用到哪些领域。 相似文献
12.
拼车是一种环保节能的出行方式,合理的拼车策略可以缓解交通压力,优化乘客体验,减少碳排放等。针对拼车问题,提出了两阶段的拼车匹配策略。第一阶段匹配过程是利用基于改进Hausdorff距离的乘客分配算法,将拼车需求分配到具体车辆,从而将多车辆问题转化为单车辆问题;第二阶段匹配过程,采用基于匹配度的聚类筛选出与车辆最为匹配的拼车需求。实验结果表明该算法和流程能分别应用于单车次、多车次接力换乘的拼车方案推荐,匹配简单准确。 相似文献
13.
针对大数据分析在大规模并行分布式系统和软件平台上可扩展的问题,提出了一个基于无参数围绕质心二进制分裂聚类(clustering using binary splitting,CLUBS)的大数据挖掘技术。该技术以完全无监督的方式工作,基于最小二次距离的准则进行分裂聚类将数据与噪声分离,通过中级精炼来识别仅包含异常值的块并为剩余块生成全面的簇,设计CLUBS的并行化版本以实现对大数据进行快速有效的聚类。实验表明CLUBS并行算法不受数据维度和噪声的影响,且比现有算法具有更好的可扩展性且速度较快。 相似文献
14.
15.
生物信息学(蛋白质结构分析、基因组识别)、社会网络(实体间的联系)、Web分析(Web链接结构分析、Web内容挖掘和Web日志搜索)以及文本信息检索等的迅速发展积累了大量图数据,对于图数据的挖掘逐渐成为研究领域的热点。一些诸如聚类、分类、频繁模式挖掘的传统数据挖掘研究逐渐拓展到图数据领域。通过介绍现阶段图数据挖掘技术的研究进展,总结了图数据挖掘的特点、现实意义、主要问题以及应用场景,讨论并预测了图数据,尤其是不确定图数据研究的发展趋势和热点。 相似文献
16.
17.
近年来隐私保护数据挖掘已经成为数据挖掘的研究热点, 并取得了丰富的研究成果。但是, 随着移动通信、嵌入式、定位等技术的发展与物联网、位置服务、基于位置的社交网络等应用的出现, 具有个人隐私的信息内容更加丰富, 利用数据挖掘工具对数据进行综合分析更容易侵犯个人隐私。针对新的应用需求, 对隐私保护数据挖掘方法进行深入研究具有重要的现实意义。在分析现有的隐私保护数据挖掘方法分类与技术特点的基础上, 提出现有方法并应用于新型分布式系统架构应用系统、高维数据及时空数据等领域存在的挑战性问题, 并指出了今后研究的方向。 相似文献
18.
数据挖掘技术中关联规则可以很好地发现数据项之间存在的相互关系,同时有大量的挖掘算法可供选择。聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。本文研究 聚类和关联规则的挖掘算法。 相似文献
19.
20.
基于SQL Server 2000下数据挖掘算法的研究 总被引:1,自引:0,他引:1
微软的SQL Server2000是当今最流行的数据库管理软件之一,研究了在SQL Server 2000上数据挖掘实现方面的决策树算法.决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识.SQL Server 2000/Analysis Service两层结构决策树,采用了以类记数表及深度优先策略生成,在建树算法和数据库间设立数据挖掘中间件.并讨论了通过使用像SQL Server 2000 Analysis Service这样的典型工具来如何实现数据挖掘模型的创建,且为商业组织的决定挖掘出必要的数据. 相似文献