首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
基于离群指数的时序数据离群挖掘   总被引:12,自引:0,他引:12  
离群数据挖掘(0utlier mining,简称离群挖掘)是数据挖掘的重要内容.该文针对时序 数据进行离群数据挖掘方法的研究,提出了离群指数的概念,在此基础上设计了时序数据离群数 据挖掘算法,并对某钢铁企业电力负荷时序数据进行离群数据挖掘,结果表明了算法的有效性.  相似文献   

2.
该文提出在高维空间下离群点发现技术的新方法,即利用粗糙集的属性约简技术减少高维空间的维数,并在各个关联规则子空间下对数据集进行基于密度的离群点挖掘,使高维空间下的离群点挖掘更具有实用性。数据分析表明,该算法能有效地发现高维空间数据集中的离群点。  相似文献   

3.
提出了一种针对离群数据规则挖掘的决策树构造方法。通过给出一个平均致密度的新定义和对离群数据产生机制的深入分析,提出离群数据的致密度往往比正常样本数据高的新认识,指出离群数据本质上也是不平衡数据,基于此提出了一种自动标记离群数据的新算法,并进一步在该算法和C4.5算法部分功能的基础上提出了一种基于离群数据自动标记的模糊决策树构造方法。仿真实验结果表明,该方法具有高效的离群数据规则挖掘能力,能处理不平衡数据,优化决策树的结构,挖掘出更高信任度的规则,有一定的实用价值。  相似文献   

4.
基于规则的分类数据离群挖掘方法研究   总被引:15,自引:0,他引:15  
离散数据的挖掘(outlier minign,简称离群挖掘)是数据挖掘的重要内容,现有的离群数据挖掘算法大多对分类数据(categorical data)缺乏有效的处理,提出了基于规则的分类数据离群挖掘方法,采用多层最大离群支持度maxsup,搜索离群规则,有效地解决了这一问题,用这一方法对医学流行病数据进行了各种,分析了该方法的适用范围、性能,验证了方法正确性;另外,实验表明,经过离散化后,基于  相似文献   

5.
唐成龙  邢长征 《计算机应用》2012,32(8):2193-2197
针对已有的基于网格的离群点挖掘算法挖掘效率低和对于大数据集适应性差的问题,提出基于数据分区和网格的离群点挖掘算法。算法首先将数据进行分区,以单元为单位筛选非离群点,并把中间结果暂存起来;然后采用改进的维单元树结构维护数据点的空间信息,以微单元为单位进行非离群点筛选,并通过两个优化策略进行高效操作;最后以数据点为单位挖掘离群点,从而得到离群数据集合。理论分析和实验结果表明了该方法是有效可行的,对大数据集和高维数据具有更好的伸缩性。  相似文献   

6.
当前的数据集离群点挖掘方法一般设置为引导式结构,挖掘效率较低。为此,提出基于谱聚类算法的人力资源数据集离群点快速挖掘方法。先预处理多维人力资源数据集,采用多节点机制提高挖掘的效率,然后构建谱聚类测算离群点快速挖掘模型,采用回归处理实现快速挖掘。测试结果表明,相同的测试周期中,文章提出的方法最多可以挖掘27次,说明在谱聚类算法的辅助下,该算法的挖掘效率更高。  相似文献   

7.
离群点检测是数据挖掘领域的一个重要的研究方向.针对高维数据空间中离群数据的挖掘速度和准确度的问题,提出一种基于单元格的离群点检测算法.该算法在高维数据空间中对数据进行降维,并且将数据依据属性权重划分成若干空间单元,从而减少查询次数,提高离群数据的挖掘速度.另外,通过对属性的加权处理能够更有效地突出属性的特殊性,从而提高挖掘的准确度.理论分析和实验结果表明了该方法是有效可行的.  相似文献   

8.
提出一种基于非线性双曲方程广义特征分解的离群数据挖掘方法,并应用于大型分布式数据库离群数据挖掘。采用广义特征分解的方法求解数据集的离群因子,求解非线性双曲方程广义特征Taylor展开。对离群数据的线性部分进行隐格式逼近,对非线性部分进行显格式逼近,挖掘到的离群数据深度和方位信息。构建水生态环境并进行仿真实验。实验结果表明,该算法在对大型分布式数据库的离群数据挖掘中,能很好地挖掘到离群数据张成子空间谱信息,具有较好的数据特征挖掘性能。  相似文献   

9.
项响琴  汪彩梅 《微机发展》2010,(1):124-127,131
离群数据挖掘是数据挖掘领域的一个研究分支,而聚类算法分析则是进行离群数据挖掘的重要研究方法之一。文中首先分析研究离群数据挖掘方法,对多个离群数据挖掘算法进行分析比较,讨论各自的优点和不足,同时针对高维空间数据的特点,分析挖掘高维空间数据中的离群点方法。其次对聚类分析算法进行讨论,分析一种基于网格和基于密度的聚类方法——聚类高维空间算法(CLIQUE算法),运用它可以更好地挖掘高维空间中的离群数据。提出了CLIQUE算法的有待改进的思想,为以后的研究指明方向。  相似文献   

10.
基于聚类高维空间算法的离群数据挖掘技术研究   总被引:3,自引:1,他引:2  
离群数据挖掘是数据挖掘领域的一个研究分支,而聚类算法分析则是进行离群数据挖掘的重要研究方法之一。文中首先分析研究离群数据挖掘方法,对多个离群数据挖掘算法进行分析比较,讨论各自的优点和不足,同时针对高维空间数据的特点,分析挖掘高维空间数据中的离群点方法。其次对聚类分析算法进行讨论,分析一种基于网格和基于密度的聚类方法——聚类高维空间算法(CLIQUE算法),运用它可以更好地挖掘高维空间中的离群数据。提出了CLIQUE算法的有待改进的思想,为以后的研究指明方向。  相似文献   

11.
Web使用模式挖掘是数据挖掘技术在 Web领域的应用。介绍了 Web使用模式挖掘的基本概况 ,重点讨论了 Web使用模式挖掘过程中的几个关键问题 ,即源数据的收集与集成 ,挖掘方法的不断更新及 Web使用模式分析等问题  相似文献   

12.
针对国内现有挖矿行为检测识别技术的准确性不高、缺少具体挖矿行为证据等问题,提出了一种基于网络流量的挖矿行为检测识别模型和多维度挖矿指纹特征提取方法,该模型通过对Stratum、Getwork等矿池协议的指令特征提取分析,能够高效准确地实现对挖矿行为的自动检测识别,并提炼出多维度的挖矿指纹特征,包括挖矿指令、矿池币种、软件型号、挖矿账号、算力、能耗等信息。实验结果表明,该模型能够准确识别相关挖矿行为并分析得出其多维度挖矿指纹特征,算力特征识别的准确性为95%左右,总体的挖矿行为检测识别的准确性为91.73%,为虚拟货币挖矿检测提供一种精准有效的解决方案。  相似文献   

13.
韩世聪 《微型电脑应用》2000,16(6):22-23,33
本文从互连网发展的趋势入手,对路径模式发掘进行了研究。先简要介绍数据库发掘的概况及网上数据发掘的特点,后结合关联法和组合概率法,并以算法和实例详细对之进行分析。  相似文献   

14.
Web用户访问模式挖掘研究   总被引:5,自引:0,他引:5  
1 引言目前World Wide Web(WWW)已经发展成为拥有近亿个工作站、数十亿页面的分布式信息空间,在这个分布式信息空间中蕴涵着具有巨大潜在价值的知识,也带来了巨大的经济效益和社会效益。对于不同层次、不同使用目的和爱好的浏览者需要个性化的信息服务,希望网站能够根据自己的浏览习惯,动态定制  相似文献   

15.
一种新的动态频繁项集挖掘方法   总被引:1,自引:0,他引:1  
频繁项集挖掘是关联规则挖掘的重要步骤。在数据动态变化的环境下进行关联规则挖掘具有重要的现实意义。提出一种动态频繁项集挖掘算法,该算法建立在前一阶段挖掘的基础上,能避免过多地扫描数据库而影响挖掘性能,在最后生成全局频繁项集时,不需要全程扫描数据库,根据之前挖掘结果有选择地扫描相关的事务子集。实验表明,该算法挖掘性能远远优于Apriori算法,能有效地实现在数据动态变化环境下的挖掘频繁项集。  相似文献   

16.
建立了一种基于高维聚类的探索性文本挖掘算法,利用文本挖掘的引导作用实现数据类文本中的数据挖掘。算法只需要少量迭代,就能够从非常大的文本集中产生良好的集群;映射到其他数据与将文本记录到用户组,能进一步提高算法的结果。通过对相关数据的测试以及实验结果的分析,证实了该方法的可行性与有效性。  相似文献   

17.
将数据挖掘技术引入图像处理可以在一定程度上解决图像内容的表示、存储和检索目前存在的很多难点。从图像数据挖掘的特征、方法、过程及实例等几方面介绍了图像数据挖掘,其挖掘方法和原型结构存在着巨大的改进空间,有待进一步研究。  相似文献   

18.
一种基于MaxGap约束的高效序列模式挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
如何有效地将约束与挖掘过程结合,将是提高基于约束的序列模式发现算法效率的关键。本文针对一种典型的强约束形式--MaxGap约束,提出了一种有效的序列模式挖掘方法。该方法利用MaxGap约束的特点,采用了高效的扩展单项剪枝策略,有效地减小了搜索空间的大小,提高了挖掘效率。实验结果表明,本文方法在性能上明显优于现有的方法。  相似文献   

19.
Web挖掘及其在电子商务中的应用研究   总被引:1,自引:0,他引:1  
林瑞娟  侯德文 《微机发展》2006,16(8):186-188
作为一种崭新的信息处理技术,Web挖掘受到了人们极大的关注。电子商务是一种新型的现代商务模式,如何将Web挖掘应用于电子商务,来有效地处理信息,成为企业共同关注的问题。文中介绍了Web挖掘的概念和分类,阐述了Web挖掘在电子商务中的挖掘方法和过程,讨论了Web挖掘在电子商务中的典型应用,并就一个事例进行了具体的分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号