首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
方刚 《计算机工程》2010,36(23):63-65,68
针对现有频繁邻近类别集挖掘算法存在重复计算和冗余邻近类别集的问题,提出一种依赖于真子集的频繁邻近类别集挖掘算法,适合在海量数据中挖掘空间对象的频繁邻近类别集。该算法用析构法建立邻近类别集数据库,用产生邻近类别集真子集的方法计算支持数,实现一次扫描数据库提取频繁邻近类别集。算法无需产生候选频繁邻近类别集,且计算支持数时无需重复扫描,从而达到提高挖掘效率的目的。实验结果表明,在海量空间数据中挖掘频繁邻近类别集时,该算法比现有算法更快速有效。  相似文献   

2.
无候选项的频繁邻近类别集挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有的频繁邻近类别集挖掘算法因产生候选项而存在冗余计算,提出一种无候选项的频繁邻近类别集挖掘算法,其适合在海量数据中挖掘空间对象的频繁邻近类别集;该算法以交叉搜索方式,用产生邻近类别集非空真子集的方法来计算支持数,实现一次扫描数据库挖掘频繁邻近类别集。算法无需产生候选频繁邻近类别集,且计算支持数时无需重复扫描数据库,达到了提高挖掘效率的目的。实验结果表明其在海量空间数据中挖掘频繁邻近类别集时,该算法比现有算法更快速更有效。  相似文献   

3.
方刚 《计算机工程》2012,38(11):62-65
在幂集理论的基础上,引入约束幂集概念,提出一种依赖于约束幂集的频繁邻近类别集(NCS)挖掘算法。该算法采用计算约束幂集映射的方法,生成候选频繁NCS并计算支持数,使其能避免冗余候选项的产生以及减少对数据库的重复扫描次数。实验结果表明,该算法在挖掘约束频繁NCS时比现有挖掘算法更快速有效。  相似文献   

4.
在频繁邻近类别集挖掘中,由于用户指定约束条件的动态变化,现有挖掘算法因多次重复扫描空间事务而存在冗余计算,故提出一种频繁邻近类别集的动态约束挖掘算法,其能根据用户发出的动态约束指令,提取满足用户需求的频繁邻近类别集;该算法用数组索引映射邻近类别集,用正整数幂集法计算支持数和搜索满足用户动态约束的频繁邻近类别集;该算法无需产生候选频繁邻近类别集且不重复扫描缓冲分析得到的空间事务;为了验证算法的实用性和高效性,将其应用到移动环境中缩短移动系统的响应时间,尽最大努力来提高用户满意度,通过移动计算下的仿真实验表明该算法比现有算法更快速更有效。  相似文献   

5.
王晓峰  张松筠 《计算机科学》2006,33(12):196-199
Apriori算法已成为关联规则挖掘的一个经典方法,广泛地被应用于如贸易决策、银行信用评估、金融保险等诸多领域。这种自底向上方法挖掘短频繁项集时效果较好,当频繁项集较长时,其时间复杂度量呈指数增长态势。本文结合自顶向下和自底向上搜索两种方法,提出一种能更好解决长、短频繁项集问题的双向挖掘方法。通过计算复杂度分析的实验表明,所提出的方法是有效可行的。  相似文献   

6.
多约束下的频繁项集挖掘   总被引:1,自引:0,他引:1  
贾磊  裴仁清 《计算机工程与应用》2003,39(31):184-185,197
为了要从大量的频繁项集中筛选出有用的规则,引入基于约束的频繁项集的挖掘,有学者已经研究了基于单调型、简洁型约束和Tough型约束的频繁项集挖掘技术,但基于多约束下频繁项集挖掘问题还没有得到解决。论文就是基于这个问题,通过对构造的包含有多约束的算式的研究,确定了在什么情况下多约束能满足单调或反单调的条件。这不但使多约束能够融入到Apriori算法中去,而且提高了多约束条件下候选频繁项集检验的速度和效率。  相似文献   

7.
发现频繁项目集是多种数据挖掘应用中的的,最新的研究主要围绕减少事务数据库的扫描次数进而减少挖掘过程的I/O代价来提高效率.本文提出一种快速挖掘频繁项目集的算法FDFI(fast discoveryfrequentitemsets).该算法利用深度优先搜索的特点,结合频繁项目集的性质,有效地缩小了搜索空间,并采用独特的支持度计数策略,只需一次数据库扫描,就可计算所有项目集的支持度,大大减少了数据扫描量.最后作者对这一算法的性能进行了理论分析和实验验证.  相似文献   

8.
空间频繁并置模式(SPCP)是一组空间特征的子集,它们的实例在地理空间中频繁地出现在一起.基于内存物化实例邻近关系并搜索模式实例效率较高,但实例信息会被重复存储.图数据库技术能高效地对具有复杂关联关系的数据建模,但基于实例邻近关系图移植已有的挖掘方法不能发挥图遍历的优势.针对上述问题,探索了基于图数据库的空间频繁并置模...  相似文献   

9.
基于双空间搜索的频繁项挖掘方法   总被引:6,自引:1,他引:6  
1 引言 1998年Roberto J.和Bayardo Jr.利用自底向上搜索和项目集排序的方法建立了一种挖掘长型频繁项的Max-Miner算法;Lin D.和 Z.Kedem提出了一种双向钳形搜索Pincer-Search方法,利用自底向上搜索产生的非频繁项集来约束和修剪自顶向下方向的最大侯选频繁项集,候选频繁项集来自于Apriori方法。这两种方法虽然细节有所不同,但修剪最大频繁项的思想类似。假设{{1,2,3,4,5,6}}是最大候选频繁项MFCS(maximum-frequent-candidate-set),{1,6}和{3,6}是新发现的非频繁项集,对MFCS考虑{1,6}得{{1,2,3,4,5},{2,3,4,5,6}}。再用{3,6}更新这个MFCS:由于{3,6}是{2,  相似文献   

10.
刘芳 《计算机工程》2012,38(1):59-61
基于图的关联规则挖掘算法会产生大量候选项集。针对该问题,提出一种结合双向搜索策略的改进算法。按照支持度对频繁 1-项集排序,对频繁k-项集的最长超集进行验证,利用Apriori算法进行剪枝。实验结果表明,在支持度阈值较小时,改进算法能有效减少候选项集的数量,提高挖掘效率。  相似文献   

11.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于前缀树的高效频繁项集挖掘算法,通过对事务集进行预处理,创建索引表并分配索引编号,保证前缀树中事务顺序的一致性,根据索引编号等信息创建紧凑的前缀树,采用自底向上的挖掘与投影的方式挖掘出频繁项集。实验结果表明,该算法挖掘效率高、占用空间少。  相似文献   

12.
粗集理论能支持数据挖掘与知识发现的多个步骤,如数据预处理、数据简化、规则生成、数据依赖关系获取等,为数据挖掘与知识发现提供了新的思路和方法。本文将粗集理论引入空间数据挖掘领域,介绍了粗集理论的基础理论和一系列方法,给出了应用实例,并探讨粗集理论在空间数据挖掘中的应用。  相似文献   

13.
荀娇  徐连诚  杨仁华 《计算机工程》2012,38(19):41-44,48
针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法.将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集.从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨越式搜索和连接.整个过程只需扫描一次数据库,不会产生候选项集.实验结果表明,该算法能提高频繁项集的挖掘效率.  相似文献   

14.
杨涛  李龙澍 《微机发展》2005,15(5):116-118,154
提出了一种能够对含有时间序列数据的数据库信息进行数据挖掘的方法。首先使用时间序列相似搜索方法对其中的时间序列数据进行模式发现,然后将时间序列数据转化为离散型数值,进一步使用粗糙集理论进行数据约简和规则提取。通过使用这种方法能够对含有时序数据的信息进行充分的挖掘并发现其中的规律。  相似文献   

15.
基于频繁模式树的约束最大频繁项集挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。  相似文献   

16.
李海峰 《计算机工程》2011,37(14):59-61
提出一种采用图形处理器挖掘闭合频繁项集的方法,用二进制数据表示项集,利用单指令多数据的体系结构实现并行计算,结合项集索引树,可以提高项集支持度计算和项集查找的速度。在2种数据集上的实验结果表明,该方法能够用更少的空间保存频繁项集的全部信息,并减少挖掘时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号