首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于频繁模式树的分布式关联规则挖掘算法   总被引:1,自引:0,他引:1  
何波 《控制与决策》2012,27(4):618-622
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的.  相似文献   

2.
基于频繁模式树的关联规则增量式更新算法   总被引:48,自引:1,他引:48  
研究了大型事务数据库中关联规则的增量式更新总是,提出了一种基于频繁模式树的关联规则增量式更新算法,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

3.
传统的关联规则挖掘研究事务中所包含的项与项之间的关联性,而负关联规则挖掘不仅要考虑事务中包含的项,还要考虑事务中不包含的项。给出了完全负关联规则的定义,提出一种基于树的算法Free-PNP,通过此算法挖掘数据库中的负频繁模式,继而得到所要挖掘的完全负关联规则。通过实验验证了算法的有效性。  相似文献   

4.
柳文涛 《福建电脑》2008,24(6):11-12
在数据挖掘中,关联规则挖掘一直是国内外研究的热点之一,本文在正关联规则的基础上,主要探讨了负关联规则的挖掘算法,提出了对负关联规则的前项和后项所对应正项的支持度研究问题,并对其进行了分析处理。  相似文献   

5.
虽然FP-Growth算法能够有效地从数据库中挖掘频繁模式,但如何由其挖掘出的频繁模式中高效地产生关联规则仍是一个相当复杂的问题。该文提出了用于组织频繁模式的线索频繁模式树(TFPT)和一个从TFPT中挖掘关联规则的高效算法—最短模式优先算法(SPF)。挖掘模式Y的关联规则时,SPF算法应用了两个优化策略,避免了对大量的不可能成为规则XY-X左部的Y的子集的检查,从而获得了很好的性能。实验表明:与类FP-Growth算法结合时,SPF算法运行速度远远快于Apriori算法,并有相当好的可伸缩性。  相似文献   

6.
基于频繁模式树的分布式约束性关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
在分布式环境中挖掘约束性关联规则是当前研究的热点问题之一。该文在FP-growth算法的基础上,提出了一种新的分布式挖掘约束性关联规则算法DAMICFP。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。  相似文献   

7.
钱雪忠  惠亮 《计算机应用》2011,31(5):1339-1343
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPMax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算法改传统的FP-tree为数字频繁模式树DFP-tree,提高了超集检验的效率;采用的预测剪枝策略减少了挖掘的次数;基于降低项集维度的挖掘方式,减少了候选项的数目,避免了递归地产生条件频繁模式树,提高了算法的效率。实验结果表明,BDRFI的效率是同类算法的2~8倍。  相似文献   

8.
基于FP-tree的最大频繁模式挖掘算法   总被引:11,自引:0,他引:11  
冯志新  钟诚 《计算机工程》2004,30(11):123-124
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明.算法FP-Max在挖掘密集型数据集方面是高效的。  相似文献   

9.
基于索引数组和复合频繁模式树的频繁闭项集挖掘算法   总被引:1,自引:0,他引:1  
频繁闭项集惟一确定频繁项集且规模小得多.CROP是一种基于复合频繁模式树的、频繁闭项集高效挖掘算法,但存在着候选结点过多的问题.这些非闭合结点的生成、检查和剪裁带来了大量不必要的操作.提出了一种改进的频繁闭项集挖掘算法CROP_Index.该算法用"索引数组"来组织数据,找到频繁共同出现的项集.基于二进制位图,给出了一个包含索引的计算方法,并利用索引启发信息合并,得到复合型频繁模式树的初始结点;同时给出一些新的性质,使得改进的算法只生成闭合结点,从而节省了大量不必要的操作,缩小了搜索空间.实验结果表明该算法效率较高.  相似文献   

10.
FP-growth算法是目前较高效的频繁模式挖掘算法之一,该算法不产生候选项集,但递归构造“条件FP-Tree”的CPU 开销和存储很大.为此提出了一种频繁模式挖掘算法IFPmine.首先,为了节省内存空间,采用了约束子树的挖掘方法;其次,采用了数组技术来减少树的遍历时间,从而提高算法的效率.实验结果表明,IFP算法是一种较有效的频繁模式挖掘算法,其挖掘效率优于STFP-树算法和FP-树算法,而需要的内存却少于STFP-树和FP-树算法.  相似文献   

11.
正负关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
本文提出了一种快速有效的正、负关联规则挖掘算法 MPNAR。另外,针对关联规則挖掘算法中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法。实验结果表明算法 MPNAR 是有效和可行的。  相似文献   

12.
基于频繁模式树的普遍化关联规则挖掘   总被引:2,自引:1,他引:2  
提出了基于频繁模式树的普遍化关联规则挖掘算法 MGAR- FP,充分利用频繁模式树的性质 ,避免大量候选模式的生成和频繁模式匹配 ,提高了挖掘的效率和速度 .实验表明 ,算法是有效的 ,比传统的普遍化关联规则挖掘算法Cum ulate快  相似文献   

13.
一种用于挖掘正负关联规则的可量化标准   总被引:5,自引:0,他引:5       下载免费PDF全文
传统的关联规则数据挖掘的支持度-置信度框架存在着弊端。一方面,它不能发现同时满足支持度和置信度而其前提和结论却相互独立的规则;另一方面,也不能区分正负关联规则。该文提出了一种评价关联规则的可量化的标准,进一步提出一种同时挖掘正负关联规则的框架,用此框架来分析调研问卷。  相似文献   

14.
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想 知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时 ,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约 束条件,提出了一种快速的基于FP-tree的约束最大频繁项目集挖掘算法CMFIMA,并对其更 新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA.  相似文献   

15.
研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减少了扫描数据库的次数,且不用产生大量的候选项集,提高了数据挖掘的效率。  相似文献   

16.
一种有效的关联规则增量式更新算法   总被引:6,自引:2,他引:6  
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

17.
对演变数据进行关联规则挖掘的新方法   总被引:3,自引:0,他引:3  
齐雁  李石君  薛海峰 《计算机工程》2002,28(11):126-127,130
针对已有经常性周期关联规则在演变数据和周期长度方面的局限性,文章提出一种新的方法,从而可以对演变数据进行经常性长周期关联规则的挖掘,这种方法针对演变数据的动态环境,通过对数据块的动态聚类得到周期分段,然后在每一分段内利用低支持度关联规则挖掘算法来发现周期较长的关联规则,整个算法可以在GEMM算法的基础上进行动态模式保持。  相似文献   

18.
发掘多值属性的关联规则   总被引:45,自引:1,他引:45  
张朝晖  陆玉昌  张钹 《软件学报》1998,9(11):801-805
属性值可以取布尔量或多值量.从以布尔量描述的数据中发掘关联规则已经有比较成熟的系统和方法,而对于多值量则不然.将多值量的数据转化为布尔型的数据是一条方便、有效的途径.提出一种算法,根据数据本身的情况决定多值量的划分,进而将划分后的区段映射为布尔量,在此基础上可发掘容易理解且具有概括性的、有效的关联规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号