首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
一种改进的关联规则挖掘算法   总被引:2,自引:0,他引:2  
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。  相似文献   

2.
3.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述。最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

4.
关联规则挖掘的一种改进算法   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘中重要的研究课题,R.Agrawal和R.Srikant于1994年提出的Apriori算法是关联规则挖掘的最有影响的算法,针对Apriori算法中频繁项集产生效率低这个核心问题,本文给出分辨矩阵、分辨向量并提出基于分辨矩阵的改进算法,它能有效提高频繁集的产生效率.  相似文献   

5.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

6.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点.针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述.最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望.  相似文献   

7.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

8.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。  相似文献   

9.
对Web日志数据进行收集、预处理、划分事务并产生具备分类关联规则挖掘条件事务集,然后采用矩阵算法挖掘事务集中的关联规则,并利用关联规则构造分类器来对Web用户进行分类,同时对矩阵算法进行了改进.实验表明此方法是有效的.  相似文献   

10.
频繁集的挖掘问题是数据挖掘的关键问题,本文提出了一种基于频繁树的挖掘频繁集的新方法,该算法从频繁项开始搜索、筛选产生符合要求的频繁结点,构成频繁树,通过有效的筛选方法和独特的构成策略,大大的减少了候选集的数量。也方便产生支持度更高的频繁集。  相似文献   

11.
Indirect association is a high level relationship between items and frequent item sets in data. There are many potential applications for indirect associations, such as database marketing, intelligent data analysis, web -log analysis, recommended system, etc. Existing indirect association mining algorithms are mostly based on the notion of post - processing of discovery of frequent item sets. In the mining process, all frequent item sets need to be generated first, and then they are fihered and joined to form indirect associations. We have presented an indirect association mining algorithm (NIA) based on anti -monotonicity of indirect associations whereas k candidate indirect associations can be generated directly from k - 1 candidate indirect associations, without all frequent item sets generated. We also use the frequent itempair support matrix to reduce the time and memory space needed by the algorithm. In this paper, a novel algorithm (NIA2) is introduced based on the generation of indirect association patterns between itempairs through one item mediator sets from frequent itempair support matrix. A notion of mediator set support threshold is also presented. NIA2 mines indirect association patterns directly from the dataset, without generating all frequent item sets. The frequent itempair support matrix and the notion of using tm as the support threshold for mediator sets can significantly reduce the cost of joint operations and the search process compared with existing algorithms. Results of experiments on a real - word web log dataset have proved NIA2 one order of magnitude faster than existing algorithms.  相似文献   

12.
为了进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究.提出了通过FP-tree的操作实现频繁项集快速挖掘的相关性质和新的搜索策略,在此基础上提出了基于FP-tree的频繁项集挖掘的改进算法.算法运用递增构建候选项集模式树的策略缩小搜索空间,运用FP-tree的部分遍历操作简化搜索过程.在多个标准测试数据集上的实验结果表明,该算法的执行时间比同类算法减少了一个数量级,且占用较少的内存空间,因此该算法对于提高频繁项集和频繁闭项集的挖掘效率具有明显的效果.  相似文献   

13.
关联规则挖掘算法中常用的支持度和可信度是对关联规则在统计意义上的有效性度量,在挖掘结果的有用度上缺乏指导作用,它们不能作为有用性的指标.从数据挖掘的最终目的出发定义了基于最终用户实际目标的效益度指标,并对最小效益度筛选性质进行了论证,提出了一种快速有效的关联规则挖掘算法.讨论了从关联规则的兴趣模板和限制模板转换到效益度的方法.实验结果表明,效益度指标具有支持度与可信度不可替代的作用;该算法的最小效益度剪切技术是有效的,不仅可以较大幅度地提高算法速度,而且可以作为规则模板的统一实现算法以及提供更精确的控制.  相似文献   

14.
海量数据上挖掘关联规则的并行算法   总被引:3,自引:0,他引:3  
针对目前关联规则挖掘算法中数据库规模很大时算法执行时间太长的问题。指出了并行计算是解决该问题的一个有效方法。利用新提出的可以忽略仅仅在少于1/4的结点机上的局部频繁项集,给出了一种新的并行随机抽样方法,并利用机群并行计算机的自治能力和I/O高度并行的特点,提高了抽样算法对海量数据的处理能力和效率。理论分析和实验数据显示,该算法的加速比接近于处理机的个数p,通信复杂性为处理机的个数p的对数,具有良好的扩展性和海量处理能力,且精确度较高。  相似文献   

15.
高效关联规则数据挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘领域的一个重要问题,由于关联规则挖掘通常是基于超大型数据库或数据仓库,算法的效率在一定程度上决定挖掘的成败,针对关联规则挖掘中的主要任务--频集发现过程中存在的几个问题,提出了项目树的概念,引出了一种新的控制模式,并设计了相应的高效挖掘算法,大大提高了挖掘效率。  相似文献   

16.
提出了一种基于最小支持度变化的挖掘最大频繁项集的增量式更新算法MFIU(Maximum Frequent Itemsets Updating).针对最大频繁项集更新时的特性,分别对最小支持度变大和变小提出了两种不同的处理方法,对于最小支持度变大的复杂情况,采取了分块的更新策略,并为减少不必要的候选项集,利用了如果X是一个最大频繁项集,则其所有子集都是频繁项集,但都不可能是最大频繁项集,而进行了独特的剪枝方法.最后通过实例分析了该算法.  相似文献   

17.
快速发现关联规则挖掘算法的并行化方法   总被引:1,自引:0,他引:1  
分析挖掘关联规则主要并行算法及性能.针对算法中负载平衡和时间响应问题,提出一种高效可行的挖掘关联规则的NA(Ntransactionalgorithms)并行算法,给出了NA算法的策略.通过前期实验结果表明,这种快速发现关联规则的并行算法在计算大项集过程中不需要同步和交换数据,在任意情况下,可独立计算局部大项集.  相似文献   

18.
随着自动化和信息技术的应用,大量的生产实时数据被长期保存到企业信息系统中.充分挖掘这些数据背后蕴藏的信息和知识,对于优化生产过程、节能降耗和提高决策水平具有重要的价值.通过分析天津盘山电厂数据,以降低煤耗率为目的,使用关联规则算法对火电厂数据进行挖掘,并分析了各个参数对煤耗率的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号