首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 156 毫秒
1.
Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。针对Apriori算法,GBARM (Group Based Association Rules Mining)算法对事务集进行压缩,并且在统计Ck中各项集的支持频度时,逐步减小Ck的规模,从而改善算法的性能。  相似文献   

2.
一个高效剪枝的新关联规则挖掘算法   总被引:4,自引:0,他引:4  
分析了现有的对Apriori算法的改进方向,新算法将Apriori的剪枝步骤合并入从Lk-1与Lk-1连接生成Ck的连接步骤,通过使用临时项集TQ存储Lk-1中单个数据项集与Lk-1中其他数据项集连接的结果,从而将被扫描集合的大小从Lk-1缩减为L1的大小,极大地提高了Ck的生成效率。  相似文献   

3.
时域数据的挖掘是数据挖掘领域经常遇到的问题。而时域关联规则的发现研究是关联规则的一个重要研究课题。该文在对周期关联规则进行深入研究的基础上,形式化定义了基本的时域关联规则概念,并提出了基于Apriori的发现周期关联规则的CCAR算法。CCAR的核心思想是首先把各项目按照周期时间分布进行聚类,根据聚类结果把每个项目分成几个动态的有效时间区域。在应用Apriori算法时,用项目的各个时间区域扩展项目集Ⅰ,然后根据作者提出的带时间属性的JOIN操作由Lk-1生成Ck,并由约简操作删除Ck中不满足条件的候选频繁项目集以提高算法的效率。算法理论分析和实验都表明CCAR是有效的。  相似文献   

4.
Apriori算法是最经典的关联规则提取算法,但其存在产生庞大的候选频繁项集的缺点。该文针对Apriori算法这方面的不足,首先提出了所有频繁项集在其频繁2-项集的无向图中一定是一个圈的论点,并依该论点为基础,提出了一种基于树的快速寻找候选频繁项集的新方法。通过实例和实验结果表明,该方法不仅可以大大减少候选项集Ck的数目,而且有效地优化了算法的空间复杂度和时间复杂度。  相似文献   

5.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:0,他引:2  
朱其祥  徐勇  张林 《微机发展》2006,16(7):102-104
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法———Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

6.
多段支持度数据挖掘算法研究   总被引:17,自引:0,他引:17  
在基于相联规则的数据挖掘算法中,Apriori等算法最为著名。它分为两个主要步骤:(1)通过多趟扫描数据库求解出频繁项集;(2)利用频繁项集生成规则。随后的许多算法都沿用Apriori中“频繁项集的子集必为频繁项集”的思想,在频繁项集Lk-1上进行JOIN运算构成潜在k项集Ck。由于数据库和Ck的规模较大,需要相当大的计算量才能生成频繁项集。AprioriTid算法给每个事务增加了一个唯一标识Tid,其特点是只扫描一趟数据库,其余趟扫描(如第k趟扫描)均在相应的数据集Ck^-上进行。由于数据规模改变不大,各算法的效率差别并不明显。该文提出分段计算支持度的思想,是把一个项集的支持度分段计算,每一个段记录该项集在相应规模事务中出现的频度,从而构成一个支持度向量。由于有了项集的多段支持度,可以推测出该项集能否包含在更大规模的频率项集中,采用这种算法既提高了在扫描数据库中的信息获取度,又能及时剔除超集不是频繁项集的项集,进一步缩减了潜在项集的规模,在数据集扫描过程中,按文中定理1的思想调整数据集,达到提高频繁项集生成效率的目的。  相似文献   

7.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:2,他引:2  
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法——Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

8.
Apriori挖掘频繁项目集算法的改进   总被引:2,自引:0,他引:2       下载免费PDF全文
针对Apriori算法的不足,提出了一种新的优化算法Napriori。算法从优化产生2-项目集、事务压缩、项目压缩、优化连接等几个方面对Apriori算法进行优化,将散列技术应用于产生1-项目集和2-项目集,将压缩优化和连接优化应用于k-项目集。实验结果表明,Napriori算法运行速度比Apriori算法有了明显的提高。  相似文献   

9.
一种新的高效Apriori算法   总被引:6,自引:2,他引:6  
Apriori算法是关联规则挖掘中的经典算法。本文针对Apriori算法的瓶颈提出一种使用先验算法产生频繁2项目集。并给出了一种简单有效的逐步缩减交易数据库的方法,加快了频繁k项目集的验证速度。新算法减小了存储空间,并显著提高了Apriori算法的效率,并改进了数据挖掘算法的性能。  相似文献   

10.
关联规则挖掘算法研究   总被引:3,自引:0,他引:3  
Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。本文介绍了Apriori算法的思想,并分析了该算法的性能瓶颈。在此基础上,针对Apriori算法提出了一种改进方法,该方法采用转置矩阵的策略,只扫描一次数据库即可完成所有频繁项目集的发现。与其他经典的算法相比,本文提出的算法在项目集长度较大时,性能明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号