首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
关联规则挖掘的一种改进算法   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘中重要的研究课题,R.Agrawal和R.Srikant于1994年提出的Apriori算法是关联规则挖掘的最有影响的算法,针对Apriori算法中频繁项集产生效率低这个核心问题,本文给出分辨矩阵、分辨向量并提出基于分辨矩阵的改进算法,它能有效提高频繁集的产生效率.  相似文献   

2.
基于事务相似矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3  
通过对Apriori算法挖掘过程的深入分析,提出一种改进的关联规则挖掘算法——基于事务相似矩阵的关联规则挖掘算法(ARBSM):在压缩事务布尔矩阵的基础上构建一个事务相似矩阵,直接查找高阶肛项频繁集,有效解决了Apriori算法逐层搜索的迭代产生频繁项集的瓶颈问题。测试结果表明,ARBSM算法可以高效地挖掘潜在的强关联规则。  相似文献   

3.
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集.Apriori算法是频繁项集挖掘的有效算法.在Apriori的算法中,采用哈希树存储平凡项集的候补项集以便快速计算其支持度.本文在分析算法所存在的效率瓶颈的基础上,提出了一个有效的改进算法,通过利用一维数组替代算法中复杂的哈希树...  相似文献   

4.
针对经典Apriori算法会产生大量冗余规则的缺点,在两方面对算法进行了改进:一方面是对产生频繁项集方式的改进,使算法只产生包含目标项的频繁项集;另一方面是对产生规则方式的改进,使算法只产生关联后件中包含目标项的关联规则.Apriori算法改进前后的对比表明:改进后的Apriori算法可以避免非目标规则的产生,使算法更符合成绩分析的需要,提高算法的执行效率.将改进的Apriori算法应用于成绩分析中表明,改进后的算法能够挖掘出各门前导课程成绩对后续课程成绩的影响,因此可为教师制定有针对性的教学计划提供参考.  相似文献   

5.
针对Apriori算法需要频繁扫描事务数据库并且会产生大量候选项集的不足,提出一种改进的Apriori算法。采用矩阵压缩的思想,增加了3个向量,分别表示事务矩阵中各行各列1的个数,即事务项目数和项目支持数,以及重复的事务出现次数,从而减小矩阵规模,避免多次扫描数据库。在矩阵运算过程中,对矩阵中事务项目数和项目支持数进行排序并删除不满足条件的项集和非频繁项集,形成新的矩阵结构,提高空间效率。对改进后的算法进行性能分析和试验分析发现,该算法相对于Apriori算法具有更高的效率,同时可以更有效的挖掘出频繁项集。  相似文献   

6.
关联规则主要用来发现数据库中存在的频繁项集.研究关联规则Apriori算法,并利用该数据挖掘技术对高校图书馆管理信息系统中的数据进行挖掘研究,并将挖掘到的规则结果应用到高校图书馆公共检索系统中,达到优化公共检索系统并且向读者提供多元化信息检索服务的目的.  相似文献   

7.
随着关系数据库的广泛应用,研究在关系数据库中发现关联规则的的算法成为当前的重要问题之一.本文在Apriori算法的理论基础上,提出了一种在关系数据库中发现关联规则的算法.该算法只需扫描一次数据库即可得到频繁项集,并利用非频繁项集来减少候选项集的生成,从而提高了算法的执行效率,同时也降低了算法对内存容量的要求.  相似文献   

8.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

9.
Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。  相似文献   

10.
基于图的Apriori改进算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则挖掘中的经典算法,算法的核心思想是一种基于频繁理论的自底向上的递推方法。文中对Apriori算法进行分析,发现其中存在的问题。对Apriori算法做了改进。改进后的算法基于自顶向下的思想。利用有向图给出计算候选项集和项集支持度计数的更快的方法,同时简  相似文献   

11.
借助分割数据技术优化了经典的Apriori算法,实现了对候选项集的分组统计。给出了优化Apriori算法的MapReduce编程实现模型,达到了Apriori算法并行化的目的。实验结果表明,该算法能够大量减少键/值对的产生,提高了算法的效率,并且随着挖掘频繁项目集节点数的增加,算法的加速比成线性提高。  相似文献   

12.
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

13.
一种基于APRIORI性质的多维关联规则挖掘算法的研究   总被引:4,自引:0,他引:4  
Apriori算法是一种找频繁项集的基本算法,它常常被用于单维关联规则的挖掘。本文在对数据立方体的组织结构以及Apriori算法包括它的一些变形算法进行了深入研究的基础上,给出了一种适用于多维关联规则挖掘的算法,并分别通过理论和实验方法对此算法的性能进行了分析。  相似文献   

14.
数据包应用层固定位置频繁出现的字节组合是识别应用层协议的一种重要的签名特征(signature)。数据挖掘中经典的Apriori算法在提取协议签名特征时具有准确性高、覆盖面广等优势,但同时也存在候选集规模大、重复扫描数据库等问题。在运用深度包检测技术的基础上改进Apriori算法,有效降低计算复杂度,并能够自动发现一种由确定的字节值和字符类型组合而成的协议签名特征。实验表明,文章的方法产生的签名特征具有准确的协议区分能力,并且在协议版本更新情况下的适应能力强,同时具有较好的未知协议特征发现能力。  相似文献   

15.
为了对学生考试成绩数据进行分析,提出一种改进的Apriori算法.在垂直数据表示方式上采用广度优先搜索和交叉计数,充分发挥垂直数据表示与交叉技术的效率优势,同时利用Apriori算法的剪枝策略,有效减少计数后选项集的数目.最后将改进后Apriori算法应用于考试成绩分析,实验结果发现学生各科目考试成绩优良影响关系,为学...  相似文献   

16.
提出一种基于Apriori算法的改进算法,用来对C-NCAP汽车碰撞数据进行分析,同时利用Apriori算法的剪枝策略,有效减少计数后选项集的数目,最后将改进后的Apriori算法应用于汽车碰撞分析仿真系统,结果显示,汽车各碰撞试验间呈良好的影响关系。  相似文献   

17.
基于Apriori数据挖掘算法研究   总被引:3,自引:0,他引:3  
关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号