首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

2.
一种Apriori算法的改进   总被引:2,自引:0,他引:2  
Apriori算法在处理关联规则分析时,当数据立方体数据稠密时,实现迭代性质将需要非常复杂的数据结构。针对上述问题,本文提出了一种改进的Apriori-ni算法,该算法没有用迭代性质来剪枝,即不基于迭代属性的算法。对Apriori算法和Apriori-ni算法进行了分析和比较,实验结果表明,当项目集很多时,Apriori-ni算法能节约计算开销,从而提高算法的效率。  相似文献   

3.
吴文妹  陈国龙 《福建电脑》2005,(4):17-17,14
本文利用频繁项集的一个性质,对Apriori算法中的生成候选项集这一步进行改进,大大减少不必要的计算,从而加快候选项集生成的速度。  相似文献   

4.
吕真  李丹 《数字社区&智能家居》2011,(6):1234-1235,1244
该文通过对Apriori算法的基本思想和性能的研究剖析,认为Apriori算法存在一些不足;并且根据这些不足提出了相应的改进UDApriori算法对经典算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高.  相似文献   

5.
基于关联规则理论,在传统的单维单层布尔型Apriori算法的基础上提出一种改进的多维多数据类型Apriori算法,将算法用于分析复杂的交通事故数据库.理论分析和实验数据表明,算法是有效可行的,实验结论达到了交通管理部门的预期要求,可以用于辅助相关部门作出道路交通改进工作的决策.  相似文献   

6.
一种改进的动态遗传Apriori挖掘算法   总被引:2,自引:0,他引:2  
在经典关联规则算法Apriori的基础上,提出了一种改进的动态遗传Apriori挖掘算法。通过动态遗传Apriori挖掘算法对学生成绩管理数据库中的课程进行分析,找出各课程之间的隐藏关系,得到一些合理、可靠的课程关联规则,从而根据这些规则进行课程的合理设置。实验结果表明,该算法能高效地解决数据挖掘问题。  相似文献   

7.
挖掘关联规则中Apriori算法的一种改进   总被引:45,自引:2,他引:45  
李绪成  王保保 《计算机工程》2002,28(7):104-105,134
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究。给出了该算法的一个改进算法,该改进算法提高了原算法的性能。  相似文献   

8.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

9.
10.
根据Apriori算法的原理,提出一种具有跳跃式前进与回退补齐的改进算法J_Apriori。计算频繁K项集后,求出未剪枝的候选2K项集。在满足跳跃式前进策略的条件下先求出频繁2K项集,则2K项集的所有(K+1)至(2K-1)项子集不需要再扫描庞大的数据集,可以直接加入到频繁项集中,然后再回退补齐那些不是2K项集的子集的频繁项集。改进的算法减少了扫描数据集的次数。实验表明改进的算法有效地提高了Apriori算法的效率。  相似文献   

11.
一种提高Apriori算法效率的方法   总被引:10,自引:2,他引:8  
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,需要大量进行两个操作:判断两个k-项集是否前k-1项相同且最后一项不同;判断一个项集是否为另一个项集的子集。利用Apriori算法中项集之间都是有序的这一特点可以减少以上两个操作的执行次数,从而达到对Apriori算法进行优化的目的。实验结果表明,经过优化了的Apriori算法在运行效率上有一定的提高。  相似文献   

12.
Apriori算法是关联规则的经典算法,并己经被越来越多的企业使用。它在给企业带来经济效益的同时,也让人们意识到算法自身的不足:第一,该算法在扫描事务数据库的次数过多,从而需要承担很大的I/O负载;第二,它可能产生庞大的候选集。为了提高Apriori算法的效率,针对减少扫描事务数据库次数的方法,提出一种改进挖掘效率的算法。  相似文献   

13.
传统数据挖掘关联规则Apriori算法直接移植到云计算平台,数据挖掘效率虽然有了数量级的提升,但由于需要频繁地扫描事务数据库,增加了系统I/O、内存和通信的开销。提出一种基于矩阵的并行关联规则算法Apriori_MMR,该算法结合了数据划分的思想进行并行化改进,简化了生成候选项的连接步骤,仅需对事务数据库扫描两次,同时在计算过程中还能对事务进行压缩从而进一步提高了算法的性能。通过两种算法在不同数据规模下算法性能对比分析实验和两种算法在相同数据集不同节点数对比实验,共同验证了Apriori_MMR的运算效率至少要比Apriori_MR高出两倍左右,且设置的支持度阈值越小,效果愈明显。  相似文献   

14.
基于频繁项集挖掘算法的改进与研究   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘领域中重要的研究内容,频繁项集挖掘又是关联规则挖掘中的关键问题之一。针对已有的频繁项集挖掘算法存在的问题,通过对Apriori算法的分析,提出了Inter-Apriori频繁项集挖掘算法。该算法使用交集策略减少扫描数据库的次数,从而使算法达到较高的效率。实验结果表明,Inter-Apriori算法是Apriori算法效率的2~4倍。  相似文献   

15.
改进的多维关联规则算法研究及应用   总被引:1,自引:1,他引:1  
关联规则是数据挖掘研究中最主要、最活跃的领域之一。以Apriori算法为前提,借助Apri-oriTid算法事务压缩的思想,减少了重复扫描数据库的时间;并提出了一种利用事务标识列表,该列表长度即是对应候选项集的支持度计数,在计算支持度计数时,仅需要得到对应列表长度即可,从而缩短了计算计数时的比较时间;同时,在生成频繁项集时引入地址索引机制,在剪枝过程中,利用候选项集的首元素在地址索引表中快速定位,减少了多次扫描事务数据库,有效地缩短了计数时间和占用的内存空间。利用改进的算法对科研管理系统数据进行关联关系分析,从中萃取数据中隐含的、有价值的信息,辅助下一阶段的科研管理工作。并通过试验进行性能比较得出,改进后的算法效率更高。  相似文献   

16.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

17.
针对Apriori算法存在的不足,提出了一种新的优化Apriori的方法。该方法通过优化频繁项集修剪策略,减少无效候选项集的产生;优化连接策略,减少连接次数,避免相同项目的多次重复比较;结合事务数据库逐步压缩技术,减少对无用事务的扫描次数。实验结果表明,经过优化的Apriori算法具有更好的运行效率。  相似文献   

18.
基于频繁项集特性的Apriori算法的改进   总被引:3,自引:0,他引:3  
高宏宾  潘谷  黄义明 《计算机工程与设计》2007,28(10):2273-2275,2378
Apriori算法是关联规则中一种重要算法.Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据.由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构--树型结构来存储事务项集数据,使得算法在数据集量巨大时,性能得到有效提高,并用实例验证了这些改进能够正确、有效、快速地实现该算法.  相似文献   

19.
顾庆锋  宋顺林 《计算机工程与设计》2007,28(13):3060-3062,3233
Apriori算法是挖掘关联规则的经典算法.在分析该算法的基础上,在实际项目应用当中,结合SQL的特点,提出Apriori算法在SQL中的改进算法-Apriori_Sql.应用Apriori_Sql算法只需扫描一遍数据库,在数据库临时表中建立原始数据库的压缩数据映射,实验表明该算法是一种高效的关联规则的挖掘算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号