首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

2.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

3.
针对Apriori算法需要多次扫描数据库的缺陷,提出一种基于垂直事务关系的改进算法XApriori。该方法对原始事务数据库扫描后,采用项集事务垂直对应关系的位集合数据存储结构,并构建逻辑生成候选项集策略,利用数值统计的方法生成候选项集并确定频繁项集,实现关联规则的挖掘。对比实验结果表明,改进算法比Aprior算法关联规则挖掘的效率有所提高。  相似文献   

4.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

5.
针对Apriori算法在频繁项集挖掘过程中的缺陷,提出了一种基于权重的改进Apriori算法。该改进算法通过一次扫描事务数据库构造出二元事务矩阵,再用各事务和各项的平均权重替代权重支持度,最终挖掘出事务库中的频繁项集。通过实例分析和性能测试,证明了改进的Apriori算法避免了重复扫描事务数据库,使得算法在性能上有了明显优化,并且挖掘出了Apriori挖掘不到的、隐藏的、有价值的规则。  相似文献   

6.
基于Apriori数据挖掘算法研究   总被引:3,自引:0,他引:3  
关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高.  相似文献   

7.
关联规则挖掘是数据挖掘领域中的重要研究方向,该文在分析关联规则挖掘Apriori算法原理和性能的基础上,指出了该算法存在着两点不足:扫描事务数据库的次数和连接成高维候选项目集时的比较次数太多。并提出了一种效率更高的S-Apriofi算法,该算法通过采用新的数据结构和原理,克服了传统Apriori算法的缺点,从而大大提高了运算效率。  相似文献   

8.
一种基于APRIORI性质的多维关联规则挖掘算法的研究   总被引:4,自引:0,他引:4  
Apriori算法是一种找频繁项集的基本算法,它常常被用于单维关联规则的挖掘。本文在对数据立方体的组织结构以及Apriori算法包括它的一些变形算法进行了深入研究的基础上,给出了一种适用于多维关联规则挖掘的算法,并分别通过理论和实验方法对此算法的性能进行了分析。  相似文献   

9.
通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性.  相似文献   

10.
序列模式挖掘算法多是利用了关联规则挖掘中的 Apriori特性 .利用灰关联方法对原始序列 进行净化处理 ,从而减少挖掘算法中的噪声数据 . 其理论依据在于 ,如果一个序列是频繁的 ,那么该序列的时间间隔也必然是频繁的. 利用了灰关联分析方法找出两个项之间的频繁时间间隔 ,再利用该间隔扫描事务序列数据库 ,从而最终找出频繁序列 .  相似文献   

11.
对Web日志数据进行收集、预处理、划分事务并产生具备分类关联规则挖掘条件事务集,然后采用矩阵算法挖掘事务集中的关联规则,并利用关联规则构造分类器来对Web用户进行分类,同时对矩阵算法进行了改进.实验表明此方法是有效的.  相似文献   

12.
Apriori算法是挖掘布尔关联规则频繁项集的最有影响的数据挖掘算法之一,但由于数据挖掘本身决定其面临的是海量数据,因此在许多情况下会产生大量候选项集,从而严重影响挖掘的效率。本文提出一种简单有效的Apriori改进算法。  相似文献   

13.
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

14.
Web日志中时态约束浏览模式挖掘算法研究   总被引:1,自引:0,他引:1  
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.  相似文献   

15.
针对聚类布尔矩阵的Apriori算法—CBM_Apriori算法的不足之处,提出了一种基于聚类布尔矩阵的Eclat算法—CBM_Eclat算法。该算法首先对布尔矩阵使用K-medoids算法,获得权值和聚类后的布尔矩阵;然后将聚类后的布尔矩阵转换成Tidset,并采用逻辑"交操作"运算,进而有效地减少了聚类布尔矩阵存储和候选项集的生成,提高了该算法的执行效率。通过实例应用和算法执行结果都能够证明CBM_Eclat算法具有可行性和有效性。  相似文献   

16.
基于概念格的频繁闭项集增量挖掘算法研究   总被引:1,自引:0,他引:1  
近年的研究表明,概念格可以应用于解决频繁闭项集的挖掘问题.针对已有渐进式概念格构造算法中存在的问题,提出了一种基于概念格的频繁闭项集增量挖掘新算法——FIPT-I算法.新算法利用模式树对概念格进行组织,并利用模式树压缩数据库中的事务,在渐进式构造概念格的同时实现了事务的批处理,减少了概念格的调整操作时间.实验结果表明,与其他同类算法相比,FIPT-I算法对于增量挖掘频繁闭项集来说具有更高的效率.  相似文献   

17.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

18.
Indirect association is a high level relationship between items and frequent item sets in data. There are many potential applications for indirect associations, such as database marketing, intelligent data analysis, web -log analysis, recommended system, etc. Existing indirect association mining algorithms are mostly based on the notion of post - processing of discovery of frequent item sets. In the mining process, all frequent item sets need to be generated first, and then they are fihered and joined to form indirect associations. We have presented an indirect association mining algorithm (NIA) based on anti -monotonicity of indirect associations whereas k candidate indirect associations can be generated directly from k - 1 candidate indirect associations, without all frequent item sets generated. We also use the frequent itempair support matrix to reduce the time and memory space needed by the algorithm. In this paper, a novel algorithm (NIA2) is introduced based on the generation of indirect association patterns between itempairs through one item mediator sets from frequent itempair support matrix. A notion of mediator set support threshold is also presented. NIA2 mines indirect association patterns directly from the dataset, without generating all frequent item sets. The frequent itempair support matrix and the notion of using tm as the support threshold for mediator sets can significantly reduce the cost of joint operations and the search process compared with existing algorithms. Results of experiments on a real - word web log dataset have proved NIA2 one order of magnitude faster than existing algorithms.  相似文献   

19.
基于改进遗传算法的多维关联规则挖掘方法及应用   总被引:2,自引:1,他引:1  
对遗传算法进行改进,并应用于多维关联规则挖掘中.在该算法中提出了一种基于免疫机制的新选择策略,并引入随机数,采用自适应方法随机动态选取交叉和变异概率.这种新算法不仅有效地抑制了早熟收敛现象,而且大大提高了搜索效率.  相似文献   

20.
对国内外现阶段提出的协议进行了分析,并在Memon N协议的基础上提出了一种交互式买方-卖方数字水印协议.该协议能有效的应用于多方交易和二手交易,并使买卖双方实现了真正的匿名交易.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号