首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进.在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法.该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则.理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的.  相似文献   

2.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

3.
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法.  相似文献   

4.
序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。  相似文献   

5.
大型数据库中的高效序列模式增量式更新算法   总被引:7,自引:1,他引:7  
提出一种称为FIMS(fast incremental mining of sequential patterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题。主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次数和侯选序列的生成,从而提高挖掘的效率。实验结果显示在更新数据量远小于整个数据库的大小时,FIMS算法的性能优于GSP算法4-7倍。  相似文献   

6.
讨论了当从序列数据库中删除某些信息时,序列模式的更新维护问题。提出了一种新的算法MA_D(Maintaining Algorithm while Deleting information), 处理因数据库更新而引起的序列模式的维护问题。该算法充分利用在前次模式挖掘过程中得到的信息,降低了挖掘新的序列模式的开销。实验分析表明,该算法对于序列模式的维护是十分有效的。  相似文献   

7.
分析了经典关联规则挖掘及相关的隐私保护等问题,同时研究了多关系关联规则的刻画和挖掘问题.通过重新定义查询模式,改进了Warmr方法,使查询模式支持“频繁查询模式的子模式也必然是频繁的“这种Apriori特性,进而将其移植到多关系规则的挖掘过程,从而加快规则的挖掘.研究了有针对性的敏感规则的挖掘方法,通过挖掘包含敏感信息的所有频繁查询模式,从中导出所有能够导致信息泄露的敏感规则;为了平衡数据可用性和安全性之间的矛盾,通过隐藏所有敏感规则中公共关系的元组,在保证规则隐藏和数据安全的同时,降低了对数据可用性的影响.  相似文献   

8.
序列模式挖掘是数据挖掘中最重要的研究课题之一.针对支持度置信度框架的GSP算法的产生的序列模式很多时候不是用户感兴趣的,有时甚至会产生误导这一问题,我们提出用统计学中的X^2测试来衡量序列模式的相关性.相关性使在项集上的计算是向上封闭的,这样就减少了我们在搜索相关和不相关的项集的边界过程中出现的问题.  相似文献   

9.
现在的数据挖掘技术大多只针对单一数据源进行挖掘,但在实际应用中,碰到的大多是多个数据源的情况.作者在对多数据源的挖掘进行研究的基础上,进一步提出了一个多数据源模式合成的算法,并验证了此种算法的正确性和效率.  相似文献   

10.
对序列模式挖掘中的5种算法的执行过程和特点进行了研究,并对这几种算法的时间和空间执行效率进行了分析,指出这5种算法各自的使用范围,得出的结果对序列模式挖掘的应用具有一定的参考价值.  相似文献   

11.
序列模式的一种挖掘算法   总被引:5,自引:1,他引:5       下载免费PDF全文
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录数据库频繁集中各元素CtiD表的基础上,提出了序列模式挖掘的一种算法ISP。该算法考虑了项目集与序列之间的关系,利用时序连接法,采用不同的构造法,构造出相对应的候选集,从而计算出频繁集。由于算法ISP能够利用中间的挖掘结果,故提高了挖掘过程的效率。  相似文献   

12.
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录频繁集各元素的Ctid表的基础上,有研究者提出一种渐进式序列模式挖掘算法IMSP,目的是支持度保持不变,而数据库变化不大时,如何利用前次的结果和中间结果,以加速本次挖掘过程。笔者深入分析了算法IMSP结构,指出该算法在时间复杂度,挖掘规则的完备性上的不足,同时也指出利用该算法所可能得到的错误结果。  相似文献   

13.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法,自从1995年序列模式挖掘的概念被提出以来,人们不断地对序列模式挖掘算法进行研究和改进,本文介绍了一种新的序列模式挖掘方法-CSE算法及其具体实现方法,并对该算法性能做了初步的评价。  相似文献   

14.
针对当前的隐私保护关联规则挖掘算法在应用中存在的一些不足,如:在算法效率与计算精确度之间顾此失彼,提出了基于安全多方计算方法与随机干扰方法相结合的PPARMSR挖掘算法.该方法结合了安全多方计算方法的精确性和随机干扰方法的高效率,使用项集随机干扰矩阵同时干扰多属性,且兼顾它们的相关性,提前对候选频繁项集的剪枝,减少安全多方计算的处理量.通过试验验证了PPARMSR算法在保持隐私度的同时,还能够在计算精确度与运行效率之间实现较好的折中效果.  相似文献   

15.
基于PrefixSpan的快速交互序列模式挖掘算法   总被引:3,自引:0,他引:3  
为了克服序列模式挖掘过程中重复运行挖掘算法而产生的时空消耗,提出了一个快速、简单而有效序列模式的交互式算法FISPM,利用前次挖掘得到的序列构造序列模式数据库用来存储挖掘出来的所有序列, 通过缩减本次挖掘所要构造投影数据库的频繁项的数量来减少构造投影数据库所需的时间以及投影数据库的大小,从而减少时间和空间消耗,提高挖掘效率.通过设置全局最小支持度来减少算法迭代次数. 实验结果证明在交互挖掘过程中FISPM效率优于PrefixSpan.  相似文献   

16.
 模式分类过程涉及到对原始训练样本的学习,容易导致用户隐私的泄露。为了避免模式分类过程中的隐私泄露,同时又不影响模式分类算法的性能,提出一种基于主成分分析(PCA)的模式分类隐私保护算法。该算法利用PCA 提取原始训练数据的主成分,并将原始训练样本集合转化为主成分的新样本集合,然后利用新样本集合进行分类学习。选用Adult 数据集和KDDCUP 99 数据集进行仿真实验,并采用正确率和召回率进行性能评价,结果表明,该隐私保护算法通过PCA 提取原始数据特征属性的主成分,可避免原始属性的泄露,同时PCA 在一定程度上可实现去噪,从而使分类器的分类性能优于原始数据集的分类性能。与已有算法比较,该隐私保护算法具有更好的模式分类精度和隐私保护性能。  相似文献   

17.
肖哲  任胜兵 《科技信息》2007,(36):69-69,101
本文阐述了序列模式的基本概念,对序列模式挖掘的一般经典算法和增式挖掘、多维模式挖掘等拓展算法进行了较为的全面介绍,列举了序列模式挖掘当前的广泛应用,讨论了研究的发展趋势及面临的挑战。  相似文献   

18.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法 ,自从1995年序列模式挖掘的概念被提出以来 ,人们不断地对序列模式挖掘算法进行研究和改进 .本文介绍了一种新的序列模式挖掘方法—CSE算法及其具体实现方法 ,并对该算法性能做了初步的评价 .  相似文献   

19.
本文提出了一种通用的增量式关联规则挖掘算法MIAR,可用于数据库更新改变时的挖掘.研究并提出了增量式关联规则挖掘中的重要性质,充分利用上一次挖掘出的知识,对候选项集进行修剪.确定了一种启发式的数据库选择扫描策略,在保证候选项集数不会增长很快的情况下,减少数据库扫描次数,有效提高算法的时间性能.大量数据试验算法优越于Apriori和FUP2.  相似文献   

20.
序列模式挖掘算法综述   总被引:1,自引:0,他引:1  
目前的主要序列模式挖掘算法可以分为3类:①基于Apriori的候选码生成-测试的方法;②基于垂直格式的候选码生成-测试的方法;③基于模式增长的方法.在介绍序列模式挖掘基本概念的基础上,描述了典型的挖掘算法,着重分析第②类序列模式挖掘算法的关键技术,并对各种算法进行详细的分析与比较,总结出它们的优缺点:前两类方法因产生巨大的候选序列而致挖掘代价剧增,而第③类模式增长方法避免了候选序列的产生,但挖掘长模式效率低.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号