首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
提出了一种新颖的频繁模式挖掘算法,该算法与现有的挖掘算法相比具有明显的优点,首先,该算法不需要产生候选项集,其次该算法具有更少的数据库扫描次数,该算法在中小型数据库上挖掘关联规则只需要扫描交易数据库一次,对于大型交易数据库的关联规则挖掘最多也只需要扫描交易数据库两次。因而,该算法与现有的频繁模式挖掘算法相比具有更高的效率。  相似文献   

2.
由于网络入侵检测系统的实时性要求,将传统的关联规则挖掘算法直接应用到入侵检测系统中,运行效率往往不能满足实际的需要.考虑到网络审计日志实时更新的特点,提出了一种基于深度优先生成树的关联规则挖掘的改进算法FIDF,它改变了候选项集的产生顺序,优先寻找最大频繁项集.该算法只需扫描一次数据库,且当事务数据库和支持度阈值改变时,无需重新扫描数据库,提高了审计日志数据关联规则挖掘的效率,确保了入侵检测系统的实时性和准确性.  相似文献   

3.
赵静 《电脑开发与应用》2012,25(7):16-17,20
A priori算法是经典的关联规则挖掘算法,它利用逐层搜索的迭代方法完成频繁模式的挖掘工作,反复进行连接剪枝操作,思路简单易操作,但也伴随着产生庞大候选集,多次扫描数据库产生巨大I/O开销的问题,提出一种改进算法:基于矩阵的关联规则挖掘算法,同A priori算法比较,该算法只需扫描一遍数据库,就可直接查找k-频繁项集,尤其是当频繁项集较高的时候,该算法具有更高的执行效率,在大数据量的情况下更具有可行性。  相似文献   

4.
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。  相似文献   

5.
介绍了应用数据挖掘技术实现的一个在学生成绩数据库中挖掘关联规则的系统,提出了一种对学生成绩类数据库进行挖掘的关于项集的确定方法。针对该系统的需要,设计了确定频繁项集的方法和从规则产生集中获得单一后项关联规则的算法,最后分析了挖掘结果并比较了两种算法的性能。  相似文献   

6.
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。提出了一种改进算法,并将该算法与Apriori算法进行了比较。该算法只需要对数据库扫描一遍,并且存放辅助信息所需要的空间也少,结果表明该算法对关联规则挖掘较为有效。  相似文献   

7.
一种基于兴趣度的大型数据库关联规则挖掘方法   总被引:1,自引:0,他引:1  
数据库关联规则挖掘是数据挖掘研究中一个重要研究课题,但该方法本身存在不足,对于大型数据库,可能产生数以千计的规则,使用户感到无所适从.本文提出对关联规则进行分类的思想,并给出了基于数据统计特性的带兴趣度的关联规则挖掘算法GRMiner和IRMiner,算法实现简单,分析表明该算法是有效的.  相似文献   

8.
关联规则的发现是数据挖掘中的一个重要问题,其核心是频繁模式的挖掘,通常采用的APriori算法要多次扫描数据库并产生大量的候选项集,开销很大。本文采用基于布尔矩阵关联挖掘的算法,只需扫描一次数据库而且不需要链接产生候选项集,从而提高算法的效率。并通过实例说明了它是一种有效的关联规则挖掘方法。  相似文献   

9.
相联规则模型可以用于在海量数据库中发现有价值的知识 ,各种求解相联规则的算法都需要较大的计算量 .随着时间推移 ,数据库中的数据也随之发生变化 .由于原先发现的规则已经过时 ,需要重新在数据集中挖掘规则 .本文通过向数据库中不追加数据的方法研究孕育在数据库中的相联规则变化情况 .在借鉴 FUP等算法的基础上 ,充分利用前次挖掘中获得的有关信息 ,提出用于再次挖掘的相联规则增量算法 Super FU P.该算法核心思想是更多地注重新增数据集 ,有效利用前次挖掘信息 ,仅仅对整个数据库扫描一次就能达到求解更新相联规则的目的 ,提高了相联规则增量算法的效率 .  相似文献   

10.
挖掘关联规则是目前数据挖掘领域热点研究话题之一。它的目的在于在数据库中挖掘有趣的关联规则。在关联规则分析及Apriori算法分析上,针对Apriori算法的瓶颈问题,许多有效的改进算法被提出。文中提出了QPCA算法。该算法利用矩阵分析的方法,仅需要扫描数据库一次,同时此算法优化了连接和剪枝操作,通过快速的剪枝和连接可以很快地获取最少的候选项集,避免了频繁项集之间的重复判断连接,因此大大提高了算法的效率。实验结果表明,该算法在挖掘时间上有很大提高。  相似文献   

11.
时间序列分析在流程企业中的应用研究   总被引:1,自引:0,他引:1  
该文采用数据挖掘中的时间序列模式对流程企业中的实际运行数据进行分析,首先采用模糊理论对实际数据进行处理,找出偏离常规运行状态但未到报警界限的参数点并模糊化,然后采用时间窗对参数离散处理,划分时间间隔得到时间序列数据库。然后对传统的Apriori算法进行改进,提出了基于关联规则的时间序列分析算法并编程实现,起到了对设备故障预警监控的作用。  相似文献   

12.
快速开采意外的规则   总被引:4,自引:1,他引:3  
数据开采研究的主要任务就是发现数据集合中隐含的规则,发现的规则分为常规性规则和意外规则。由于意外规则的支持度很小,因而常常被人们忽略,然而意外规则代表了知识的另外一面,非常有用。文章提出一种快速有效发现意外规则的算法,该算法允许规则的结果为合取范式。  相似文献   

13.
朱颢东  钟勇 《计算机科学》2009,36(9):173-175
不相容规则可能是信息系统中的异常信息,在这个信息时代,这些异常信息与那些"正常"信息同样重要.在总结了许多不相容规则处理算法的不足之后,提出了一种基于熵的不相容规则的修正算法.根据设定的可信度值,使用这个算法可以判断出一个信息系统中不相容规则是否是异常规则.最后结合一个实例阐明了该算法的基本思路.  相似文献   

14.
By nature, sampling is an appealing technique for data mining, because approximate solutions in most cases may already be of great satisfaction to the need of the users. We attempt to use sampling techniques to address the problem of maintaining discovered association rules. Some studies have been done on the problem of maintaining the discovered association rules when updates are made to the database. All proposed methods must examine not only the changed part but also the unchanged part in the original database, which is very large, and hence take much time. Worse yet, if the updates on the rules are performed frequently on the database but the underlying rule set has not changed much, then the effort could be mostly wasted. In this paper, we devise an algorithm which employs sampling techniques to estimate the difference between the association rules in a database before and after the database is updated. The estimated difference can be used to determine whether we should update the mined association rules or not. If the estimated difference is small, then the rules in the original database is still a good approximation to those in the updated database. Hence, we do not have to spend the resources to update the rules. We can accumulate more updates before actually updating the rules, thereby avoiding the overheads of updating the rules too frequently. Experimental results show that our algorithm is very efficient and highly accurate.  相似文献   

15.
Shared-nothing并行事务数据库系统中规则的挖掘与更新算法   总被引:1,自引:0,他引:1  
关联规则是数据挖掘中的一个重要研究内容.本文提出了Shared—nothing并行事务数据库系统(简称SNPDBS)中一种快速的关联规则挖掘算法SNPMAR,并考虑当最小支持度发生变化后SNPDBS中关联规则的高效更新问题,提出了一种有效的关联规则更新算法SNPIUA.  相似文献   

16.
模糊加权关联规则在设备监控中的应用研究   总被引:1,自引:0,他引:1  
采用数据挖掘中的模糊加权关联规则对流程企业中的设备运行数据进行分析,首先阐述了模糊理论和Apriori算法的内容,分析参数点的重要程度,找出偏离常规运行状态但未到报警界限的参数点并模糊化,得到了隶属函数截集的均值和综合加权值,然后对传统的Apriori算法进行改进,提出了加权的关联规则算法并编程实现,从而起到流程企业设备故障监控的作用。  相似文献   

17.
Classical data mining algorithms require expensive passes over the entire database to generate frequent items and hence to generate association rules. With the increase in the size of database, it is becoming very difficult to handle large amount of data for computation. One of the solutions to this problem is to generate sample from the database that acts as representative of the entire database for finding association rules in such a way that the distance of the sample from the complete database is minimal. Choosing correct sample that could represent data is not an easy task. Many algorithms have been proposed in the past. Some of them are computationally fast while others give better accuracy. In this paper, we present an algorithm for generating a sample from the database that can replace the entire database for generating association rules and is aimed at keeping a balance between accuracy and speed. The algorithm that is proposed takes into account the average number of small, medium and large 1-itemset in the database and average weight of the transactions to define threshold condition for the transactions. Set of transactions that satisfy the threshold condition is chosen as the representative for the entire database. The effectiveness of the proposed algorithm has been tested over several runs of database generated by IBM synthetic data generator. A vivid comparative performance evaluation of the proposed technique with the existing sampling techniques for comparing the accuracy and speed has also been carried out.  相似文献   

18.
闫伟  张浩  陆剑峰 《计算机应用》2005,25(7):1584-1586
采用数据挖掘中的时间序列模式对流程企业中的运行数据进行分析,首先采用模糊理论对实际数据进行处理,找出偏离常规运行状态但未到报警界限的参数点,然后采用时间窗对参数离散处理,划分时间间隔得到时间序列数据库。采用TimeSeq_PrefixSpan算法并编程实现,得到了按次序排列且有时间间隔的异常参数点对设备故障影响的规则,起到了对设备故障预警监控的作用。  相似文献   

19.
关系数据库中关联规则挖掘的一种高效算法   总被引:10,自引:0,他引:10  
王芳  王万森 《微机发展》2004,14(9):20-22
近年来,关系数据库被越来越多的行业采用,大量的生产、管理、科研等信息被收集存储,因此在关系数据库中进行有效的关联规则挖掘的需求日益增强。文中根据事务数据库中布尔型关联规则挖掘的相关理论和方法,在分析了关系数据库中关联规则挖掘具有的特殊性的基础上,从利用结构化查询语言(SQL)对关系数据库简便而高效的操作出发,提出了一种在关系数据库中挖掘多值型、多维型关联规则的简易算法。实验证明该算法具有较高的执行效率和一定的实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号