首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一种改进的Apriori算法   总被引:6,自引:2,他引:4  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apaod进行分析,发现该技术存在的问题.Apriori算法是关联规则挖掘中的经典算法.对Apriori算法做了改进.借助0-1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率.  相似文献   

2.
针对数据挖掘技术在期货交易数据中的应用,通过关联规则分析期货价格和客户行为.首先预处理原始期货交易数据并提取符合挖掘目标的数据,再通过改进的Apriori算法挖掘预处理后的数据.根据用户给定的最小支持度和最小置信度对挖掘结果生成强关联规则,并以文本形式显示.根据简单的规则说明,用户可以很好地理解规则的含义.  相似文献   

3.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上,介绍了该算法的C#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

4.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上.介绍了该算法的c#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

5.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

6.
基于多最小支持度的关联规则挖掘   总被引:1,自引:0,他引:1  
分析了单最小支持度关联规则挖掘的局限性,提出了基于多最小支持度的关联规则挖掘模型,重点研究了多最小支持度MS.Apriori算法的基本思想,指出了算法的优缺点并通过实例说明发现频繁项集的方法,最后指出该算法的不足及改进算法.  相似文献   

7.
传统的关联规则挖掘Apriori算法时间开销大,针对Apriori算法的不足之处,基于关系代数理论,利用关系矩阵及相关运算给出了搜索频繁项集的基于关系代数理论的关联规则挖掘(ORAR)算法.利用关系矩阵只需扫描数据库一次,以降低算法运行时间,挖掘频繁项集,最后通过仿真实验比较这两个算法的执行时间,讨论了数据样本量和最小支持度对算法性能的影响.通过大量的仿真实验证明改进的ORAR算法是高效的,减少了挖掘数据集中频繁项集的运行时间.  相似文献   

8.
关联规则挖掘Apriori算法的研究与改进   总被引:7,自引:1,他引:6  
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联.Apriori算法是关联规则挖掘中的经典算法.然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点.对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法.该算法基于新的数据结构,改进了产生候选项集的连接方法.在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著.  相似文献   

9.
一般的关联规则发现算法使用的都是支持度、置信度框架.但是在增量的数据挖掘过程中,该类算法却需要不断改变支持度、置信度,使得算法本身效率下降,并缺乏可说服性,比如Apriori算法.为了解决该类问题,使用兴趣度框架对增量的数据进行了关联规则挖掘,比较了基于支持度、置信度框架的算法(如Apriori,FUP算法)和基于兴趣度的算法之间的优缺点.试验结果表明:兴趣度能够有效地筛选关联规则,在进行增量的数据挖掘的情况下得到的关联规则总是小于等于支持度、置信度(Aprori)算法挖掘出的规则.  相似文献   

10.
基于规模约简和多支持度的关联规则挖掘   总被引:1,自引:0,他引:1  
史原  鲁汉榕  罗菁  高婷 《计算机工程与设计》2006,27(21):4105-4107,4114
关联规则挖掘的经典算法是Apriori算法,但是存在两大突出的问题,即多次扫描事务数据库和使用单一的支持度,导致了由于事务数据库的规模而增加搜索时间和产生冗余规则或有效规则被丢弃。以往的改进算法只从其中一方面进行考虑。因此同时考虑存在问题,给出了一种基于规模约简和多支持度的关联规则挖掘算法。分析和试验显示在效率上有提高。  相似文献   

11.
多最小支持度策略的关联规则挖掘方法   总被引:9,自引:0,他引:9  
关联规则的数据挖掘是当今数据挖掘领域的重要内容之一 .国内现有的关联规则挖掘算法大多是在最小支持度的限定条件下 ,发现挖掘数据的各属性间的所有关联型知识 .而事实上由于基于不同数据属性的事件的发生频率是不同的 ,这样仅通过唯一的支持度限定的挖掘就无法正确反映挖掘对象本身的特征 .本文从客观事实的本质出发 ,在原有 Apriori算法的基础上 ,采用了一种多支持度的关联规则挖掘策略 .最后通过实验结果表明 ,这种挖掘方法能够更加准确和高效地进行知识挖掘 .  相似文献   

12.
为解决传统关联聚类算法挖掘网络异常数据时间复杂度高、精确度不理想等问题,提出Spark-MML聚类算法。为Apriori关联规则算法设计并行化频繁项集挖掘环境,使用兴趣度约束与支持度自适应策略挖掘网络数据特征量强关联规则;利用可变网格的局部离群点检测算法剔除K-means聚类离群点,基于最大最小距离确定聚类中心及数值K,将网络数据分为异常和非异常。测试结果表明,该方法避免聚类中心选取陷入局部最优,降低了异常数据挖掘的时间复杂度,有效节约算法运行空间,是一种可靠的网络异常数据挖掘方法。  相似文献   

13.
关联规则技术在教学评价中的应用   总被引:1,自引:0,他引:1  
主要研究了基于知识发现的教学评价系统的开发过程,介绍了系统开发工具及关联规则挖掘等主要功能子模块的设计和实现.论文应用关联规则Apriori算法,对教学评价数据样本进行数据分析,使用数据库中用户交互数据记录,利用最小支持度和最小置信度,挖掘出频繁项集,从分析的结果中发现有价值的数据模式,寻找其中存在的关系和规则,为教育教学活动发挥指导作用,为教学管理提供合理、科学的决策支持,并且提出了对系统进一步的改进建议.  相似文献   

14.
关联规则挖掘在煤矿安全监测中的应用   总被引:1,自引:0,他引:1  
李峰  姜丽莉 《软件》2011,32(2):85-86,114
为了从大量的煤矿安全监测数据中获取有用的知识,来指导煤矿安全预警工作,本文将关联规则挖掘算法应用于安全监测数据的数据挖掘。根据数据的特点,对数据进行了预处理后,采用了多维关联规则挖掘算法。文章设计并实现了安全监测数据的关联规则挖掘系统。通过该系统,用户在设置最小支持度和最小置信度阈值后,就可以挖掘出关联规则。  相似文献   

15.
关联规则的数据挖掘是当今数据挖掘领域的重要内容之一。国内现有的关联规则挖掘算法大多是在最小支持度的限定条件下,发现挖掘数据的各属性间所有关联型知识,而事实上由于基于不同数据属性的事件的发生频率是不同的,这样仅通过唯一的支持度限定的挖掘就无法正确反映挖掘对象本身的特性,本文从客观事实的本质出发,在原有Apriori算法的基础上,采用了一种多支持度的关联规则挖掘策略,最后通过实验结果表明,这种挖掘方法能够更加准确和高效地进行知识挖掘。  相似文献   

16.
Apriori算法是一种挖掘关联规则的频繁项集算法,广泛应用于商业领域与网络安全领域.描述了使用R语言arules扩展包的Apriori算法对真实的商品交易数据进行关联规则挖掘的过程,并对挖掘结果进行分析.对商品交易数据的关联规则挖掘思路可借鉴应用于其他情景的关联规则挖掘.  相似文献   

17.
基于前缀项集的Apriori算法改进   总被引:1,自引:0,他引:1  
关联规则的挖掘是数据挖掘中一个重要内容,主要目的是找到事务数据库中的有趣的模式。Apriori算法是关联规则挖掘的最经典算法之一,但是它本身存在着效率上的瓶颈。在深入了解Apriori算法前提下,提出基于前缀项集的候选集存储结构,并利用哈希表在快速查找上的优势,大大提高了经典Apriori算法在连接步骤和剪枝步骤中的效率。实验证明改进后的Apriori算法在一定支持度下比经典Apriori算法有着更大的效率优势,并且支持度越小时提升效率越大。  相似文献   

18.
在多支持度关联规则挖掘算法中,针对最小支持度的选取问题,提出一种基于分段函数的多支持度关联规则挖掘算法.在多支持度算法中挖掘频繁集的时候,最小支持度由项集最小项支持度的最小值、最大值和给定的参考值所决定,这样避免了采用最小值作为最小支持度算法的时间复杂度高和存在无效规则的问题,以及采用最大值致使剪枝程度过大而造成规则遗漏的问题.通过实验结果表明了该算法的有效性.  相似文献   

19.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间的联系。该文运用关联规则Apriori算法,对某高校研究生成绩等级样本进行数据分析,利用最小支持度和最小置信度,挖掘出频繁项集,从分析的结果中发现有价值的数据模式,寻找其中存在的规则,为高校加强研究生教育提供参考性建议。  相似文献   

20.
邓广彪 《数字社区&智能家居》2014,(31):7237-7240,7243
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号