首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 24 毫秒
1.
王培培  孟芸 《计算机仿真》2021,38(5):282-286
针对传统数据关联挖掘过程只适用于单段数据集,导致内存负担重、挖掘频繁项集效率不高等问题,提出一种多段支持度数据频繁模式关联规则挖掘方法.运用多支持度算法对数据集逐步搜索,数据集按照数据项的MIS大小有序排列,采用最小值作为最小支持度,确保该算法的地推性.构建FP_ tree树,利用FP_tree算法对待选项实施剪枝,从而准确挖掘出频繁模式的关联规则.仿真结果证明,多段支持度数据频繁模式关联规则挖掘具有较好的性能,有效提高了关联规则的挖掘效率.  相似文献   

2.
为了减少关联规则挖掘算法的I/O时间复杂性,本文在指出现有关联规则算法及原始抽样挖掘算法存在不足的基础上,提出了一种新的基于抽样的海量数据关联规则挖掘算法,该算法采用随机抽样方法挖掘关联规则,将频繁项集求解中的计数计算次数减少到最低,从而提高了算法的效率.  相似文献   

3.
为了有效提高关联规则挖掘算法处理数据库的效率,在研究基于矩阵的关联规则挖掘算法的基础上,提出了改进的关联规则挖掘算法DMApriori,并选取程序模拟超市购物产生的4个试验数据集,应用DMapriori算法对该数据集进行了关联规则挖掘;实验结果表明,该算法能平均提高关联规则挖掘时间20%;在计算数据库中的频繁项集时,通过有效裁剪布尔矩阵,使算法逐层扫描的数据量大大减少,并且对每个项集计数时,只扫描部分数据,提高了关联规则挖掘算法的性能。  相似文献   

4.
序列模式挖掘是数据挖掘中的研究热点之一,它是基于关联规则的频繁项集的挖掘,其实质是在关联模型中加入时间属性。本文利用序列模式挖掘的典型算法prefix算法对铝电解中重要的工艺参数数据进行挖掘分析,给出铝电解槽的重要的工艺参数的序列化,对于提高铝电解的生产效率,节能降耗,延长率电解槽的寿命具有重要的意义。  相似文献   

5.
关联规则挖掘算法Apriori算法在挖掘频繁模式时需要产生大量的候选项集,多次扫描数据库,时空复杂度过高.针对该算法的局限性,提出了一种通过对项编码来减少扫描数据库次数并通过删除项来减少候选项集的数量,从而提高算法的效率.相同条件下的实验结果表明,优化后的算法能有效地提高关联规则挖掘的效率.  相似文献   

6.
可增量更新的关联规则挖掘算法   总被引:3,自引:0,他引:3  
本文给出了一种新奇有效的增量式关联规则挖掘算法,以处理因事务数据库内容增加后相应关联规则的更新问题,该算法认真研究了关联规则挖掘过程中的数据存储的结构,充分利用以前挖掘的结果,从而大大减少了对数据的重复扫描,提高了数据挖掘算法的效率。  相似文献   

7.
基于关联规则挖掘领域的Apriori算法的优化研究   总被引:2,自引:0,他引:2  
挖掘关联规则是数据挖掘领域的一个重要研究课题,在挖掘数据间的关联性时具有非常重要的意义。本文在分析关联规则挖掘及Apriori算法的基础上,从压缩扫描数据集及提高剪枝效率等方面对算法进行了优化改进,从而达到了降低消耗、提高算法效率的目的。最后,通过实例对优化的Apriori算法作了详细介绍。  相似文献   

8.
数据挖掘中关联规则挖掘算法比较研究   总被引:27,自引:12,他引:15  
分析数据挖掘中关联规则挖掘算法的研究现状,提出关联规则新的价值衡量方法和关联规则挖掘今后进一步的研究方向。以核心Apfiofi算法为基点,运用文献查询和比较分析方法对典型的关联规则挖掘算法进行了综合研究:Apfiofi法即使进行了优化,一些固有的缺陷仍然无法克服,还需进一步研究;②今后的研究方向将是提高处理极大量数据和非结构化数据算法的效率、与OLAP相结合以及生成结果的可视化。  相似文献   

9.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

10.
聚类后的关联规则快速更新算法研究*   总被引:1,自引:0,他引:1  
关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起来的联合挖掘,使其可以有效地压缩数据规模。给出了聚类后的关联规则快速更新算法描述。实验结果表明,算法性能优良,提高了数据挖掘执行效率。  相似文献   

11.
针对通信网络告警预测中预测精度不高、模型训练效率较低等缺陷,提出告警权值确定方法和基于自然序树(Can-tree)的加权增量关联规则挖掘的通信网络告警预测方案。首先,对告警数据进行预处理,确定告警数据权值并压缩到Can-tree结构中;其次,应用增量关联规则挖掘算法对Can-tree进行挖掘,生成告警关联规则;最后,使用模式匹配的方法对实时告警信息进行预测,并对结果进行优化整理。实验结果表明,基于Can-tree的加权增量关联规则挖掘算法是高效的,利用前次挖掘的结果和信息提高了挖掘的效率,网络告警数据的权值分配方案能够合理地区分告警数据的重要程度,有助于将重要程度高的告警关联规则挖掘出来,并加快过时告警关联规则的淘汰,提高预测的准确度和精度。  相似文献   

12.
随着人们利用信息技术生产和搜集数据的能力的提高,数据资料的规模急速膨胀,从庞大的数据中提取有用的知识和信息是数据挖掘的主要任务,而关联规则的挖掘足数据挖掘领域中的一个重要分支.Fp-gmwth算法是目前最有效的关联规则频繁模式挖掘算法之一,然而,由于在挖掘的过程中需要递归的生成频繁模式树,直接把Fp-growth算法应用在文本中的算法效率并不高.针对文本数据的稀疏性,提出了一个基于频繁模式树即Fp-tree和支持度矩阵相结合的最大频繁项目集挖掘算法,缩小了搜索空间,提高了算法的效率.算法分析和实验表明,算法对稀疏型数据集和稠密型数据均适用.  相似文献   

13.
关联规则挖掘是数据挖掘重要研究课题,大数据处理对关联规则挖掘算法效率提出了更高要求,而关联规则挖掘的最耗时的步骤是频繁模式挖掘。针对当前频繁模式挖掘算法效率不高的问题,结合Apriori算法和FP-growth算法,提出一种基于事务映射区间求交的频繁模式挖掘算法IITM(interval interaction and transaction mapping),只需扫描数据集两次来生成FP树,然后扫描FP树将每个项的ID映射到区间中,通过区间求交来进行模式增长。该算法解决了Apriori算法需要多次扫描数据集,FP-growth算法需要迭代地生成条件FP树来进行模式增长而带来的效率下降的问题。在真实数据集上的实验显示,在不同的支持度下IITM算法都要要优于Apriori、FP-growth以及PIETM算法。  相似文献   

14.
贾文  臧明相  周鸿 《微机发展》2006,16(12):178-180
关联规则是数据库中某些特定事件同时发生的概率的简单陈述。关联规则挖掘就是利用特定方法发掘数据库中潜藏的关联规则的过程。文中主要运用数据挖掘中的关联规则和AprioriTid算法,以考务数据库为挖掘对象,并在挖掘过程中充分运用数据库技术适时地对挖掘数据进行筛选,有效地提高了挖掘效率。最后,对课程间的相关性进行了分析和研究,得到了有效性的结论。  相似文献   

15.
基于MFP-Miner算法的图书借阅数据关联规则挖掘   总被引:1,自引:1,他引:0  
本研究利用关联规则挖掘的最大频繁模式算法对图书馆历史借阅数据进行快速有效地挖掘,以获取隐含在借阅数据中有用的关联信息,优化图书馆馆藏结构,发掘学科间的隐性联系和学科动向。由于该算法在挖掘过程中不需要产生候选项目集,因而节约了对候选项目集进行计数的时间,从而使算法的效率得到了很大的提高。  相似文献   

16.
关联规则挖掘是发现大量数据中项集之间有趣的关联或相关联系的技术方法,关联规则挖掘Apriori算法需要多次扫描数据库,时空复杂度过高。针对该算法的局限性,本文提出了基于项编码的关联规则挖掘算法CA(Coding-based Apriori),只需要第一遍扫描数据库并对每个项完成编码,以后的过程都是针对编码进行,不需要多次扫描数据库。相同条件下的实验结果表明,优化后的算法能有效地提高关联规则挖掘的效率。  相似文献   

17.
基于数据挖掘的课程相关性研究与分析   总被引:1,自引:0,他引:1  
关联规则是数据库中某些特定事件同时发生的概率的简单陈述。关联规则挖掘就是利用特定方法发掘数据库中潜藏的关联规则的过程。文中主要运用数据挖掘中的关联规则和AprioriTid算法,以考务数据库为挖掘对象,并在挖掘过程中充分运用数据库技术适时地对挖掘数据进行筛选,有效地提高了挖掘效率。最后,对课程间的相关性进行了分析和研究,得到了有效性的结论。  相似文献   

18.
关联规则的高效挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则的挖掘是一个重要的数据挖掘问题,对其挖掘算法的研究具有十分重要的意义,经典的关联规则发现算法是一个多次遍历的算法,计算的复杂度较同,本文给出一种关联规则频繁数据集的发现算法,只需对交易序列扫描两次即可发现数据采的频繁数据集,算法效率得到了较好地提高。  相似文献   

19.
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。  相似文献   

20.
传统的关联规则挖掘算法对更新的数据集按平等一致的方式加以处理。提出了一种新的增量关联规则挖掘算法:引入了多级加权的更新关联规则模式,对最近更新的数据集在挖掘算法中赋予较高的权值,提高其对挖掘结果的影响力度。使得最近更新数据对当前决策拥有更高的兴趣因子得以充分体现。实验表明,该算法拥有较高灵敏度,并能及时响应事务集的发展趋势,从而为决策者提供及时、准确的信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号