首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 58 毫秒
1.
关联规则是数据挖掘领域的一个重要分支,而发现频繁项目集是关联规则数据挖掘中的关键问题.频繁项目集是在给定的交易数据库D下满足最小支持度和最小置信度下的一个项目集合,但随着数据集的增减,就会产生不同的频繁项目集.如何发现在数据集变化情况下频繁项目集快速和高效地更新是文中解决的问题.为此提出了一种改进的增量更新算法,实验结果表明此算法有较好的效果.  相似文献   

2.
关联规则的挖掘是数据挖掘中的一个重要课题.实际应用中事务数据库不断更新,而发现频繁项集代价较高,因此需要提出用于数据库中关联规则的维护算法.本文提出了基于矩阵的MFUP(matrix fast updata)算法,该算法充分利用原有挖掘结果中候选频繁项集的支持数,能有效减少对数据库的重复扫描次数.实验表明,MFUP算法是高效的.  相似文献   

3.
关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
详细研究了关联规则数据挖掘,分析了存在的问题和不足,提出了一种频繁项集增量算法,用于对Apriori算法进行改进.实验表明,改进算法在运行效率上要比Apriori算法快一个数量级.  相似文献   

4.
考虑事务数据库D不变,项目集I发生变化时的关联规则挖掘问题.提出了两种关联规则更新算法,解决增加项目或减少项目时的关联规则更新问题.与重新运行一遍Apriori算法相比较,其运行效率有显著提高.  相似文献   

5.
针对Apriori算法存在多次扫描数据库及产生大量候选项集的缺陷,提出了一种改进算法.该算法只需扫描数据库一次,并将事务变换成二进制存储到数据库,可节省存储空间、提高速度.实验结果表明,改进算法挖掘关联规则的效率有较大提高.  相似文献   

6.
孙新  宋中山 《中国西部科技》2010,9(13):28-29,49
数据挖掘技术引起了数据库和人工智能等领域的专家和学者的广泛关注。关联规则的挖掘是数据挖掘研究的一个重要领域,本文分析了经典的增量更新算法FUP的不足,提出了一种改进的增量更新算法EFUP,详细论述算法思想,并与FUP算法比较分析,表明了该算法的优越性。  相似文献   

7.
提出了维护更新问题的背景,将维护更新问题分为4种情况进行研究.详细介绍了各种情况相应的维护关联规则的增量更新算法,并对其进行了分析与评价,指出了算法的优点和不足,提出了今后研究的方向.  相似文献   

8.
本文针对在事务数据库不变 ,最小支持度和最小可信度发生变化的情况下 ,如何进行关联规则的维护问题进行了研究 ,并提出了一种有效的增量式更新算法  相似文献   

9.
针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题?在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP - tree)的基础上,引入MapReduce 编程模型,提出了一个面向大数据的并行的关联规则增量更新算法(parallel fast updated frequent pattern tree,PFUFP - tree)?该算法通过构建原始事务数据的分块索引,从而使得在每次增量更新时,能够最小化地扫描原始事务数据库,提高了挖掘效率;同时采用动态负载均衡的项目分组策略来优化并行计算过程中的项集分组问题,从而保证分布式集群中节点之间的负载均衡;实验结果证明,提出 的算法是有效的和高效的,适用于动态增长的大数据环境?  相似文献   

10.
关联规则Apriori算法的改进   总被引:7,自引:0,他引:7  
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。  相似文献   

11.
多层次关联规则的增量式更新算法   总被引:2,自引:0,他引:2  
目前已经提出的许多关联规则发现算法,大多数用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.文章提出一种增量式更新算法--IUPA(Incremental Updating Algorithm),用来解决多层次关联规则高效更新问题.  相似文献   

12.
为了解决缺省关联规则的增量挖掘问题,在算法DRMBAR的基础上,结合粗糙集理论及频繁模式树结构,提出了一种基于关联规则的缺省规则更新算法IADRBAR,该算法主要考虑最小支持度发生变化时缺省规则的更新问题,即在新的最小支持度下,如何高效地生成新的关联规则. IADRBAR在最坏的情况下仅须扫描决策表一遍,并利用上一次已经挖掘出的频繁项目集及关联规则,有效地提高缺省规则的更新效率.理论分析和实验结果表明算法是有效可行的.  相似文献   

13.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.  相似文献   

14.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高.  相似文献   

15.
基于有向图的关联规则算法   总被引:5,自引:0,他引:5  
提出了一种基于有向图的关联规则挖掘算法,采用了垂直二进制位图映射数据库,根据垂直二进制位图来生成有向图,将频繁项的二进制位串作为有向图的权值,通过分析有向图生成最大频繁项集,并给出了最大频繁项集挖掘算法的优势。  相似文献   

16.
频繁项目集是满足最小支持度和最小置信度下的一个项目集合,但随着最小支持度的不同,就会产生不同的频繁项目集,而频繁项目集的发现又是一个高花费的过程.该文提出一个新的维护算法,用来解决关联规则的更新维护问题.  相似文献   

17.
基于有向图的关联规则算法   总被引:2,自引:0,他引:2  
提出了一种基于有向图的关联规则挖掘算法,采用了垂直二进制位图映射数据库,根据垂直二进制位图来生成有向图,将频繁项的二进制位串作为有向图的权值,通过分析有向图生成最大频繁项集,并给出了最大频繁项集挖掘算法的优势。  相似文献   

18.
由于在实际的数据挖掘过程中容易出现无用的频集和冗余的规则,所以降低频集和规则的冗余度可大大提高挖掘的质量,这也是数据挖掘中一直被关注的问题,提出了一个用等价类生成关联规则的方法,算法主要在频集的基础上建立项集的等价关系,进而对项集划分等价类,同时将得到的关联规则划分为精确关联规则和近似关联规则两个集合,通过等价类,不但可以很容易地生成所需要的关系规则,同时可以方便地判断数据之间依赖关系的强弱,同时,项集的等价关系在实际应用中也很有利用价值,算法最后的规则结果集剔除了由来自同一等价类中的面集的重复出现构成的冗余规则,从而得到了较小的关联规则集合。  相似文献   

19.
Apriori算法是关联规则的一个重要算法。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,通过对候选项集的属性进行加权运算,减少了产生的频繁集,提高了算法的效率,使算法产生的规则更有应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号