首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于数组的关联规则挖掘算法   总被引:12,自引:0,他引:12  
孟祥萍  钱进  刘大有 《计算机工程》2003,29(15):98-99,109
提高频繁项集挖掘算法的效率是关联规则挖掘研究的一个重点领域。文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,通过不断减少数据库中的事务个数,并且利用一维数组对候选2-项集进行计数来提高挖掘效率。实验表明,该文所提出的算法效率比经典Apriori算法快2~3倍。  相似文献   

2.
数据挖掘中常用关联规则挖掘算法   总被引:3,自引:3,他引:3  
文中首先介绍了数据挖掘中关联规则的经典算法--Apiori算法.再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论.然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法.最后对关联规则挖掘的发展远景进行了展望.  相似文献   

3.
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP—growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。  相似文献   

4.
陈云亮  李欣  杨捷  谢长生 《计算机科学》2009,36(11):224-227
为了提高关联规则挖掘算法处理大数据集的能力,在基因表达式编程进化算法(Gene Expression Program-ming)的基础上,提出了一个新的挖掘强关联规则的算法框架.主要贡献在于提出并实现了基于小生境技术的基因表达式编程进化算法NGEP,以用于挖掘关联规则.NEGP算法首先进行小生境演化,融合小生境并剔除同构的优秀个体,然后对小生境解进行笛卡儿交叉,以产生更好的结果.实验结果表明,与同类优秀的算法对比,NGEP算法的种群多样性与精确度都有很好的结果,并且在提取有效规则的效率上也有较大的提高.  相似文献   

5.
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。  相似文献   

6.
基于属性分组的高效挖掘关联规则算法   总被引:6,自引:0,他引:6  
挖掘频繁项集在数据挖掘中有着重要的作用。目前,关于频繁项集的挖掘问题已经提出了一些算法,虽然实现了一次扫描数据库即可以发现所有的频繁项集,但是当属性数目很多时,算法的执行效率下降很快。论文首次提出了利用属性分组作为挖掘关联规则的工具,给出了基于属性分组的频繁项集挖掘算法,用矩阵来存储数据库属性间的信息并提取频繁项集,而且不产生候选项集。经实验验证该算法是快速有效的。  相似文献   

7.
分布式数据库多层关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
曹洪其  姜志峰  孙志挥 《计算机应用》2005,25(12):2858-2861
对分布式数据库多层关联规则挖掘的理论和方法进行了研究,提出了一种基于频繁模式树FP-tree(Freguent Pattern tree)的快速挖掘算法DMAML_FPT(Distributed Mining Algorithm of Multiple Level based on FP-tree)。与类Apriori算法相比较,该算法最多只需扫描数据库三遍,不需产生和传输大量的候选项集,减少了数据通信量,从而提高了数据挖掘的效率。 实验结果表明算法DMAML_FPT是可行和有效的。  相似文献   

8.
基于向量内积的关联规则挖掘算法研究   总被引:6,自引:1,他引:5  
针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量内存空间等优点。在处理超大型数据库和分布式数据库方面均能得到较好的应用。  相似文献   

9.
研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减少了扫描数据库的次数,且不用产生大量的候选项集,提高了数据挖掘的效率。  相似文献   

10.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:2,他引:2  
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法——Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

11.
通过引入聚类竞争机制,提出了一种基于免疫聚类竞争的关联规则挖掘算法。将数据原始记录和候选模式分别作为抗原和识别抗体,通过聚类竞争加速克隆扩增,提高抗体成熟力及亲和性,增强候选模式支持度。实验及应用表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,提高了所得关联规则的准确率。  相似文献   

12.
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。  相似文献   

13.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

14.
利用时态关联规则的分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。在研究了传统的静态关联规则的基础上,提出了一种以交易规模的变化率为处理对象,即考虑各类项目交易量的变动状况的时态关联规则的表述与挖掘方法,并对其表述形式及算法实现进行了探讨。  相似文献   

15.
数据挖掘的一个重要任务便是从数据库中挖掘出有趣的关联规则。传统的关联规则挖掘方法一般基于支持度-置信度体系,时常会挖掘出虚假规则或忽略掉有用的规则。针对这一问题,本文借鉴对照实验的思想,提出基于T统计量的关联规则挖掘方法,用显著度代替置信度,使挖掘出的规则更具有统计显著性。算例分析和数据实验表明,这种方法可以解决传统关联规则方法存在的上述问题,提高关联规则的有效性。  相似文献   

16.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

17.
挖掘时间序列motif间潜在的关联规则可以在预测未来趋势方面发挥重要作用,时间序列motif即时间序列中先前未知的重复出现的模式。针对符号化时间序列提取motif导致信息丢失的问题,提出基于剪枝技术的motif提取算法PM_Motif,实现了保留原始信息的motif的精准快速提取;针对分割motif来发现其内部关联规则导致的规则不一致的问题,从motif间的关联规则入手,给出了基于AR_TSM方法的时间序列motif关联规则挖掘算法,从根本上避免了因motif分割引起的不确定性,保证了规则的一致性;最后,引入了关联规则评价参数RM,在多数据集上证明了关联规则的预测性能。  相似文献   

18.
通过对两种传统的CAD数据到GIS数据转换方法的系统研究,分析了转换过程中存在的信息丢失等问题。基于空间数据关联规则挖掘思想,从问题着手,设计了一种全新的CAD的文本数据到GIS的点层数据的转换方案与挖掘算法。最后,以一个实际的例子,实现了对CAD的文本数据的空间关联规则挖掘,提取文本的坐标信息和属性信息,建立GIS空间数据库,并对转换的几何精度和属性精度进行了评价。  相似文献   

19.
多层关联规则挖掘算法的研究及应用   总被引:2,自引:0,他引:2  
针对商业银行业务系统中海量数据的分析和研究问题,提出了一种改进频繁项集挖掘算法FP-growth的多层关联规则数据挖掘算法.在对大量商业银行业务交易处理内在规律研究的基础上,依据利润度进行划分,使得该算法在满足用户需求的基础上,有效的缩小了层次结构树的规模,又加快了搜索的速度,从而提高了数据挖掘的效率.模拟算例表明,该算法有效可行,能够更好地适应商业银行交易系统层次结构在大型数据集的数据挖掘.  相似文献   

20.
介绍了假日旅游信息数据挖掘的概念,提出了一种改进的分布式抽样关联规则挖掘算法DS-ARM,给出了算法的实现过程,并对算法性能进行了测试,利用DS-ARM算法对假日旅游者在目的地的旅游行为模式进行了研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号