共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
朱喜梅 《数字社区&智能家居》2006,(2):36-37
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。 相似文献
3.
关联规则挖掘综述 总被引:2,自引:0,他引:2
朱喜梅 《数字社区&智能家居》2006,(5)
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率,提出了改进的方法。 相似文献
4.
5.
6.
7.
在数据挖掘中,关联规则挖掘一直是国内外研究的热点之一,本文在正关联规则的基础上,主要探讨了负关联规则的挖掘算法,提出了对负关联规则的前项和后项所对应正项的支持度研究问题,并对其进行了分析处理。 相似文献
8.
当前许多工程领域产生大量高速实时的流式数据,基于流式数据的关联规则挖掘应用广泛,与传统的静态数据相比,流式数据上关联分析面临极大的资源挑战。提出了流式数据上关联规则的形式化定义和基本挖掘算法,系统地回顾了近年来流式数据上关联规则挖掘的研究进展,详细分析了目前挖掘算法研究中存在的主要问题和解决途径,阐述了未来的研究方向。 相似文献
9.
对基于数据挖掘的通信网告警相关性分析进行了研究。由于通信网络是动态变化的,用于动态网络资源和服务的自适应关联规则算法需要充分利用和维护原有规则来发现新规则,使网络结构与规则库都能快速更新,为此提出了新型的动态关联规则挖掘算法IDARM。理论分析与仿真实验都显示此算法性能优越、可扩展性好,并在一些特定情况下能显著提高效率。 相似文献
10.
关联规则挖掘算法介绍 总被引:2,自引:0,他引:2
数据挖掘是一个多学科交叉融合而形成的新兴的学科,它利用各种分析工具在海量数据中发现模型和数据间的关系。而在大规模事务数据库中,挖掘关联规则是数据挖掘领域的一个非常重要的研究课题。文中介绍了关联规则挖掘的研究情况,描述了经典Apfiofi算法的实现,并对该算法进行了分析和评价,指出了其不足和原因。描述了FP树挖掘最大频繁项集的算法,通过实例对该算法进行了性能评估,并得到结论:数据库中潜在的最大频繁模式越多,运行时间越长。 相似文献
11.
数据挖掘中关联规则挖掘算法比较研究 总被引:27,自引:12,他引:15
分析数据挖掘中关联规则挖掘算法的研究现状,提出关联规则新的价值衡量方法和关联规则挖掘今后进一步的研究方向。以核心Apfiofi算法为基点,运用文献查询和比较分析方法对典型的关联规则挖掘算法进行了综合研究:Apfiofi法即使进行了优化,一些固有的缺陷仍然无法克服,还需进一步研究;②今后的研究方向将是提高处理极大量数据和非结构化数据算法的效率、与OLAP相结合以及生成结果的可视化。 相似文献
12.
基于频繁模式树的分布式关联规则挖掘算法 总被引:1,自引:0,他引:1
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的. 相似文献
13.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法。该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度。实验结果表明改进算法确实能有效减少相关计算量,比已有算法执行效率明显提高,同时验证了该算法在旋转机械故障诊断中的有效性。 相似文献
14.
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。 相似文献
15.
16.
关联规则挖掘中对Apriori算法的一种改进研究 总被引:24,自引:0,他引:24
针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。研究和分析表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间和处理项目集维数大等优点。对于处理超大型事务数据库和分布式事务数据库,同样也有较好的应用。 相似文献
17.
现有的传感器网络数据处理系统只能向用户提供简单的查询操作,如何高效地处理传感器网络的海量数据流,从中获取有用的知识成为新的挑战.提出一种基于传感器网络特性的分布式关联规则挖掘算法,采用树型通信结构,各个传感器通过改进的单一数据流频繁项集挖掘算法找出本地的局部频繁项集,并逐层上传、合并,最后由sink节点将所有子节点的局部频繁项集合并成全局的频繁项集,并产生相应的关联规则.实验证明该算法占用较少的计算时间和内存. 相似文献
18.
关联规则挖掘中对Apriori算法的一种改进研究 总被引:2,自引:0,他引:2
通过对关联规则挖掘算法的详细分析,提出了一种基于无向项集图的动态频繁项集挖掘算法.当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次无向项集图即可得到新的频繁项集.该算法不仅简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间等优点. 相似文献
19.
在研究负关联规则相关特性的基础上,将向量内积引入到该领域,提出了一种基于向量内积的多最小支持度正负关联规则挖掘算法。考虑到事务数据库中各项集分布不均而导致的单一最小支持度难以设定的问题,采用了多最小支持度策略,设计了一种能同时挖掘出频繁与非频繁项集,以及从这些项集中挖掘出正负关联规则的算法。实验结果表明,该算法仅需扫描一次数据库,且具有动态剪枝,不保留中间候选项和节省大量内存等优点,对事务数据库中负关联规则的挖掘具有重要意义。 相似文献