共查询到20条相似文献,搜索用时 15 毫秒
1.
一种新的多级关联规则高效挖掘算法 总被引:1,自引:1,他引:1
提出一种新的多级关联规则挖掘算法,该算法采用自中间开始并基于集合运算的方法来求频繁集,在求解过程中不需要建立复杂的hash树,并且避免了挖掘初期在每个模式中产生大量的支持事务集,从而减少了I/O操作,提高了挖掘的效率. 相似文献
2.
3.
考虑事务数据库D长度不变、项目集I发生变化并且带有权重时的关联规则挖掘问题,提出了一种针对项目集增加的加权关联规则更新算法,解决了增加项目集的加权关联规则更新问题,与对新数据库重新运行算法相比,其运行效率有显著提高. 相似文献
4.
陈自力 《甘肃联合大学学报(自然科学版)》2011,25(6):65-68
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法. 相似文献
5.
Apriori算法是经典的数据挖掘算法之一,它根据置信度和支持度对产生的频繁集进行选择,找出强规则.传统的Apriori算法需要产生大量的侯选集和多次数据库的扫描,存储和通信的开销巨大.云计算环境可以解决存储问题,所以针对Mapreduce的编程框架,提出一种适用于此模式的新关联规则算法,解决传统Apriori算法时间和空间上的缺点,提高挖掘效率. 相似文献
6.
在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较. 相似文献
7.
在分析广义关联规则基本模型和求解在规则的基本性质基础上,提出一个新的基于关系操作的挖掘广义关联规则算法,该算法既使用了成熟的关系操作又充分利用先验,在多概念层上交互挖掘关联规则,有很好的实用性。 相似文献
8.
一种改进的Apriori算法 总被引:1,自引:0,他引:1
Apriori算法存在许多可以改进的地方.例如它需要反复读取数据库,并且读取的次数由项目集中的项目个数来确定,I/O负载与最大项目集的项数成正比.本文提出一种只读一次数据库的的改进算法. 相似文献
9.
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,提出一个改进的Apriori算法.新算法仅对数据库扫描一次,就能找出所有的频繁项集,从而提高了挖掘的效率,具有一定的实用性 相似文献
10.
现有的类间桥挖掘算法容易挖掘出伪类间桥,从而降低了挖掘的准确率。文中使用卡方检测方法定义项集重要性,有效地去掉频繁项集中支持度较大但相关性并不强的规则,以此找到真实感兴趣的"桥",而且算法的质量和效率不会受到影响。实验显示,本文算法能避免产生伪类间桥,有效地降低了统计推断中的第二类错误(存伪错误),使挖掘的准确率得到提高。 相似文献
11.
对Apriori算法的一种改进 总被引:2,自引:0,他引:2
给出了一种对Apriori算法改进的算法。改进的算法只需扫描一次数据库D,同时简化了Apriori算法,减少了存储设备I/O时间,提高了算法的效率。 相似文献
12.
一种新的多维关联挖掘智能方法 总被引:1,自引:0,他引:1
关联规则挖掘在数据挖掘中有着重要的作用.本文提出了采用多维模型的架构将维表进行组织,而且利用项目分块和提取感兴趣的个别属性作为多维关联规则挖掘的基本思想,并利用数据库查询语言实现算法,实现了多维的挖掘,经实验表明该算法的效率大大高于Apriori等算法,且易于实现. 相似文献
13.
FP-growth是关联规则挖掘中一种效率较高的算法,它不产生候选集,但仍需多次遍历结果集L.针对此问题提出了一种基于Hash表的改进算法HFP-growtH(Hash FP-growth).该算法将结果集L的数据以项名称对应项支持度计数的形式存入Hash表,在找某个项的支持度计数时给Hash表传入项名称直接返回对应的支持度计数,改变了以往多次遍历结果集L的方法,从而节省了遍历时间,提高了挖掘效率.实验结果表明,改进后的算法性能明显优于原算法,并将其应用于名智网上招聘系统之中. 相似文献
14.
15.
数据挖掘技术引起了数据库和人工智能等领域的专家和学者的广泛关注。关联规则的挖掘是数据挖掘研究的一个重要领域,本文分析了经典的增量更新算法FUP的不足,提出了一种改进的增量更新算法EFUP,详细论述算法思想,并与FUP算法比较分析,表明了该算法的优越性。 相似文献
16.
在对经典的关联规则算法进行了分析后,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARM LL.实验结果表明该算法是可行的,并具有较高的效率. 相似文献
17.
一种高效关联规则挖掘算法 总被引:1,自引:0,他引:1
为了提高关联规则挖掘算法处理数据库的效率,在研究AprioriTid算法的基础上提出一种高效的关联规则挖掘算法AprioriTidD,在计算数据库中的频繁项集时依靠有效的裁剪减少无效项集的产生,并且可减少产生候选项集,从而有效地提高算法的效率.选取程序模拟超市购物产生的3个试验数据集,应用AprioriTidD算法对该... 相似文献
18.
研究工作者已经提出了许多对事务数据库中频繁模式、关联规则的挖掘算法.早期算法有Apriori算法,然而该算法利用候选项集找频繁项集,而候选项集的产生往往是非常耗时的.JianweiHan等人提出了一种改进的算法,FP-growth算法.该算法不产生候选项集,效率比Apriori算法提高了近一个数量级.在描述FP-growth算法的基础上,具体讨论了如何优化数据结构,有效的实现该算法. 相似文献
19.
提出一种从大型数据库中挖掘关联规则的快速算法——自适应快速关联规则提取算法。该算法以经典的Apriori算法及其他各种优化算法为基础,引入了自适应步长和扫描树的概念,并采用修剪法对Apriori算法进行了改进。理论分析与实验结果表明,该算法比Apriori算法的应用效率高,同时也证实了其有效性。 相似文献
20.
一种改进的负关联规则挖掘算法 总被引:6,自引:0,他引:6
负关联规则A→—B(或者-A→B,-A→B)描述的是项目之间的互斥关系,其与传统的关联规则有着同样重要的作用.然而,负关联规则和传统正关联规则的挖掘有很大不同,因为负关联规则隐藏在数量巨大的非频繁项集中.因此提出一种新的挖掘horn子句类型负关联规则的算法,并且实验证明是行之有效的. 相似文献