基于候选项集剪枝的Apriori算法的研究 |
| |
引用本文: | 韩天鹏,白玲玲,王浩.基于候选项集剪枝的Apriori算法的研究[J].阜阳师范学院学报(自然科学版),2014(4):79-83. |
| |
作者姓名: | 韩天鹏 白玲玲 王浩 |
| |
作者单位: | 阜阳师范学院计算机与信息工程学院;中共阜阳市委党校信息管理中心 |
| |
基金项目: | 安徽省重点研究基地项目(SK2012B625)资助;安徽省专业综合改革试点项目(2013zy167);阜阳师范学院专业综合改革试点项目(2013ZYSD05) |
| |
摘 要: | 在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。
|
关 键 词: | 事务压缩 候选集剪枝 关联规则 Apriori算法 |
本文献已被 CNKI 等数据库收录! |
|