首页 | 官方网站   微博 | 高级检索  
     

基于候选项集剪枝的Apriori算法的研究
引用本文:韩天鹏,白玲玲,王浩.基于候选项集剪枝的Apriori算法的研究[J].阜阳师范学院学报(自然科学版),2014(4):79-83.
作者姓名:韩天鹏  白玲玲  王浩
作者单位:阜阳师范学院计算机与信息工程学院;中共阜阳市委党校信息管理中心
基金项目:安徽省重点研究基地项目(SK2012B625)资助;安徽省专业综合改革试点项目(2013zy167);阜阳师范学院专业综合改革试点项目(2013ZYSD05)
摘    要:在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。

关 键 词:事务压缩  候选集剪枝  关联规则  Apriori算法
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号