首页 | 官方网站   微博 | 高级检索  
     

一种基于倒排索引的频繁项集挖掘方法
引用本文:贾丽波,姜晓明,叶青,陈占芳.一种基于倒排索引的频繁项集挖掘方法[J].长春理工大学学报,2019,42(2).
作者姓名:贾丽波  姜晓明  叶青  陈占芳
作者单位:长春理工大学 计算机科学技术学院,长春,130022;长春理工大学 计算机科学技术学院,长春,130022;长春理工大学 计算机科学技术学院,长春,130022;长春理工大学 计算机科学技术学院,长春,130022
基金项目:吉林省科技厅项目;吉林省教育厅科技攻关项目
摘    要:针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法。通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题。在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集。与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法。通过实验验证了所提出算法的高效性和可行性。

关 键 词:频繁项集挖掘  倒排索引  二维数组
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号