首页 | 官方网站   微博 | 高级检索  
     

基于随机相遇的频繁项集挖掘方法
引用本文:赵文涛,付侃侃,李素青,张霄宏.基于随机相遇的频繁项集挖掘方法[J].河南理工大学学报(自然科学版),2015,34(1).
作者姓名:赵文涛  付侃侃  李素青  张霄宏
作者单位:河南理工大学计算机科学与技术学院,河南焦作,454000
基金项目:国家自然科学基金资助项目,河南省科技攻关计划项目,河南省高等学校矿山信息化重点实验室基金资助项目
摘    要:频繁项集挖掘是关联规则挖掘的重要内容,而现有的频繁项集挖掘算法在数据库扫描和复杂数据结构构建方面消耗过多的时间,效率较低。为克服现有频繁项集挖掘算法的不足,提出了基于随机相遇的频繁项集挖掘算法。在随机相遇过程中,不断从原始事务集中随机挑选两条事务,将其交集作为新事务集中的元素,通过计算新事务集中最小支持度与原事务集中最小支持度的关系,将在原事务集上的频繁项集挖掘转化为在新事务集上的频繁项集挖掘,算法的时间复杂度和空间复杂度大大降低。由于随机样本蕴含原始数据集的主要统计特性,新事务集具有原事务集的统计特性,通过调整参数,算法在新事物集上挖掘结果的准确度可以得到保证。并利用一个零售超市的交易数据对该算法的有效性进行了测试。测试结果表明,该算法能将挖掘速度提升数十倍,同时挖掘结果的准确度和其它算法相差不大。

关 键 词:数据挖掘  频繁项集挖掘  随机相遇算法  随机相遇  最小支持度

A frequent item-set mining method based on random meeting
ZHAO Wentao,FU Kankan,LI Suqing,ZHANG Xiaohong.A frequent item-set mining method based on random meeting[J].JOURNAL OF HENAN POLYTECHNIC UNIVERSITY,2015,34(1).
Authors:ZHAO Wentao  FU Kankan  LI Suqing  ZHANG Xiaohong
Abstract:
Keywords:data mining  frequent item-set mining  random meeting algorithm  random meeting  minimum support degree
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号