首页 | 官方网站   微博 | 高级检索  
     

TRISCAN-IA:一种间接关联挖掘的快速算法
引用本文:倪旻,徐晓飞,邓胜春,问晓先.TRISCAN-IA:一种间接关联挖掘的快速算法[J].哈尔滨工业大学学报,2004,36(5):578-581.
作者姓名:倪旻  徐晓飞  邓胜春  问晓先
作者单位:哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001;哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001;哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001;哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001
基金项目:国家高技术研究发展计划资助项目(863-2002AA413310).
摘    要:间接关联是数据挖掘领域中一种数据项之间的关联关系,为了有效地应用于市场营销、智能数据分析、web日志分析等领域,给出了一个基于频繁项目对支持矩阵直接生成频繁项目对之间候选间接关联的挖掘算法(TRISCAN-IA)。该算法只需要3次扫描数据集即可找出所有的间接关联,从而提高了算法的运行效率、在一个web log的真实数据集上进行了试验,与现有算法的比较表明,该算法具有更好的性能。

关 键 词:数据挖掘  关联规则  间接关联  频繁项目对支持矩阵
文章编号:0367-6234(2004)05-0578-04
修稿时间:2003年1月22日

TRISCAN- IA:a fast algorithm for indirect association mining
NI Min,XU Xiao-fei,DENG Sheng-chun,WEN Xiao-xian.TRISCAN- IA:a fast algorithm for indirect association mining[J].Journal of Harbin Institute of Technology,2004,36(5):578-581.
Authors:NI Min  XU Xiao-fei  DENG Sheng-chun  WEN Xiao-xian
Abstract:Indirect association is a high level relationship between items and frequent item-sets in data, which has many potential applications, such as database marketing, intelligent data analysis, web-log analysis, etc. In this paper, a fast algorithm: TRISCAN-IA is presented. The novelty of this algorithm lies on the needs that only three times scan over the dataset is carried out during the mining process, which makes the algorithm CPU time efficient. The algorithm is tested versus several existing algorithms on a real world dataset from UCI Repository of Machine Learning Databases (Microsoft Anonymous Web Data). The empirical results show that TRISCAN-IA is more efficient than the existing indirect association mining algorithms.
Keywords:data mining  association rule mining  indirect association  frequent itempair support matrix
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号