首页 | 官方网站   微博 | 高级检索  
     

一种高效的增量式序列模式挖掘算法
引用本文:刘佳新.一种高效的增量式序列模式挖掘算法[J].计算机工程,2012,38(12):39-41.
作者姓名:刘佳新
作者单位:燕山大学图书馆,河北 秦皇岛,066004
基金项目:国家自然科学基金资助项目,秦皇岛市科学技术研究与发展计划基金资助项目
摘    要:现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作,实现频繁序列树的更新,利用深度优先遍历频繁序列树找到序列数据库中所有的序列模式。实验结果表明,与IncSpan算法和PrefixSpan算法相比,该算法的挖掘效率较高。

关 键 词:数据挖掘  增量式挖掘  序列模式  投影数据库  频繁序列树
收稿时间:2012-03-19

Efficient Incremental Mining Algorithm of Sequential Patterns
LIU Jia-xin.Efficient Incremental Mining Algorithm of Sequential Patterns[J].Computer Engineering,2012,38(12):39-41.
Authors:LIU Jia-xin
Affiliation:LIU Jia-xin(Library,Yanshan University,Qinhuangdao 066004,China)
Abstract:In order to solve the problem that the existed incremental mining algorithms need to mine the sequence database once again,and reduce the time and space consumption generated by repeatly running mining algorithm in the process of the sequential pattern mining,this paper proposes an efficient incremental mining algorithm of sequential patterns.It uses the frequent sequence tree as the storage structure of the algorithm.When the sequence database is updated and the minimum support is changed,it updates the frequent sequence tree by performing the update operation.It finds all the sequential patterns through using depth-first search strategy to traverse the frequent sequence tree.Experimental results show that the algorithm outperforms IncSpan and PrefixSpan in time cost.
Keywords:data mining  incremental mining  sequential pattern  project database  frequent sequence tree
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号