首页 | 官方网站   微博 | 高级检索  
     

一种挖掘压缩序列模式的有效算法
引用本文:童咏昕,张媛媛,袁玫,马世龙,余丹,赵莉.一种挖掘压缩序列模式的有效算法[J].计算机研究与发展,2010,47(1).
作者姓名:童咏昕  张媛媛  袁玫  马世龙  余丹  赵莉
作者单位:1. 北京航空航天大学软件开发环境国家重点实验室,北京,100191
2. 电信科学技术研究院,北京,100191
3. 北京联合大学信息学院,北京,100084
基金项目:国家“九七三”重点基础研究发展计划基金项目(2005CB321902);;北京市教委科技计划基金项目(KM200911417003)
摘    要:从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集.受压缩频繁项集思想的启发,提出了一种CFSP(compressing frequent sequential patterns)算法,其可挖掘出少量有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式.CFSP是一种two-steps的算法:在第1步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第2步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性.

关 键 词:挖掘序列模式  压缩  频繁模式挖掘  关联规则  数据挖掘  

An Efficient Algorithm for Mining Compressed Sequential Patterns
Tong Yongxin,Zhang Yuanyuan,Yuan Mei,Ma Shilong,Yu Dan,Zhao Li.An Efficient Algorithm for Mining Compressed Sequential Patterns[J].Journal of Computer Research and Development,2010,47(1).
Authors:Tong Yongxin  Zhang Yuanyuan  Yuan Mei  Ma Shilong  Yu Dan  Zhao Li
Affiliation:State Key Laboratory of Software Development Environment;Beihang University;Beijing 100191;China Academy of Telecommunication Technology;Beijing 100191;College of Information;Beijing Union University;Beijing 100084
Abstract:Mining frequent sequential patterns from sequence databases has been a central research topic in data mining and various efficient algorithms for mining sequential patterns have been proposed and studied. Recently,many researchers have not focused on the efficiency of sequential patterns mining algorithms,but have paid attention to how to make users understand the result set of sequential patterns easily,due to the huge number of frequent sequential patterns generated by the mining process. In this paper,th...
Keywords:mining sequential pattern  compression  frequent pattern mining  association rule  data mining  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号