数据流上近似非可导项集的挖掘算法 An Approximate Non-Derivable Itemset Mining Algorithm over Data Streams期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

数据流上近似非可导项集的挖掘算法

引用本文：	黄崇争,李海峰,陈红. 数据流上近似非可导项集的挖掘算法[J]. 计算机学报, 2010, 33(8). DOI: 10.3724/SP.J.1016.2010.01427

作者姓名：	黄崇争李海峰陈红

作者单位：	1. 中国人民大学信息学院,北京,100872;广西建设职业技术学院,计算机与信息技术系,南宁,530003 2. 中央财经大学信息学院,北京,100081 3. 中国人民大学信息学院,北京,100872

基金项目：	国家"八六三"高技术研究发展计划项目基金

摘要：	频繁项集是通过对大规模数据进行挖掘获取的代表数据模式的知识结构.非可导频繁项集作为频繁项集的有效压缩方式,能够高效深入地挖掘海量数据、稠密数据与数据流当中的规律.针对项集在计算界限值时代价昂贵的缺点,提出了近似可导项集的概念,并基于纵向数据格式实现了挖掘算法MANDI,能够提高支持度计算和项集间操作的速度.另外,为了满足数据流实时、快速的特点,讨论并证明了近似可导项集的增量性质,提出了可动态更新的算法UANDI.通过实验验证了两种算法的可行性和有效性.
关键词：	近似非可导频繁项集纵向数据格式数据流数据流挖掘
An Approximate Non-Derivable Itemset Mining Algorithm over Data Streams

HUANG Chong-Zheng,LI Hai-Feng,CHEN Hong. An Approximate Non-Derivable Itemset Mining Algorithm over Data Streams[J]. Chinese Journal of Computers, 2010, 33(8). DOI: 10.3724/SP.J.1016.2010.01427

Authors:	HUANG Chong-Zheng LI Hai-Feng CHEN Hong

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏