首页 | 官方网站   微博 | 高级检索  
     

数据流上近似非可导项集的挖掘算法
引用本文:黄崇争,李海峰,陈红. 数据流上近似非可导项集的挖掘算法[J]. 计算机学报, 2010, 33(8). DOI: 10.3724/SP.J.1016.2010.01427
作者姓名:黄崇争  李海峰  陈红
作者单位:1. 中国人民大学信息学院,北京,100872;广西建设职业技术学院,计算机与信息技术系,南宁,530003
2. 中央财经大学信息学院,北京,100081
3. 中国人民大学信息学院,北京,100872
基金项目:国家"八六三"高技术研究发展计划项目基金 
摘    要:频繁项集是通过对大规模数据进行挖掘获取的代表数据模式的知识结构.非可导频繁项集作为频繁项集的有效压缩方式,能够高效深入地挖掘海量数据、稠密数据与数据流当中的规律.针对项集在计算界限值时代价昂贵的缺点,提出了近似可导项集的概念,并基于纵向数据格式实现了挖掘算法MANDI,能够提高支持度计算和项集间操作的速度.另外,为了满足数据流实时、快速的特点,讨论并证明了近似可导项集的增量性质,提出了可动态更新的算法UANDI.通过实验验证了两种算法的可行性和有效性.

关 键 词:近似非可导频繁项集  纵向数据格式  数据流  数据流挖掘

An Approximate Non-Derivable Itemset Mining Algorithm over Data Streams
HUANG Chong-Zheng,LI Hai-Feng,CHEN Hong. An Approximate Non-Derivable Itemset Mining Algorithm over Data Streams[J]. Chinese Journal of Computers, 2010, 33(8). DOI: 10.3724/SP.J.1016.2010.01427
Authors:HUANG Chong-Zheng  LI Hai-Feng  CHEN Hong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号