首页 | 官方网站   微博 | 高级检索  
     

大数据中效用挖掘的快速单阶段算法
引用本文:刘君强,周青峰,王文慧,时磊.大数据中效用挖掘的快速单阶段算法[J].电信科学,2015,31(4):84-92.
作者姓名:刘君强  周青峰  王文慧  时磊
作者单位:1. 浙江工商大学 杭州310018
2. 浙江水利水电学院 杭州310018
基金项目:国家自然科学基金资助项目(No.61272306);浙江省自然科学基金资助项目(No.LY12F02024)~~
摘    要:现有数据挖掘算法的缺点是在挖掘大数据时会出现大量候选模式,从而造成可伸缩性瓶颈,个别算法虽然不生成候选模式,但是计算代价高昂,缺乏有效剪裁,运行效率存在瓶颈.为此,提出一个全新的单阶段不生成候选模式的数据挖掘算法,其创新性有3点:一是基于前缀生长的模式枚举和基于效用上限值评估的剪裁策略;二是基于稀疏矩阵和虚拟投影的效用信息表达;三是节省存储空间的深度优先搜索方法.大量实验表明,新算法的时间效率比现有算法高5倍以上,并且内存使用量比现有算法少20%~60%,可伸缩性高.

关 键 词:大数据  效用挖掘  高效用模式  频繁模式

Fast Single Phase Algorithm for Utility Mining in Big Data
Liu Junqiang , Zhou Qingfeng , Wang Wenhui , Shi Lei.Fast Single Phase Algorithm for Utility Mining in Big Data[J].Telecommunications Science,2015,31(4):84-92.
Authors:Liu Junqiang  Zhou Qingfeng  Wang Wenhui  Shi Lei
Affiliation:Liu Junqiang;Zhou Qingfeng;Wang Wenhui;Shi Lei;Zhejiang Gongshang University;Zhejiang University of Water Resources and Electric Power;
Abstract:
Keywords:big data  utility mining  high utility pattern  frequent pattern
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号