首页 | 官方网站   微博 | 高级检索  
     

基于二进制的频繁项集挖掘新算法
引用本文:程杰.基于二进制的频繁项集挖掘新算法[J].数字社区&智能家居,2009(13).
作者姓名:程杰
作者单位:安徽财经大学信息工程学院;
摘    要:频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。

关 键 词:数据挖掘  频繁项集  二进制  

A New Algorithm for Discovery Maximal Frequent Itemsets Based on Binary Vector Sets
CHENG Jie.A New Algorithm for Discovery Maximal Frequent Itemsets Based on Binary Vector Sets[J].Digital Community & Smart Home,2009(13).
Authors:CHENG Jie
Affiliation:College of Information Engineering;Anhui University of Finance and Economics;Bengbu 233041;China
Abstract:Frequent itemset mining is a classic problem in datamining.However,most algorithms have to scan databases many times.This paper presents an algorithm that can find maximal frequent itemsets quickly.In this algorithm,each transaction is represented as a binary vector,so the task of discovering maximal frequent itemsets is turn to search frequent patterns in binary vector set.Furthermore,this algorithm can certify mining maximal frequent patterns with only one scan of original databases.Experiments verify the...
Keywords:data mining  Frequent itemset  Binary vector  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号