源关联规则生成算法 |
| |
引用本文: | 李学明,张伟,彭军,刘用国,吴中福,廖晓峰.源关联规则生成算法[J].计算机科学,2002,29(4):61-63. |
| |
作者姓名: | 李学明 张伟 彭军 刘用国 吴中福 廖晓峰 |
| |
作者单位: | 重庆大学计算机学院,重庆,400044 |
| |
摘 要: | 一、引言 IBM科学家Rakesh Agrawal于1993年提出了用于交易的关联规则数据挖掘算法,该算法把基于关联规则的数据挖掘分为两大步,第一步,从交易中发现频繁项目集;第二步,从已发现的频繁项目集中生成所需的关联规则。由于第二步相对简单,且Rakesh Agrawal已给出了一个有效算法来生成所需的关联规则,因此人们对基于关联规则的数据挖掘进行的大量的研究都集中在第一步,即如何从交易集中快速生成频繁项目集。但研究发现,Rakesh Agrawal生成算法虽然能正确有效地生成关联规则,但生成的关联规则具有相当大的冗余性。例如:设关联规则a->(b,c)表示买面包(a)的人中有80%的人买了啤酒(b)和香烟(c),则按Agrawal生成算法,一定会生成如下几条关联规则:
|
关 键 词: | 数据库 数据挖掘 频繁项目集 关联规则生成算法 |
Source Association Rules Generation Algorithm |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|
点击此处可从《计算机科学》下载全文 |
|