一种提高并行数据挖掘效率的方法 |
| |
作者姓名: | 佘春东范植华 孙世新车著明 唐剑 |
| |
作者单位: | 电子科技大学计算机科学与工程学院,成都610054;中国科学院软件研究所,北京100080;西昌卫星发射中心技术部,西昌615000 |
| |
基金项目: | 中国科学院知识创新工程方向性研究项目基金(名称:大型数字对象应用环境及其并行模拟,批准号:KGCX2-JG-09),总装备部西昌卫星发射中心实验技术项目基金 |
| |
摘 要: | 发现关联规则是数据挖掘的一项重要任务,本文介绍了几种数据挖掘的串行和并行算法。其中IDD算法是一种高效的和易于扩展的发现关联规则的并行算法,然而,当处理嚣数目增加时,由于负载的失衡导致其效率的严重下降,于是通过引入近似算法成功地解决了这个问题。我们给出了两种近似算法和其性能证明,其一是在线算法,另一种是离线算法。在本文的最后,我们进行了改进的IDD算法的复杂性分析。
|
关 键 词: | 数据挖掘 并行处理 关联规则 负载平衡 可扩展性 近似算法 在线算法 离线算法 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|