首页 | 官方网站   微博 | 高级检索  
     

DMGSP:一种快速分布式全局序列模式挖掘算法
引用本文:龚振志,胡孔法,达庆利,张长海.DMGSP:一种快速分布式全局序列模式挖掘算法[J].东南大学学报(自然科学版),2007,37(4):574-579.
作者姓名:龚振志  胡孔法  达庆利  张长海
作者单位:1. 东南大学经济管理学院,南京,210096
2. 东南大学经济管理学院,南京,210096;扬州大学计算机科学与工程系,扬州,225009
3. 扬州大学计算机科学与工程系,扬州,225009
基金项目:国家自然科学基金,江苏省 青蓝工程基金
摘    要:为了解决分布式环境下挖掘全局序列模式常产生过多候选序列,加大网络通信代价问题,提出了一种基于分布式环境下的快速挖掘全局序列模式算法--DMGSP.该算法将分布式环境下的各站点得到的局部序列模式压缩到一种语法序列树上, 避免了重复的序列前缀传输. 采用合并树中结点序列规则和项序扩展策略,对非频繁序列进行剪枝,有效地约简了候选序列,减少了网络传输量,从而快速生成全局序列模式.算法分析和实验结果表明,在大数据集环境下的DMGSP算法性能优越,能够有效地挖掘全局序列模式.

关 键 词:数据挖掘  分布式系统  全局序列模式  语法序列树
文章编号:1001-0505(2007)04-0574-06
修稿时间:2007-01-12

DMGSP: an algorithm of distributed mining global sequential pattern on distributed system
Gong Zhenzhi,Hu Kongfa,Da Qingli,Zhang Changhai.DMGSP: an algorithm of distributed mining global sequential pattern on distributed system[J].Journal of Southeast University(Natural Science Edition),2007,37(4):574-579.
Authors:Gong Zhenzhi  Hu Kongfa  Da Qingli  Zhang Changhai
Affiliation:1.School of Economics and Management, Southeast University, Nanjing 210096, China;2. Department of Computer Science and Engineering, Yangzhou University, Yangzhou 225009, China
Abstract:
Keywords:data mining  distributed system  global sequential pattern  lexicographic sequence tree
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号