首页 | 官方网站   微博 | 高级检索  
     

分布式决策树算法研究与实现
引用本文:戴南,吉根林.分布式决策树算法研究与实现[J].南京师范大学学报,2005,5(4):46-48.
作者姓名:戴南  吉根林
作者单位:[1]南京师范大学数学与计算机科学学院,江苏南京210097 [2]苏州大学江苏省计算机系统信息处理重点实验室,江苏苏州215006
基金项目:江苏省重点实验室开放基金资助项目(KJS03064).
摘    要:提出了一种基于分布多库环境下的决策树生成算法DDTA(Distributed Decision Tree Algorithm).该算法使用基于信息熵增益的思想分割各个分布的、同构训练样本集,各分布站点利用服务器传来的分割属性分割自己的样本集,服务器则通过对所有分布站点传来的信息计算各个属性的信息熵增益得到分割属性.实验表明DDTA算法能对分布同构样本集进行有效决策树挖掘,分布多库环境下生成的决策树是正确的.与算法INDUS相比,该算法的通信代价小.

关 键 词:分类  决策树  分布式决策树
文章编号:1672-1292(2005)04-0046-03
收稿时间:2005-05-28
修稿时间:2005年5月28日

Research and Implementation of ID3 Based on Distributed Database System
DAI Nan, JI Genlin.Research and Implementation of ID3 Based on Distributed Database System[J].Journal of Nanjing Nor Univ: Eng and Technol,2005,5(4):46-48.
Authors:DAI Nan  JI Genlin
Abstract:A new decision tree algorithm DDTA(Distributed Decision Tree Algorithm) based on distributed data repositories is presented in this paper.The algorithm divides each distributed and isomorphic data set uses with the idea of informational entropy increase.Each distributional site divides its own data repository with the dividing properties transmitted by the server,and the server obtains the dividing properties by calculating the informational entropy increase of various properties with information transmitted from all the distributed sites.The experiment shows that DDTA algorithm is effective in excavating distributionally isomorphic data repository with a decision tree,and that the decision tree generated in the environment of distributional multi-data repositories is correct.Compared with the algorithm INDUS,the algorithm has less cost in communication.
Keywords:classify  decision tree  distributed decision tree
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号