首页 | 官方网站   微博 | 高级检索  
     

一种新的决策树分裂属性选择方法
引用本文:刘星毅.一种新的决策树分裂属性选择方法[J].微机发展,2008,18(5):70-72.
作者姓名:刘星毅
作者单位:钦州学院 广西钦州535000
基金项目:广西自然科学基金(桂科0640069)
摘    要:分类问题是数据挖掘和机器学习中的一个核心问题。为了得到最大程度的分类准确率,决策树分类过程中,非常关键的是结点分裂属性的选择。常见的分裂结点属性选择方法可以分为信息熵方法、GINI系数方法等。分析了目前常见的选择分裂属性方法——基于信息熵方法的优、缺点,提出了基于卡方检验的决策树分裂属性的选择方法,用真实例子和设置模拟实验说明了文中算法的优越性。实验结果显示文中算法在分类错误率方面好于以信息熵为基础的方法。

关 键 词:决策树  分裂属性  卡方检验  信息熵
文章编号:1673-629X(2008)05-0070-03
修稿时间:2007年8月25日

A New Splitting Criterion of Decision Trees
LIU Xing-yi.A New Splitting Criterion of Decision Trees[J].Microcomputer Development,2008,18(5):70-72.
Authors:LIU Xing-yi
Affiliation:LIU Xing-yi (Qinzhou University, Qinzhou 535000, China)
Abstract:Classification is an important issue on data mining and machine learning.Selecting splitting attributes is the key process during constructing decision tree for receiving the maximized classification accuracy.Existing methods for classification usually can be the method based on entropy,GINI index,and so on.Analyses the disadvantages and the advantages of the method which is utilized to select splitting attributes based on information gain theory,and proposes a statistical method which employs chi-squared test to get the relation between the condition attributes and the class label.Demonstrate experimental this algorithm and the results show this method is significantly well than the methods based on information theory.
Keywords:decision trees  splitting attributes  Chi-squared test  information entropy  
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号