首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
基于关联度函数的决策树分类算法   总被引:10,自引:0,他引:10  
韩松来  张辉  周华平 《计算机应用》2005,25(11):2655-2657
为了克服决策树算法中普遍存在的多值偏向问题,提出了一种新的基于关联度函数的决策树算法--AF算法,并从理论上分析了它克服多值偏向的原理。通过实验发现,与ID3算法比较,AF算法不仅克服了多值偏向问题,而且保持了较高的分类正确率。  相似文献   

2.
对ID3算法的基本原理及其主要不足以及现有几种改进算法的优缺点进行了简要分析,针对ID3算法的主要不足即倾向于多值属性的选取,利用粗糙集理论和数学相关知识点对其进行了一定程度的改进。理论分析和实验结果表明,改进后的算法在一定程度上不仅较好地解决了ID3算法的多值偏向问题而且大大简化了算法的计算过程,明显提高了算法分类准确度和执行效率。  相似文献   

3.
基于属性相似度的决策树算法   总被引:1,自引:2,他引:1       下载免费PDF全文
针对ID3算法的多值偏向问题,提出一种基于属性相似度的、能够避免多值偏向问题的ID3改进算法——NewDtree算法,并应用理论分析方法对NewDtree算法不存在多值偏向问题进行了证明。通过对实验结果的分析,得出NewDtree算法能有效地提高分类的正确率,弥补ID3算法选择测试属性时偏向取值较多的不足的结论。  相似文献   

4.
基于朴素贝叶斯与ID3算法的决策树分类   总被引:2,自引:0,他引:2       下载免费PDF全文
v在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。  相似文献   

5.
基于属性重要度的ID3改进算法   总被引:8,自引:0,他引:8  
ID3算法是数据挖掘中最经典的分类算法.该算法偏向于选择取值较多的属性,而属性值较多的属性不总是重要的,从而影响了分类预测的高效性.通过对ID3算法的研究,依据属性重要度粗糙集理论的思想,对经典的ID3算法做了相应的改进,改进后的ID3算法(AIID3),提高了算法的决策效率.最后的实例及应用表明,改进的算法更有效,更快速.  相似文献   

6.
基于修正系数的决策树分类算法   总被引:2,自引:1,他引:1  
ID3算法是决策树算法中的经典算法,但存在多值偏向问题.一些改进的ID3算法虽避免了多值偏向问题,但多存在主观性强,没有考虑属性信息熵等问题.为了解决该问题,提出了一种基于修正系数的决策树分类算法MC.该算法利用修正系数降低取值个数多的属性的信息增益,并通过实验与ID3算法进行了比较,结果表明,当样本集中各属性取值个数不同时,算法MC在生成决策树的结点总数和分类准确率上明显优于ID3算法.  相似文献   

7.
一种基于修正信息增益的ID3算法   总被引:2,自引:0,他引:2       下载免费PDF全文
ID3算法是决策树中影响最大的算法之一,它以信息增益为标准选择决策树的测试属性。这种算法存在不足之处,在选择合适的测试属性时,倾向于选择取值较多的属性,而在实际应用中,取值较多的属性未必是重要的。针对此算法的不足,本文提出了一种对增益修正的 ID3算法,为改善 ID3的多值偏向问题提供了一种有效途径。通过理论分析和实验证明,这种算法能较好地解决多值倾向的问题。  相似文献   

8.
结合ID3算法的不足,提出一种基于属性重要度简化标准的ID3改进算法:a)简化ID3算法的信息熵从而降低算法的计算时间;b)引入属性重要度概念来弥补ID3算法属性选择标准的不足;c)综合a)和b)来实现新的属性选择标准即属性重要度简化标准。在开源的Weka数据挖掘软件环境下进行仿真实验,结果表明该改进算法是可行的,并且在算法的计算时间和准确度方面都优于ID3算法,尤其是在数据样本集规模达到一定数量时,效果更加明显。  相似文献   

9.
10.
针对传统ID3算法计算过程复杂以及存在信息冗余的问题,提出了一种改进算法——基于粗糙集属性约简的简化ID3算法.该算法利用粗糙集中属性约简的性质删掉了系统中多余的知识,在保证同样的分类能力下使得分类系统更简洁,同时借助了泰勒公式对熵公式进行化简,使得计算更简便,然后把改进的算法用到实例中去,并用相关数据库上的大量数据编程进行仿真实验,最后得出的仿真结果证明了所提出算法的正确性与可行性,不仅能够有效降低信息重复度,减少了冗余规则,还保证了算法精度,同时为把ID3算法更好地应用到现实生活实例中提供了一定的参考价值.  相似文献   

11.
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。  相似文献   

12.
《软件工程师》2020,(3):35-37
ID3算法作为最经典的决策树分类方法,因其直观、简单、容易实现等优点,在电子商务领域得到了广泛应用。文章首先分析了ID3算法的基本原理与流程,然后以某商务网站为例,以其客户交易数据为研究对象,深入探讨了该算法在客户分类中的具体应用。通过该算法的使用,可对商务网站的客户进行准确分类,从而为其开展个性化服务及精准营销提供重要的理论依据。  相似文献   

13.
ID3算法的一种改进算法   总被引:33,自引:5,他引:33  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。ID3算法是决策树中的核心算法,文章针对ID3算法倾向于取值较多的属性的缺点,引进用户兴趣度对ID3算法作了改进,并通过实验对改进前后的算法进行了比较,实验表明,改进后的算法是有效的。  相似文献   

14.
ID3算法是最为经典的分类方法,理论清晰,计算简便,已得到广泛应用。但ID3算法存在多值偏向问题,分类精度不够高,这些都限制了它的应用效果。本文依据决策树的改进思路,提出一种基于ID3算法的优化算法,分析了优化算法的建树过程和优缺点,并以实验数据验证了新算法的性能。结论中概述了新算法的特性和下一步研究重点。  相似文献   

15.
一种基于ID3的前剪枝改进算法   总被引:2,自引:0,他引:2  
ID3算法作为一种流行的决策树算法,因为其算法简单、易实现而被广泛使用。但其生成的树结构往往过于庞大,复杂,也影响了算法效率。为了优化树的结构,提高树生成的效率,避免“过拟合”效应,本文将每个分类属性分类后的效果也考虑在内,即,若分类效果达到某个预定的标准则终止那条分支继续分类,并引入了最大支持度的概念,采用了前剪枝策略,对ID3算法进行了改进。实验结果显示,改进算法的确能够使生成的决策树在保证精度的基础上更加精简。  相似文献   

16.
本文讨论了基于互信息的决策树分类算法——ID3算法及其改进算法C4.5。  相似文献   

17.
罗雨滋  付兴宏 《计算机系统应用》2013,22(10):136-138,187
本文通过数据挖掘对传统ID3决策树分类算法及性能进行分析研究,‘利用高等数学中的微分理论知识,改进和优化了ID3算法中的运算速度和选择测试属性偏向问题,并进一步给出了改进算法的伪代码.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号