首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
大多数决策树构造方法在每个节点上只检验单个属性,这种单变量决策树忽视了信息系统中广泛存在的属性间的关联作用,而且修剪时往往代价很大。针对以上两点,提出了一种基于主成分分析的多变量决策树构造方法,提取信息系统中的若干主成分来构造决策树。实验结果表明,这是一种操作简单,效率很高的决策树生成方法。  相似文献   

2.
基于粗糙集的多变量决策树构造方法   总被引:77,自引:2,他引:77  
苗夺谦  王珏 《软件学报》1997,8(6):425-431
本文利用粗糙集理论中条件属性相对于决策属性的核,解决多变量检验中属性的选择问题.另外,定义了2个等价关系相对泛化的概念,并将它用于解决多变量检验的构造问题.通过一个例子,对本文提出的多变量决策树方法与著名的单变量决策树(ID3)方法进行了比较,结果表明前者比后者更简单.同时,对几种多变量决策树方法做了初步的对比分析.  相似文献   

3.
噪声数据降低了多变量决策树的生成效率和模型质量,目前主要采用针对叶节点的剪枝策略来消除噪声数据的影响,而对决策树生成过程中的噪声干扰问题却没有给予关注。为改变这种状况,将基本粗糙集(rough set,RS)理论中相对核的概念推广到变精度粗糙集(variable precision roughset,VPRS)理论中,并利用其进行决策树初始变量选择;将两个等价关系相对泛化的概念推广为两个等价关系多数包含情况下的相对泛化,并利用其进行决策树初始属性检验;进而给出一种能够有效消除噪声数据干扰的多变量决策树构造算法。最后,采用实例验证了算法的有效性。  相似文献   

4.
单变量决策树难以反映信息系统属性间的关联作用,构造的决策树往往规模较大。多变量决策树能较好地反映属性间的关系,得到非常简单的决策树,但使构造的决策树难以理解。针对以上两种决策树特点,提出了基于知识粗糙度的混合变量决策树的构造方法,选择知识粗糙度较小的分类属性来构造决策树。实验结果表明,这是一种操作简单、效率很高的决策树生成方法。  相似文献   

5.
基于主成分分析的决策树构造方法   总被引:1,自引:0,他引:1  
针对传统的ID3算法在选择分裂属性上对取值较多属性过分依赖的缺点,提出了基于主成分分析的决策树优化算法.该算法是通过主成分分析综合了信息增益和相关度系数来选择分裂属性.论文通过UCI提供的标准数据集,对优化算法进行测试,分析了优化算法的性能特点,验证了优化算法在分类正确率和执行效率上要优于ID3算法.  相似文献   

6.
针对云平台无法从单变量负荷序列中获取完整预测信息的问题,提出了一种基于主成分分析的多变量局域预测模型并应用于云计算底层资源的预测中。利用主成分分析法综合考虑多种底层资源间的影响关系,确定多变量相空间的嵌入维数,并与局域预测法相结合,由此建立多变量局域预测模型。仿真实验表明,基于主成分分析的多变量局域预测模型的预测精度高于单变量局域预测模型,是面向云计算底层资源预测的一种有效方法。  相似文献   

7.
利用粗糙集中决策表的分明矩阵选择多变量决策树的根属性,把信息熵研究属性约简过程中的理论用于节点属性检验和选择,实现多变量决策树的建立.通过实例验证多变量决策树诊断模型较之单变量决策树诊断模型减少了故障信息的冗余性,诊断效率高,结果易于理解.  相似文献   

8.
朴素贝叶斯和决策树由于其较高的分类性能和简单性得到了广泛的使用,许多学者都在研究如何在分类前对数据进行处理以提升它们的分类性能。该文首先使用主成分分析提取特征数据,然后对处理后的数据上利用朴素贝叶斯和决策树进行分类,并对实验结果进行分析,比较主成分分析对它们分类性能的影响。  相似文献   

9.
一种新的基于粗糙集构造决策树的方法   总被引:1,自引:0,他引:1  
单变量决策树算法生成的决策树具有规模庞大、规则复杂且不易理解的不足.采用粗糙集相对核、加权粗糙度的概念和类别因子相结合的方法,提出一种新的决策树生成算法.对于即将生长的节点,若节点样本的类别因子大于给定阈值,则停止生长该节点,如此就有效地避免了划分过细的问题.通过实验说明,该算法比传统的ID3算法生成的决策树更简单、更易于理解、抗噪声能力更强.  相似文献   

10.
现有的多变量决策树在分类准确性与树结构复杂性两方面优于单变量决策树,但其训练时间却高于单变量决策树,使得现有的多变量决策树不适用于快速响应的分类任务.针对现有多变量决策树训练时间高的问题,提出了基于信息熵和几何轮廓相似度的多变量决策树(IEMDT).该算法利用几何轮廓相似度函数的一对一映射特性,将n维空间样本点投影到一维空间的数轴上,进而形成有序的投影点集合,然后通过类别边界和信息增益计算最优分割点集将有序投影点集合划分为多个子集,接着分别对每个子集继续投影分割,最终生成决策树.在8个数据集上的实验结果表明:IEMDT具有较低的训练时间,并且具有较高的分类准确性.  相似文献   

11.
C4.5决策树展示算法的设计   总被引:10,自引:1,他引:10  
分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和展示的直观性。  相似文献   

12.
数据挖掘中决策树算法的最新进展   总被引:27,自引:1,他引:27  
概述了传统决策树方法的基本原理和优越性,指出了该方法应用于超大数据集的数据挖掘环境时的局限性;着重分五个方面概括了近年来决策树方法在数据挖掘中的主要进展,并讨论了决策树方法面临的挑战及其发展趋势。  相似文献   

13.
分类决策树的归纳是一种重要的数据挖掘算法。本文重点介绍了两种基于并行算法的分类决策树的构造算法,并对它们的适用性及特点作了分析。  相似文献   

14.
决策树算法及其在乳腺疾病图像数据挖掘中的应用   总被引:5,自引:1,他引:5  
介绍了ID3决策树算法建立决策树的基本原理,着重介绍了决策树的修剪问题和两种典型的修剪算法-减少分类错误修剪算法和最小代价-复杂度修剪算法,并利用介绍的决策树算法和修剪算法对乳腺疾病图像进行数据挖掘,得到了一些有实际参考价值的规则,获得了很高的分类准确率,证明了决策树算法在医学图像数据挖掘领域有着广泛的应用前景。  相似文献   

15.
对目前学校教学质量评价中因缺乏有效、科学的方法而造成的不合理现象进行分析,就如何将数据挖掘技术与教学质量评价相结合的问题进行研究.通过教学质量评价指标体系的有效挖掘,运用决策树技术来解决目前教学质量评价中的不合理性,提出基于决策树技术的教学质量评价方法,使教学质量评价公平、公正、合理、高效.  相似文献   

16.
对目前学校教学质量评价中因缺乏有效、科学的方法而造成的不合理现象进行分析,就如何将数据挖掘技术与教学质量评价相结合的问题进行研究。通过教学质量评价指标体系的有效挖掘,运用决策树技术来解决目前教学质量评价中的不合理性,提出基于决策树技术的教学质量评价方法,使教学质量评价公平、公正、合理、高效。  相似文献   

17.
数据挖掘中决策树加权模糊熵算法   总被引:2,自引:0,他引:2  
决策树算法是数据挖掘技术领域的一种重要算法 ,唐华松、姚耀文在利用熵和加权和思想的基础上提出了一种加权熵算法 ,但是此算法在解决模糊问题上有其不足之处 ,我们在加权熵算法的基础上利用模糊理论建立了一种加权模糊熵算法 ,较好的解决了这一问题。  相似文献   

18.
在数据挖掘中,分期是一个很重要的问题,有很多流行的分类器可以创建决策树木产生类模型。本文介绍了通过信息增益或熵的比较来构造一棵决策树的数桩挖掘算法思想,给出了用粗糙集理论构造决策树的一种方法,并用曲面造型方面的实例说明了决策树的生成过程。通过与ID3方法的比较,该种方法可以降低决策树的复杂性,优化决策树的结构,能挖掘较好的规则信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号