共查询到18条相似文献,搜索用时 93 毫秒
1.
基于决策熵的决策树规则提取方法 总被引:2,自引:0,他引:2
在决策表中,决策规则的可信度和对象覆盖度是衡量决策能力的重要指标。以知识粗糙熵为基础,提出决策熵的概念,并定义其属性重要性;然后以条件属性子集的决策熵来度量其对决策分类的重要性,自顶向下递归构造决策树;最后遍历决策树,简化所获得的决策规则。该方法的优点在于构造决策树及提取规则前不进行属性约简,计算直观,时间复杂度较低。实例分析的结果表明,该方法能获得更为简化有效的决策规则。 相似文献
2.
3.
基于决策分类熵的决策树构造算法及应用 总被引:1,自引:0,他引:1
为了更好地完成金融数据集上的分类挖掘任务,以粗糙集理论为基础提出决策分类熵的概念,进而以属性的决策分类熵为属性分裂度量提出基于决策分类熵的决策树构造算法,并针对过拟合问题提出一种抑制参数来实现树规模的良好控制。实例分析及金融数据集上的实验表明:相比经典的C4.5决策树算法,新算法能够较好地克服其缺点和不足,构建更优的决策树,能够更好地完成分类任务。 相似文献
4.
决策树是一种重要的数据分类方法,在构造决策树的过程中,测试属性的选择直接影响到决策树中结点的个数和深度,基于相对熵的概念提出了一种新的决策树构造方法。实例分析的结果表明:在决策树的构造上,粗糙集理论中相对熵的方法计算量较小,构造的决策树比经典ID3,C4.5算法简洁,并且具有较高的分类精度。 相似文献
5.
6.
7.
针对故障诊断信息的不一致性,提出一种基于粗糙集决策网络的故障规则提取方法。将故障诊断决策系统通过分辨矩阵和分辨函数进行属性约简后,构造出一个不同简化层次的决策网络。将属性约简集作为网络初始节点,根据网络节点得到决策规则集;同时,为了有效滤除噪声,在置信度的基础上引入了规则覆盖度的概念,对提取的规则进一步评价,最终提取有效的诊断规则。旋转机械故障实例验证了该方法的有效性。 相似文献
8.
基于值约简和决策树的最简规则提取算法 总被引:7,自引:0,他引:7
粗糙集理论中的值约简和数据挖掘领域中的决策树都是有效的分类方法,但二者都有其局限性。将这两种方法结合起来,生成一种新的基于值核的极小化方法对决策树进行修剪,提出了约简规则的判定准则,缩小了约简的范围,最后再对生成的规则进行极大化处理,以保证规则覆盖信息的一致性,实验验证了该算法的有效性。 相似文献
9.
提出一种基于粒度计算模型的决策规则提取算法。我们用属性取值构成粒度集合取代条件属性,每一步都选择单个粒度。该方法将产生对象的一个覆盖。还描述了粒度搜索策略和对粒度测量的方法,通过规则的可信度和覆盖度对决策规则进行归类优选。最后对粒度计算在规则提取中的应用进行了讨论研究。 相似文献
10.
基于粗糙集和决策树的增量式规则约简算法 总被引:2,自引:0,他引:2
粗糙集方法是一种处理不确定或模糊知识的重要工具。传统的粗糙集模型对最简规则集的研究都是针对静态数据的,对于动态数据却显得无能为力。但在实际应用中,数据库中的数据往往是动态变化的,因此,对规则约简的增量式算法的研究是知识发现领域所急需解决的问题之一。文章给出了一种基于粗糙集和决策树的增量式规则约简算法,并与传统算法和RRIA算法进行了对比分析,实验结果表明该算法的方法和效果更好。 相似文献
11.
12.
利用粗糙集中决策表的分明矩阵选择多变量决策树的根属性,把信息熵研究属性约简过程中的理论用于节点属性检验和选择,实现多变量决策树的建立.通过实例验证多变量决策树诊断模型较之单变量决策树诊断模型减少了故障信息的冗余性,诊断效率高,结果易于理解. 相似文献
13.
14.
基于信息熵的决策属性分类挖掘算法及应用 总被引:10,自引:0,他引:10
在利用判定树进行分类挖掘时,需事先知道属性的分类。对不具体的或未知的属性分类,利用“高类聚、低耦合”原理对属性进行最优分类。在属性分类的基础上,利用基于信息熵的属性期望信息及对应的信息增益理论选择最佳分类决策属性,并按最佳分类决策属性引出分枝形成判定树。该文对属性的最优分类理论及算法进行了描述,并讨论了选择最佳决策属性构造判定树的算法,结合具体应用实例进行了验证并构造了判定树。 相似文献
15.
为了在含有连续条件属性的决策表中挖掘和应用决策规则,通过采用互信息熵作为模糊聚类的截距值选定准则,对信息系统对象集进行模糊聚类划分,并根据粗糙集的有关概念,确定基于截距的近似集和边界,从中挖掘出不确定性决策规则,进一步建立决策知识库。最后以该知识库为识别模型,结合模糊隶属度的计算和不确定性推理进行地层识别,取得了令人满意的效果。 相似文献
16.
决策树是数据挖掘中常用的分类方法。针对高等院校学生就业问题中出现由噪声造成的不一致性数据,本文提出了基于变精度粗糙集的决策树模型,并应用于学生就业数据分析。该方法以变精度粗糙集的分类质量的量度作为信息函数,对条件属性进行选择,作为树的节点,自上而下地分割数据集,直到满足某种终止条件。它充分考虑了属性间的依赖性和冗余性,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性。实验表明,该算法能够有效地处理不一致性数据集,并能正确合理地将就业数据分类,最终得到若干有价值的结论,供决策分析。该算法大大提高了决策规则的泛化能力,减化了树的结构。 相似文献
17.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的ID3算法结构简单,并且能提高分类效率。 相似文献
18.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的IDB算法结构简单,并且能提高分类效率。 相似文献