共查询到20条相似文献,搜索用时 20 毫秒
1.
路红梅 《数字社区&智能家居》2007,(9):1412-1412,1442
决策树是一种重要的数据分类方法,测试属性的选择直接影响到决策树中结点的个数和深度,本文提出了一种基于知识粗糙度的方法。通过比较我们发现:在决策树的构造上,粗集理论中知识粗糙度的方法计算量较小,构造的决策树比经典ID3算法简洁,并且具有较高的分类精度。 相似文献
2.
路红梅 《数字社区&智能家居》2007,(17)
决策树是一种重要的数据分类方法,测试属性的选择直接影响到决策树中结点的个数和深度,本文提出了一种基于知识粗糙度的方法.通过比较我们发现:在决策树的构造上,粗集理论中知识粗糙度的方法计算量较小,构造的决策树比经典ID3算法简洁,并且具有较高的分类精度. 相似文献
3.
基于主成分分析的多变量决策树构造方法 总被引:3,自引:0,他引:3
大多数决策树构造方法在每个节点上只检验单个属性,这种单变量决策树忽视了信息系统中广泛存在的属性间的关联作用,而且修剪时往往代价很大。针对以上两点,提出了一种基于主成分分薪的多变量决策树构造方法,提取信息系统中的若干主成分来构造决策树。实验结果表明,这是一种操作简单,效率很高的决策树生成方法。 相似文献
4.
针对嵌入式设备的存储容量小、计算能力有限的特点,设计了一种基于CART(Classification and Regression Trees)决策树模型的基元预选算法和基元选取算法,可以从原始语音语料库中挑选出最有代表性的基元样本,从而有效地降低音库规模和算法的复杂度,满足了嵌入式TFS(Text-to-Speech)系统的需要。基于以上算法,移动终端上实现了一个嵌入式中文TTS系统,实验结果表明该系统的合成语音具有较高的可懂度和自然度。 相似文献
5.
在数据挖掘中我们往往会忽略离群数据,可是这些数据却往往包含重要的信息.本文采用了将决策树与相异度相结合的方式进行离群数据的挖掘.通过计算决策树中各属性的信息增益,递归构造出决策树,并通过剪枝,进行初次的离群点检测,再运用相异度计算公式建立矩阵,找出最终的离群点集合. 相似文献
6.
区间数多属性决策中一种带有可能度的排序方法 总被引:36,自引:1,他引:36
为解决具有不确定性区间数的多属性决策中的方案排序问题,在考虑落在区间内的评价值(即被认为随机变量)服从正态分布的情况下,针对方案综合评价值所在的区间存在相互交叉部分的情形,提出了关于区间数之间相互比较的可能度的概念,并结合给出了有可能度的方案排序方法。通过此方法可计算出一个方案优于另一个方案的可能度。 相似文献
7.
8.
In this paper, we introduce a new comparison relation on fuzzy numbers based on their alpha-cut representation and comparison probabilities of interval values. Basically, this comparison process combines a widely accepted interpretation of fuzzy sets together with the uncertain characteristics inherent in the representation of fuzzy numbers. The proposed comparison relation is then applied to the issue of ranking fuzzy numbers using fuzzy targets in terms of target-based evaluations. Some numerical examples are used to illuminate the proposed ranking technique as well as to compare with previous methods. More interestingly, according to the interpretation of the new comparison relation on fuzzy numbers, we provide a fuzzy target-based decision model as a solution to the problem of decision making under uncertainty, with which an interesting link between the decision maker's different attitudes about target and different risk attitudes in terms of utility functions can be established. Moreover, an application of the proposed comparison relation to the fuzzy target-based decision model for the problem of fuzzy decision making with uncertainty is provided. Numerical examples are also given for illustration. 相似文献
9.
《IEEE transactions on systems, man, and cybernetics. Part A, Systems and humans : a publication of the IEEE Systems, Man, and Cybernetics Society》2009,39(2):344-357
10.
11.
基于层次分解的决策树 总被引:10,自引:0,他引:10
目前人们经常使用决策树推理技术进行知识挖掘。以Quinlan1986年提出的ID3为代表的传统的决策树能较好地解决分类问题,但当类的个数增多时,所产生的单一决策树就会变得复杂,同时概括能力降低。该文采用基于层次分解的方法通过产生多层决策树来处理多类问题。与传统的单一决策树比较,基于层次分解的决策树在处理多类问题时有许多的优势。 相似文献
12.
感兴趣区域定位是提取目标特征,进行目标识别与跟踪等后续处理的重要基础.由于大尺寸遥感图像的光谱特性和目标形状均很复杂,通常采用的基于光谱特征的分割方法和基于边缘的区域生长技术不合适,从模式分类角度考虑遥感图像中感兴趣区域快速定位问题,提出一种基于决策二叉树支持向量机的纹理分类方法,将分类器分布在各个结点上,构成了多类支持向量机,减少了分类器数量和重复训练样本的数量.在SPOT图像上的实验结果表明,该方法实现感兴趣区域的快速定位有较高的分类正确率. 相似文献
13.
《IEEE transactions on pattern analysis and machine intelligence》1986,(4):560-560
The above paper1 provides an automated technique for decision tree design which relies only on a priori statistics. The technique is basically to find a partition of the class set which maximizes the probability of correct classification at a given decision node. To do so, in the above paper1 all the possible partitions are searched exhaustively. In the present comment it is pointed out that the search for the partitions with a size of two is sufficient, and the higher order of partitions need not be searched. 相似文献
14.
15.
16.
17.
18.
FDTU:针对不确定数据的快速决策树生成算法 总被引:1,自引:0,他引:1
目前,针对不确定数据分类分析的决策树算法,如DTU等具有较高的时间复杂度.因此,在利用决策树算法处理不确定数据时,如何能够在保证准确度的同时降低时间开销成为一个重要问题.基于样本属性相互独立的假设提出了不确定独立信息增益的概念和快速不确定决策树算法FDTU (fast decision tree for uncertain data),降低了决策树生成的运行时间.在UCI数据集上的实验表明,相对于不确定决策树算法DTU,FDTU算法具有相近的分类准确度,同时显著地降低了生成决策树所需的运行时间. 相似文献
19.
一种健壮有效的决策树改进模型 总被引:3,自引:0,他引:3
刘鹏 《计算机工程与应用》2005,41(33):172-175
论文提出了一种健壮有效的决策树改进模型R-C4.5及其简化版本。该决策树模型基于著名的C4.5决策树模型,但在属性的选取和分枝策略上进行了改进。对每一个属性计算对应样本子集的熵和样本子集熵的平均值,并将样本子集熵的值不小于平均值的样本子集进行合并,形成一个临时的复合样本子集,即合并分类效果较差的分枝。利用临时复合样本子集的熵值和未合并样本子集的熵值计算该结点的修正信息增益,并选择具有最高修正信息增益的属性作为当前结点的测试属性。其分枝对应于未合并样本子集和复合样本子集。该模型的简化版本在数据预处理阶段完成。R-C4.5决策树模型在提高测试属性选择度量的可解释性、减少空枝和无意义分枝,及过度拟合等方面有了显著的提高。 相似文献
20.
决策树是一种采用分治策略的聚类分析方法,构建决策树的关键是选择合适的属性。传统的决策树通常从最大化信息熵的角度来构造,不能对属性的分类能力进行足够好的区分。对传统的决策树生成算法的不足,本文提出了一种基于马氏距离的决策树生成算法。算法使用马氏距离来区分不同特征属性子集的分类能力。试验结果表明,基于度量的决策树的性能优于传统的决策树。 相似文献