首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 20 毫秒
1.
决策树是一种重要的数据分类方法,测试属性的选择直接影响到决策树中结点的个数和深度,本文提出了一种基于知识粗糙度的方法。通过比较我们发现:在决策树的构造上,粗集理论中知识粗糙度的方法计算量较小,构造的决策树比经典ID3算法简洁,并且具有较高的分类精度。  相似文献   

2.
决策树是一种重要的数据分类方法,测试属性的选择直接影响到决策树中结点的个数和深度,本文提出了一种基于知识粗糙度的方法.通过比较我们发现:在决策树的构造上,粗集理论中知识粗糙度的方法计算量较小,构造的决策树比经典ID3算法简洁,并且具有较高的分类精度.  相似文献   

3.
基于主成分分析的多变量决策树构造方法   总被引:3,自引:0,他引:3  
大多数决策树构造方法在每个节点上只检验单个属性,这种单变量决策树忽视了信息系统中广泛存在的属性间的关联作用,而且修剪时往往代价很大。针对以上两点,提出了一种基于主成分分薪的多变量决策树构造方法,提取信息系统中的若干主成分来构造决策树。实验结果表明,这是一种操作简单,效率很高的决策树生成方法。  相似文献   

4.
一种基于决策树模型的音库构建和基元选取方法   总被引:2,自引:1,他引:2       下载免费PDF全文
叶振兴  蔡莲红 《计算机工程》2006,32(10):189-190,220
针对嵌入式设备的存储容量小、计算能力有限的特点,设计了一种基于CART(Classification and Regression Trees)决策树模型的基元预选算法和基元选取算法,可以从原始语音语料库中挑选出最有代表性的基元样本,从而有效地降低音库规模和算法的复杂度,满足了嵌入式TFS(Text-to-Speech)系统的需要。基于以上算法,移动终端上实现了一个嵌入式中文TTS系统,实验结果表明该系统的合成语音具有较高的可懂度和自然度。  相似文献   

5.
在数据挖掘中我们往往会忽略离群数据,可是这些数据却往往包含重要的信息.本文采用了将决策树与相异度相结合的方式进行离群数据的挖掘.通过计算决策树中各属性的信息增益,递归构造出决策树,并通过剪枝,进行初次的离群点检测,再运用相异度计算公式建立矩阵,找出最终的离群点集合.  相似文献   

6.
区间数多属性决策中一种带有可能度的排序方法   总被引:36,自引:1,他引:36  
张全  樊治平 《控制与决策》1999,14(6):703-706,711
为解决具有不确定性区间数的多属性决策中的方案排序问题,在考虑落在区间内的评价值(即被认为随机变量)服从正态分布的情况下,针对方案综合评价值所在的区间存在相互交叉部分的情形,提出了关于区间数之间相互比较的可能度的概念,并结合给出了有可能度的方案排序方法。通过此方法可计算出一个方案优于另一个方案的可能度。  相似文献   

7.
介绍了RH-KTB炉外精炼真空抽气系统的工作原理和故障特点,该系统的故障诊断应满足从大量数据中快速提取征兆并及时诊断且有一定的自学习能力。提出了一种以实例为基础的归纳学习算法即ID3算法。ID3算法有一定的自学习、自组织能力,适用于复杂系统的智能诊断。以实例验证了该算法对RH-KTB真空抽气系统故障诊断的有效性。通过讨论分析了ID3算法的特点和作用。  相似文献   

8.
In this paper, we introduce a new comparison relation on fuzzy numbers based on their alpha-cut representation and comparison probabilities of interval values. Basically, this comparison process combines a widely accepted interpretation of fuzzy sets together with the uncertain characteristics inherent in the representation of fuzzy numbers. The proposed comparison relation is then applied to the issue of ranking fuzzy numbers using fuzzy targets in terms of target-based evaluations. Some numerical examples are used to illuminate the proposed ranking technique as well as to compare with previous methods. More interestingly, according to the interpretation of the new comparison relation on fuzzy numbers, we provide a fuzzy target-based decision model as a solution to the problem of decision making under uncertainty, with which an interesting link between the decision maker's different attitudes about target and different risk attitudes in terms of utility functions can be established. Moreover, an application of the proposed comparison relation to the fuzzy target-based decision model for the problem of fuzzy decision making with uncertainty is provided. Numerical examples are also given for illustration.  相似文献   

9.
The existence of the learning effect in many manufacturing systems is undoubted; thus, it is worthwhile that it be taken into consideration during production planning to increase production efficiency. Generally, it can be done by formulating the specified problem in the scheduling context and optimizing an order of jobs to minimize the given time criteria. To carry out a reliable study of the learning effect in scheduling fields, a comprehensive survey of the related results is presented first. It reveals that most of the learning models in scheduling are based on the learning curve introduced by Wright. However, further study about learning itself pointed out that the curve may be an “S”-shaped function, which has not been considered in the scheduling domain. To fill this gap, we analyze a scheduling problem with a new experience-based learning model, where job processing times are described by “S”-shaped functions that are dependent on the experience of the processor. Moreover, problems with other experience-based learning models are also taken into consideration. We prove that the makespan minimization problem on a single processor is NP-hard or strongly NP-hard with the most of the considered learning models. A number of polynomially solvable cases are also provided.   相似文献   

10.
11.
基于层次分解的决策树   总被引:10,自引:0,他引:10  
目前人们经常使用决策树推理技术进行知识挖掘。以Quinlan1986年提出的ID3为代表的传统的决策树能较好地解决分类问题,但当类的个数增多时,所产生的单一决策树就会变得复杂,同时概括能力降低。该文采用基于层次分解的方法通过产生多层决策树来处理多类问题。与传统的单一决策树比较,基于层次分解的决策树在处理多类问题时有许多的优势。  相似文献   

12.
感兴趣区域定位是提取目标特征,进行目标识别与跟踪等后续处理的重要基础.由于大尺寸遥感图像的光谱特性和目标形状均很复杂,通常采用的基于光谱特征的分割方法和基于边缘的区域生长技术不合适,从模式分类角度考虑遥感图像中感兴趣区域快速定位问题,提出一种基于决策二叉树支持向量机的纹理分类方法,将分类器分布在各个结点上,构成了多类支持向量机,减少了分类器数量和重复训练样本的数量.在SPOT图像上的实验结果表明,该方法实现感兴趣区域的快速定位有较高的分类正确率.  相似文献   

13.
The above paper1 provides an automated technique for decision tree design which relies only on a priori statistics. The technique is basically to find a partition of the class set which maximizes the probability of correct classification at a given decision node. To do so, in the above paper1 all the possible partitions are searched exhaustively. In the present comment it is pointed out that the search for the partitions with a size of two is sufficient, and the higher order of partitions need not be searched.  相似文献   

14.
本文提出了BODCDSS的概念,按照系统逻辑功能的不同构建了该系统的层次化体系结构,在对系统进行模块划分的基础之上,指出了用户模块、代理模块和数据仓库模块的实现技术,详细描述了BODCDSS中的分布式群体协作模式以及其分布式协作算法,针对风险型决策问题和不确定型问题提出了可用的决策方法.  相似文献   

15.
本文提出了BODCDSS的概念,按照系统逻辑功能的不同构建了该系统的层次化体系结构,在对系统进行模块划分的基础之上,指出了用户模块、代理模块和数据仓库模块的实现技术,详细描述了BODCDSS中的分布式群体协作模式以及其分布式协作算法,针对风险型决策问题和不确定型问题提出了可用的决策方法。  相似文献   

16.
17.
构造性混合决策树   总被引:5,自引:0,他引:5  
周志华  葛翔  陈兆乾 《计算机学报》2001,24(10):1057-1063
提出了一种构造性混合决策树学习方法CHDT。该方法用符号学习来进行定性分析,用神经学习进行后续的定量分析,在一定程度上模拟了人类的思维过程。CHDT采用了一种独特的构造性归纳机制,较好地解决了在缺乏领域知识指导的情况下进行构造性学习的问题,它通过采用FTART2网络和适宜于混合决策树的神经网络嵌入机制,获得了较强的泛化能力。实验结果表明,CHDT能构造出结构简洁、预测精度高的混合决策树。  相似文献   

18.
FDTU:针对不确定数据的快速决策树生成算法   总被引:1,自引:0,他引:1  
目前,针对不确定数据分类分析的决策树算法,如DTU等具有较高的时间复杂度.因此,在利用决策树算法处理不确定数据时,如何能够在保证准确度的同时降低时间开销成为一个重要问题.基于样本属性相互独立的假设提出了不确定独立信息增益的概念和快速不确定决策树算法FDTU (fast decision tree for uncertain data),降低了决策树生成的运行时间.在UCI数据集上的实验表明,相对于不确定决策树算法DTU,FDTU算法具有相近的分类准确度,同时显著地降低了生成决策树所需的运行时间.  相似文献   

19.
一种健壮有效的决策树改进模型   总被引:3,自引:0,他引:3  
论文提出了一种健壮有效的决策树改进模型R-C4.5及其简化版本。该决策树模型基于著名的C4.5决策树模型,但在属性的选取和分枝策略上进行了改进。对每一个属性计算对应样本子集的熵和样本子集熵的平均值,并将样本子集熵的值不小于平均值的样本子集进行合并,形成一个临时的复合样本子集,即合并分类效果较差的分枝。利用临时复合样本子集的熵值和未合并样本子集的熵值计算该结点的修正信息增益,并选择具有最高修正信息增益的属性作为当前结点的测试属性。其分枝对应于未合并样本子集和复合样本子集。该模型的简化版本在数据预处理阶段完成。R-C4.5决策树模型在提高测试属性选择度量的可解释性、减少空枝和无意义分枝,及过度拟合等方面有了显著的提高。  相似文献   

20.
决策树是一种采用分治策略的聚类分析方法,构建决策树的关键是选择合适的属性。传统的决策树通常从最大化信息熵的角度来构造,不能对属性的分类能力进行足够好的区分。对传统的决策树生成算法的不足,本文提出了一种基于马氏距离的决策树生成算法。算法使用马氏距离来区分不同特征属性子集的分类能力。试验结果表明,基于度量的决策树的性能优于传统的决策树。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号

京公网安备 11010802026262号