共查询到17条相似文献,搜索用时 140 毫秒
1.
创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较 总被引:9,自引:0,他引:9
采用多种决策树算法,针对常用的决策树算法在特定样本下的性能进行了分析,提出了选择信息增益率最大的属性作为决策属性算法性能的评价方法. 相似文献
2.
以齐齐哈尔市辖区为研究区域,利用分类回归树(Classification and Regression Tree,CART)算法从训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、纹理特征和地学辅助数据建立研究区的决策树模型.用实测的GPS样本点对分类结果进行精度验证,并与最大似然监督分类方法(Maximum Likelihood Classification,MLC)进行对比.结果表明,基于CART的决策树分类结果的总精度和Kappa系数分别为82.24%和0.77,分类精度较MLC监督分类方法有明显提高,有较好的分类效果. 相似文献
3.
4.
5.
本文对决策树数据挖掘方法进行分析和比较,并应用该分类方法对网页文本进行分类,仿真实验结果证明决策树算法在文本分类研究领域有着广阔的应用前景. 相似文献
6.
7.
随着人们对数据挖掘理论知识的不断研究和探讨,数据挖掘技术和应用领域日趋成熟和广泛。在数据挖掘技术中,决策树方法是用于分类和预测的重要方法之一。本文对决策树构造方法中最为常用的ID3算法进行分析和研究,并将ID3算法在构件库中进行应用,证明了决策树分类方法在构件库领域中的应用前景。 相似文献
8.
针对单训练样本情况下的人脸识别问题,提出一种虚拟样本扩展方法. 利用光照模板映射将单一样本扩展为一组虚拟样本,从而增强单训练样本的分类信息. 采用主成分分析(principal component analysis, PCA)对扩展的虚拟样本进行降维,并用Fisher 鉴别变换作二次特征抽取,然后用最近邻分类器识别人脸图像. 所提方法在人脸图像库Yale B 和Extended Yale B 上进行试验,用PCA+LDA 方法把扩展图像作为训练集对测试图像进行特征提取和识别. 相对于以单样本图像为训练集的PCA 特征提取,该方法显著提高了识别率. 相似文献
9.
随着PACS系统在我国各医院的普及,PACS数据库中存储了大量的医学图像信息,如何把这些图像进行分类来提供相似病例图片,从而为临床诊断提供辅助帮助已成为研究热点.关于医学图像的分类,已有很多学者从不同方面用不同方法进行了研究.本文使用贝叶斯决策树的方法对PACS数据库进行教据挖掘,实现医学图片的分类.贝叶斯决策树不仅能够提高分类的准确率,而且能够处理不一致,不完整数据等"脏数据",本文充分发挥了贝叶斯方法和决策树方法的优点,通过对肺癌图片进行良性、恶性分类,证明了本方法的有效性. 相似文献
10.
11.
决策树分类ID3算法研究 总被引:1,自引:0,他引:1
分类是数据挖掘的重要内容之一,在许多领域得到广泛应用,现已有多种分类方法,其中决策树分类法在海量数据环境中应用最为广泛,本文分析了决策树分类ID3算法的原理,给出构造决策树的基本算法,指出ID3算法构造决策树的优缺点,针对ID3算法倾向于取值较多的测试属性的缺点,引入一个参数来约束属性选择,给出一种优化算法. 相似文献
12.
基于案例的决策是一种直接依据过去的历史案例对当前案例进行分类或者指标预测的方法,K-近邻方法就是一种广泛应用的基于案例的决策模型。在K-近邻方法中,历史案例上需要有标签,而在现实应用中,标签本身有一定的不确定性.文章详细地讨论了现有的基于K-近邻的决策方法忽略了样本标签不确定性这一问题,并基于Dempster-Shafer证据理论对标签不确定性进行建模以改善预测的性能,在此基础上结合边界树模型提高模型的运行效率.文中介绍了边界树算法的作用与原理,对如何结合传统边界树算法与样本标签的不确定性对边界树算法的节点转移策略以及决策过程进行了优化.文章最后对边界树算法的计算规模与准确率做了详细的实验论证.结果表明,文中提出的方法一方面考虑了标签的不确定性,另一方面提高了传统的K-近邻模型的决策效率. 相似文献
13.
基于粗集的ID3算法研究 总被引:5,自引:0,他引:5
朱红 《湘潭大学自然科学学报》2006,28(1):33-36
决策树是数据挖掘任务中分类的常用方法,ID3算法是经典的决策树生成算法,它的核心是通过计算各个属性的信息熵来确定最好的分枝结点.给出一种用粗集的方法计算信息熵,应用ID3算法来生成决策树. 相似文献
14.
在分析决策树算法及遗传算法的基础上,提出了一种将两种算法结合起来挖掘分类规则的新方法.实验证明,它不仅解决了数据挖掘中的“碎片”问题,同时还提高了分类的准确率. 相似文献
15.
银行贷款风险评估一直是金融界高度关注的主要问题,现有方法主要包括K-means聚类、BP神经网络、简单决策树、VAR方法等多种风险评估算法。但对于客户属性值缺失的案例,上述方法就很难达到良好的效果。为了解决属性值缺失的风险评估问题。提出了一种基于贝叶斯决策树算法的贷款风险评估算法(DBT ),实验结果证明了该算法的有效性。 相似文献
16.
利用影响毕业生学位评审的五大指标:学习成绩、实习成绩、论文成绩、英语四级、计算机等级,提出基于学习矢量量化LVQ(Learning Vector Quantization,LVQ)神经网络的高校毕业生学位评审预测模型.以某高校某专业毕业生的实际数据为例,验证了此方法的预测能力.结果表明,基于LVQ神经网络的高校毕业生学位评审预测模型,能为评审学位的工作者提供有益的辅助参考. 相似文献
17.
在测试代价敏感决策系统中,测试代价敏感属性约简方法是一种寻找测试代价尽量小的属性集的有效方法.但是,约简后决策系统只保留了简洁完整的信息,其所构造的分类器精度会有所降低.假设我们拥有有限但多于最小测试代价的资源,那么我们可以充分利用这些资源来获得更高质量的分类器.本文针对这种情况做了以下两个工作:1)我们在最小测试代价约筒的基础上添加好属性,寻找一个更好的属性集.2)提出了一种改进的决策树算法,提高分类器质量.该算法选择一些当前最好的属性值来构建结点,这些属性值能够覆盖当前相应的训练集.实验表明:1)改进的决策树算法能够获得比ID3更高的分类准确度;2)与最小测试代价约简的分类器相比,在最小测试代价约筒的基础上添加一些的好属性,可以获得更高质量的分类器;3)该方法在减少测试代价开销的同时,保证了分类器的质量. 相似文献