共查询到17条相似文献,搜索用时 140 毫秒
1.
提出一种改进的SLIQ决策树分类算法,克服原有SLIQ算法需要大量计算决策树每个节点的吉尼指数(GINI Index)的缺点.一是给出数据分布密度的基本概念,并在GINI指标的基础上利用数据分布密度差改进SLIQ;二是将SLIQ算法应用到综合评价中去.实例结果表明,算法改进后,寻找最佳分裂方案的GINI指标的个数大大减少,缩减计算量,降低排序成本和寻找最佳分裂点的代价,简化决策树的规模. 相似文献
2.
云计算为存储和分析海量数据提供了高效的解决方案,对数据挖掘算法的研究具有重要的理论意义和应用价值。SLIQ算法采用逐一遍历并计算伸缩性指标的方法来寻找最佳分裂点,这种方法过于消耗时间,当数据量增大时,算法的执行效率很低。本文针对云计算环境下的决策规则挖掘算法展开研究,介绍了Map Reduce编程模型,在此基础上,以实现云计算环境下SLIQ并行化挖掘为目的,给出了改进后的SLIQ算法在Map Reduce编程模型上的应用过程。 相似文献
3.
一个基于SLIQ的分类算法的实现 总被引:1,自引:0,他引:1
在介绍数据挖掘、分类算法的有关概念的基础上,描述了一个基于SLIQ(Supervised Learning in Quest)的分类算法的实现。算法控制结构采用队列来控制广度优先搜索,对属性表进行内部排序生成有序的属性表序列,再对所有属性表进行遍历,找出所有叶子节点的最佳分裂方案,对应该分裂的类表进行更改,最后生成的决策树通过前序遍历的方式存入输出表。 相似文献
4.
基于最小Gini指标的决策树分类算法设计与研究 总被引:1,自引:0,他引:1
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。 相似文献
5.
6.
本文通过分析现有成绩管理系统中的不足,提出采用类字段来进行成绩管理,以便大大减少数据库中表的数量和记录的数量。通过对成绩分析的相关研究,提出应用数据挖掘技术来进行学生成绩的分析,提高成绩分析水平。通过对决策树中SLIQ算法研究,将SLIQ算法应用到学生成绩分析中,让教师和学校教育决策者洞悉教学中存在的问题。 相似文献
7.
8.
决策树是分类方法中的常用之一。对当前常用构造决策树的方法ID3和c4.5,最具代表性SLIQ和SPRINT算法进行介绍,在结合实例对ID3和C4.5算法构造决策树进行分析和比较,总结了各算法的特性。 相似文献
9.
一种可伸缩的快速属性约简算法 总被引:4,自引:0,他引:4
现有基于粗糙集的属性约简算法主要针对数据全部驻留在内存中的情况,因此算法不适合海量数据的约简计算、可伸缩性较差.本文借助SLIQ算法的思想并引入相应的一种数据预处理策略,由此提出一个快速的属性约简算法,其时间复杂性为O(| U || C|).实验结果表明该算法具有良好的可伸缩性. 相似文献
10.
根据医学图像数据的特性,提出一种基于粗糙集和决策树相结合的数据挖掘新方法。该方法利用粗糙集中基于属性重要性的离散化方法对医学图像特征进行离散化,采用粗糙集对其属性进行约简,得到低维训练数据,再用SLIQ决策树算法产生决策规则。实验表明:将粗糙理论与SLIQ相结合的数据挖掘方法既保留了原始数据的内部特点,同时剔除了与分类无关或关系不大的冗余特征,从而提高了分类的准确率和效率。 相似文献
11.
Knowledge inference systems are built to identify hidden and logical patterns in huge data. Decision trees play a vital role in knowledge discovery but crisp decision tree algorithms have a problem with sharp decision boundaries which may not be implicated to all knowledge inference systems. A fuzzy decision tree algorithm overcomes this drawback. Fuzzy decision trees are implemented through fuzzification of the decision boundaries without disturbing the attribute values. Data reduction also plays a crucial role in many classification problems. In this research article, it presents an approach using principal component analysis and modified Gini index based fuzzy SLIQ decision tree algorithm. The PCA is used for dimensionality reduction, and modified Gini index fuzzy SLIQ decision tree algorithm to construct decision rules. Finally, through PID data set, the method is validated in the simulation experiment in MATLAB. 相似文献
12.
13.
14.
李亘 《数字社区&智能家居》2007,(23)
数据挖掘,也可以称为数据库中的知识发现(Knowledge Discovery in Database,KDD).决策树是数据挖掘的一个重要的技术.本文尝试把数据挖掘的方法和技术,通过实现SLIQ算法把该技术应用到税务稽查的计算机选案的途径. 相似文献
15.
16.
17.
针对电信CRM中“数据丰富但知识贫乏”的现象,利用数据挖掘技术和SL IQ决策树构造算法建立一棵决策树模型,在CRM中根据客户的年龄、所属城市和性别对客户分类,对预测客户类型,防止用户流失,争取新用户具有重要意义。 相似文献