首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
提出一种改进的SLIQ决策树分类算法,克服原有SLIQ算法需要大量计算决策树每个节点的吉尼指数(GINI Index)的缺点.一是给出数据分布密度的基本概念,并在GINI指标的基础上利用数据分布密度差改进SLIQ;二是将SLIQ算法应用到综合评价中去.实例结果表明,算法改进后,寻找最佳分裂方案的GINI指标的个数大大减少,缩减计算量,降低排序成本和寻找最佳分裂点的代价,简化决策树的规模.  相似文献   

2.
云计算为存储和分析海量数据提供了高效的解决方案,对数据挖掘算法的研究具有重要的理论意义和应用价值。SLIQ算法采用逐一遍历并计算伸缩性指标的方法来寻找最佳分裂点,这种方法过于消耗时间,当数据量增大时,算法的执行效率很低。本文针对云计算环境下的决策规则挖掘算法展开研究,介绍了Map Reduce编程模型,在此基础上,以实现云计算环境下SLIQ并行化挖掘为目的,给出了改进后的SLIQ算法在Map Reduce编程模型上的应用过程。  相似文献   

3.
一个基于SLIQ的分类算法的实现   总被引:1,自引:0,他引:1  
谭勇  荣秋生 《计算机工程》2003,29(18):98-100
在介绍数据挖掘、分类算法的有关概念的基础上,描述了一个基于SLIQ(Supervised Learning in Quest)的分类算法的实现。算法控制结构采用队列来控制广度优先搜索,对属性表进行内部排序生成有序的属性表序列,再对所有属性表进行遍历,找出所有叶子节点的最佳分裂方案,对应该分裂的类表进行更改,最后生成的决策树通过前序遍历的方式存入输出表。  相似文献   

4.
基于最小Gini指标的决策树分类算法设计与研究   总被引:1,自引:0,他引:1  
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。  相似文献   

5.
吴微  朱玉全  程鹏  王恒 《微计算机信息》2008,24(15):309-311
针对医学图像数据过于复杂且分布存储的特点,提出并实现了一种基于SLIQ的分布式医学图像分类框架.该框架包括:表示层、处理层和挖掘层.其中,分布式协调器(DTC)是处理层的核心,通过分析以往算法的优缺点,建立一种分布式数据挖掘的计算框架,并给出相应的求解算法.挖掘层中的分类算法采用适合处理海量数据的SLIQ决策树方法.实验结果表明该分类系统是有效和可行的.  相似文献   

6.
陈明忠 《福建电脑》2008,24(5):120-121
本文通过分析现有成绩管理系统中的不足,提出采用类字段来进行成绩管理,以便大大减少数据库中表的数量和记录的数量。通过对成绩分析的相关研究,提出应用数据挖掘技术来进行学生成绩的分析,提高成绩分析水平。通过对决策树中SLIQ算法研究,将SLIQ算法应用到学生成绩分析中,让教师和学校教育决策者洞悉教学中存在的问题。  相似文献   

7.
文章阐述了入侵检测和数据挖掘,然后介绍了SLIQ算法在入侵检测中的具体实现。  相似文献   

8.
郑翠萍 《福建电脑》2011,27(8):55-57
决策树是分类方法中的常用之一。对当前常用构造决策树的方法ID3和c4.5,最具代表性SLIQ和SPRINT算法进行介绍,在结合实例对ID3和C4.5算法构造决策树进行分析和比较,总结了各算法的特性。  相似文献   

9.
一种可伸缩的快速属性约简算法   总被引:4,自引:0,他引:4  
现有基于粗糙集的属性约简算法主要针对数据全部驻留在内存中的情况,因此算法不适合海量数据的约简计算、可伸缩性较差.本文借助SLIQ算法的思想并引入相应的一种数据预处理策略,由此提出一个快速的属性约简算法,其时间复杂性为O(| U || C|).实验结果表明该算法具有良好的可伸缩性.  相似文献   

10.
根据医学图像数据的特性,提出一种基于粗糙集和决策树相结合的数据挖掘新方法。该方法利用粗糙集中基于属性重要性的离散化方法对医学图像特征进行离散化,采用粗糙集对其属性进行约简,得到低维训练数据,再用SLIQ决策树算法产生决策规则。实验表明:将粗糙理论与SLIQ相结合的数据挖掘方法既保留了原始数据的内部特点,同时剔除了与分类无关或关系不大的冗余特征,从而提高了分类的准确率和效率。  相似文献   

11.
Knowledge inference systems are built to identify hidden and logical patterns in huge data. Decision trees play a vital role in knowledge discovery but crisp decision tree algorithms have a problem with sharp decision boundaries which may not be implicated to all knowledge inference systems. A fuzzy decision tree algorithm overcomes this drawback. Fuzzy decision trees are implemented through fuzzification of the decision boundaries without disturbing the attribute values. Data reduction also plays a crucial role in many classification problems. In this research article, it presents an approach using principal component analysis and modified Gini index based fuzzy SLIQ decision tree algorithm. The PCA is used for dimensionality reduction, and modified Gini index fuzzy SLIQ decision tree algorithm to construct decision rules. Finally, through PID data set, the method is validated in the simulation experiment in MATLAB.  相似文献   

12.
数据挖掘中判定树算法SLIQ的设计与应用   总被引:4,自引:0,他引:4  
分析了一种用Gini指标进行属性选择的SLIQ算法,讨论了提高效率的可行方法.把算法用到电力市场发电竞价决策系统中,通过对发电商的竞标能力进行挖掘,获取的知识对发电商的决策有重要现实意义.  相似文献   

13.
基于决策树的软件分类方法   总被引:2,自引:1,他引:1       下载免费PDF全文
提出一种基于决策树SLIQ算法的软件分类方法,在利用现有测试工具的条件下,编写应用接口,获取软件的外部属性和内部属性数据。对异构数据源进行清理转换,从中提取软件分类的规则,对软件进行细粒度的划分,构建分类模型并在数据库管理系统不同版本的分类中应用。  相似文献   

14.
数据挖掘,也可以称为数据库中的知识发现(Knowledge Discovery in Database,KDD).决策树是数据挖掘的一个重要的技术.本文尝试把数据挖掘的方法和技术,通过实现SLIQ算法把该技术应用到税务稽查的计算机选案的途径.  相似文献   

15.
基于规则归纳的遗传算法选择和参数设置   总被引:1,自引:1,他引:0       下载免费PDF全文
李婷  崔杜武 《计算机工程》2010,36(3):218-220
在设计遗传算法时,讨论算法种类的选取和控制参数的设置,基于规则归纳方法,提出一种研究遗传算法种类选择和控制参数设置的实验模型,以遗传算法数值优化问题为背景,用统一结构描述遗传算法实验,利用属性分组等操作规范训练集与决策树算法SLIQ进行规则归纳,将获取的规则用于指导遗传算法设计,并用设计出的算法解决某函数的优化求解问题。  相似文献   

16.
ID3算法是一种信息熵的决策树学习算法,把信息熵作为选择测试属性的标准,对训练实例集进行分类并构造决策树来预测如何由属性对整个实例空间进行划分。ID3算法对于相对小的数据集是很有效的,但对大型数据库而言,ID3算法无法处理。SLIQ分类算法使用了一些独特的技术,改进了学习的时间,同时在没有降低精确度的情况下,解决了对磁盘驻留大数据集的分类。具有更快的速度而且生成较小的树。  相似文献   

17.
针对电信CRM中“数据丰富但知识贫乏”的现象,利用数据挖掘技术和SL IQ决策树构造算法建立一棵决策树模型,在CRM中根据客户的年龄、所属城市和性别对客户分类,对预测客户类型,防止用户流失,争取新用户具有重要意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号