首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘. 采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题. 并给出了指导该并行算法高效计算的方法. 数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比.  相似文献   

2.
决策树是数据挖掘技术中的重要方法,主要用于分类和预测.本文介绍了决策树算法中应用最广泛的ID3算法和C4.5算法,阐述了两种算法的主要思想,说明了构造决策树的基本步骤,对两种算法进行了分析和比较.  相似文献   

3.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

4.
为提高网格资源的安全性,将数据挖掘算法应用到对网格日志的分析上,通过对网格日志的分析挖掘,从中发现用户的非法行为,实现对用户的限制性访问控制。用一个例子对这种方法进行了描述。该方法的提出增强了网格的安全性。  相似文献   

5.
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

6.
首先介绍了网格的组成与特点及其在实际应用中存在的问题;然后将LogP并行计算模型拓展到网格上,提出双层LogP模型;基于该模型给出相应的并行算法设计策略;最后针对网格特点对行列划分矩阵乘并行算法进行了改进。数值试验表明改进后的算法具有更短的执行时间。  相似文献   

7.
目的将数据挖掘技术应用在胶合板缺陷检测数据中,提取出有效的、正确的规则信息.方法通过分析比较粗糙集软计算方法和决策树方法的特点,利用两种方法具有的优势互补性,将其进行有机集合,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出对用户有价值的决策规则,并将其用“IF—THEN”语句表达出来.以便指导以后的决策过程.结论基于粗糙集和决策树结合的数据挖掘方法提高了获取规则的快速性,降低了计算的复杂度,增强规则的可解释性,取得了良好的研究结果.  相似文献   

8.
粗糙集与决策树结合诊断故障的数据挖掘方法   总被引:5,自引:1,他引:5  
根据数据挖掘技术用于故障诊断的基本思想,利用粗糙集进行数据归纳,过滤大量故障数据中的冗余属性,得到精简故障数据集。而后,用决策树分类方法处理精简数据集,产生分类所需的规则以进行分类,并结合实例说明了该方法的工作步骤。由实例可知该方法用于故障诊断的可行性,最后指出实际应用过程中的一些技术难题。  相似文献   

9.
决策树分类算法是数据挖掘中最基本也是最重要的算法之一。目前,数据挖掘技术被广泛应用在商业领域中。在汽车产品销售系统中,引入数据挖掘技术,可以为汽车销售的经营决策提供科学依据。本文收集某汽车品牌安徽地区近一年的销售数据进行集成和数据预处理;之后采用数据挖掘技术中的改进决策树算法,对汽车销售数据仓库分析和应用,预测影响汽车的销售的主要因素,从而制定汽车的营销策略,帮助企业得到更好的收益。  相似文献   

10.
数据挖掘的方法很多,决策树方法是数据挖掘方法之一。决策树方法不需要对数据进行任何假设,直接将大量数据智能地分类,按照一定的规则找出隐藏的、有价值的信息。文章选取决策树方法中具有代表性的C4.5算法,以高校学生信息管理系统中毕业就业海量信息为实例生成决策树,挖掘出有利于毕业生就业的潜在规则和因素,以便指导高校的教育和管理。  相似文献   

11.
随着信息技术的发展,大量的数据不断被收集和存储,对数据的挖掘规模越来越大,传统的数据挖掘已经无法解决海量数据挖掘问题。网格技术的发展,使得广域分布的海量数据的挖掘问题得到解决。文章根据现实中海量数据挖掘的需求和网格的本质,把并行关联规则挖掘算法应用于网格数据挖掘中,并建立了一个并行数据挖掘模型,验证了并行数据挖掘系统在网格环境的可行性与合理性。  相似文献   

12.
Extensible Markup Language即“可扩展的标置语言”(简记为XML)的出现,为基于Web的数据挖掘带来了便利,开发人员能够用XML的格式标记交换数据。充分利用XML的优点.提供一种利用决策树ID3修正算法和聚类的方法,对XML文档信息进行挖掘,并结合实例说明这种方法。  相似文献   

13.
以大学生笔记本电脑购买行为作为研究对象,由问卷调查得到数据,运用Tip DM数据挖掘工具,通过数据预处理和K-均值聚类,使用C4.5决策树对大学生消费者关于笔记本电脑的购买决策和购买行为进行特征规则提取,采用交叉分析方法进行详细的验证分析。为笔记本电脑经销商、生产商分析大学生消费群体的购买活动提供参考。  相似文献   

14.
石油网格数据挖掘新技术研究   总被引:1,自引:0,他引:1  
针对石油勘探开发中很多TB级和PB级的数据集在许多情况下分布在一个组织的不同地点或不同组织的多个数据源被集团内所有用户共享的特点,用网格数据挖掘数据集成技术和网格数据挖掘本体技术,作为石油勘探开发行业业务工作流程的信息处理基础设施,以满足石油工业对高性能计算技术的持续需求。提出了Webservice与网格技术融合、网格与数据集成技术结合和本体与Webservice合成,给出了基于G10bus Toolkit4、开放式网格服务体系结构和Web服务的技术实现方案。研究表明:网格计算中的任务管理、任务调度和资源管理等服务可以为分布式数据挖掘提供极大的便利。  相似文献   

15.
为了解决电信社群网络中介度(图的一个几何量)计算中的海量计算问题,研究并实现了高性能网格并行计算方法。该算法采用层次性的二分法分割数据,能在较短的时间内完成大规模社群网络图的各个顶点中介度计算。为了提高计算的加速比,还提出了一种改进的网格并行调度算法,采用动静态结合的方法来平衡负载。论证表明,改进算法的加速比、并行效率和平衡度都有提高,计算用时与网格上并行计算处理器数目成近似线形关系。  相似文献   

16.
电信社群网络中介度的网格并行算法及调度算法   总被引:1,自引:0,他引:1  
为了解决电信社群网络中介度(图的一个几何量)计算中的海量计算问题,研究并实现了高性能网格并行计算方法。该算法采用层次性的二分法分割数据,能在较短的时间内完成大规模社群网络图的各个顶点中介度计算。为了提高计算的加速比,还提出了一种改进的网格并行调度算法,采用动静态结合的方法来平衡负载。论证表明,改进算法的加速比、并行效率和平衡度都有提高,计算用时与网格上并行计算处理器数目成近似线形关系。  相似文献   

17.
个性化远程教育平台中数据挖掘技术的应用   总被引:1,自引:0,他引:1  
现代远程教育是一种新型的教学形式,但多数未能实现针对不同学习者的个性化教学。研究如何将数据挖掘技术应用于远程教育领域,建立个性化远程教育系统模型,使远程教育系统的资源根据学生需求来配置,以求达到真正的个性化教学。  相似文献   

18.
Extcnsible Markup Language即"可扩展的标置语言"(简记为XML)的出现,为基于Web的数据挖掘带来了便利,开发人员能够用XML的格式标记交换数据.充分利用XML的优点,提供一种利用决策树ID3修正算法和聚类的方法,对XML文档信息进行挖掘,并结合实例说明这种方法.  相似文献   

19.
分析了目前入侵检测系统存在的错报、漏报等问题,阐述了在网络入侵检测系统中运用数据挖掘技术的基本原理,提出了基于数据挖掘的入侵检测框架模型,探讨了通过对网络连接特性的挖掘来提高警报准确率以及检测未知入侵的方法,最后设计了一个对网络连接性能参数进行数据挖掘的分类算法,并对其具体实现过程进行了描述。  相似文献   

20.
网格、计算网格和智能体网格   总被引:2,自引:0,他引:2  
在追溯网格演变历史的基础上,首先界定了AgentGrid是一种基于Agent技术的计算网格(参照美国国防部DoDDARPA组织实施的基于Agent系统的控制CoABS项目研究提案1999和2002),因此,它具有网格、计算网格和Agent/多Agent系统共有的属性和功能。作为计算网格,它应是计算机软件硬件构成的基础设施,通过其支撑作用向用户提供可靠的、一致的、广泛和廉价的高端计算功能服务。作为Agent系统,它是智能化的一元化体系,兼有Agent系统的一切机制和功能特征,例如滞后绑定,结构再造,最优负载平衡能力,自主存活和扩展能力等。其次,阐明了在AgentGrid中,Agent既充当Grid的使能器,又是其功能的享受者,即客户的特殊作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号