首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
决策树C4.5算法在数据挖掘中的分析及其应用   总被引:5,自引:0,他引:5  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。  相似文献   

2.
随着高校学生的心理问题越来越多,越来越复杂,使得传统的对学生心理问题的统计分析方法已不适应深入分析的需要。应用数据挖掘技术中的C4.5算法对学生心理数据库进行了情况分类,并对得到的结果进行了分析,得出了影响高校学生心理的因素,对高校学生进行心理健康状况预测,为高校学生心理健康教育提供决策支持。  相似文献   

3.
在利用现有C4.5算法构建期货预测决策树时,往往出现预测准确率低的弊端,导致预测模型很难使用,为此提出了一种面向期货数据的C4.5-[K]算法。该算法的主要思想是通过在C4.5算法中引进新的参数[K],调整属性度量标准信息增益率的取值范围,进而构建决策树预测模型进行预测。通过实验表明,该改进算法能有效提高期货预测能力。  相似文献   

4.
大数据时代已经到来,对数据的处理越来越受到关注,人们迫切需要海量数据背后的重要信息和知识,发现数据中潜在的联系并且发现可以有效运用的方式,取得对获取知识有用的信息,然后根据当前的信息对今后的发展趋势进行预测。目前最常用的评价方式就是运用C4.5算法,将日常的数据有效汇总,然后对客户的相关数据分析比对,根据客户之间不同的特征进行不同的改善方式,达到了提升满意度的效果。  相似文献   

5.
稳定客户和吸引客户是移动通信企业提高竞争力的关键.基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%.决策树体现的规则与经验基本一致,为移动通信企业建立客户流失的预警机制提供了决策支持.  相似文献   

6.
王俊  康磊  王武习 《福建电脑》2008,24(9):80-81
通过采用决策树模型C4.5算法,将国税系统中应用的综合征管软件等后台数据库的企业数据进行分析、挖掘,得出易走逮企业经营状况变化规律,便于税务部门集中精力严格监控,为今后的征管工作提供方向和指导。  相似文献   

7.
基于决策树的数据挖掘方法在CRM中的应用研究   总被引:5,自引:0,他引:5  
针对CRM中的市场客户分类问题,本文将决策树分类方法应用于CRM中,介绍应用C4.5决策树方法构造客户分类系统的开发实践,并给出该系统分析客户保持中的应用实例。  相似文献   

8.
针对水利普查数据量大、属性维度多等特点,论文通过探讨和分析Hadoop的组成和运行机制,提出了一种基于Hadoop云平台的水利普查数据挖掘系统,介绍了系统的设计思想及架构,详细阐述系统内各个模块的功能作用。该系统利用Hadoop云平台实现了一种改进后的并行关联规则算法,既充分利用了Hadoop平台并行处理数据的能力,又降低了开发所需的成本。通过进行单机对比测试和集群测试,证明了系统具有更好的可用性和较高的挖掘效率。  相似文献   

9.
介绍智能导学系统的特点,并对决策树C4.5算法的原理进行了阐述,通过C4.5构造了一个学生在线学习效果的评估模型.并利用该模型得到的分类规则进行预测,得到准确性评估表,从而验证决策树算法的灵活性和计算的高效性.  相似文献   

10.
决策树方法在煤炭物流客户分析中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
目前物流企业中积累了大量的客户历史数据,为了有效利用这些数据,使用数据挖掘方法对客户进行分类管理和服务是CRM中非常重要的一方面。而决策树是进行分类分析与数据挖掘的常用方法。研究了运用C4.5算法对煤炭物流客户信息构造决策树,并把提取到的规则应用到公路煤炭物流公司的客户关系管理中,结果证明具有较好的应用价值。  相似文献   

11.
n维的立方体将生成2n个聚集立方体.如何进行立方体计算,在存储空间和查询时间方面寻求平衡,成为多维分析应用中的关键问题.基于部分物化的策略,并结合水利普查数据特征,改进Minimal cubing方法,提出了层次维编码片段方法HDEF cubing.该方法利用编码长度较小的层次维编码及其前缀,快速检索出与查询关键字相匹配的层次维编码,减少了多表连接操作,从而提高查询效率.以水利普查数据为例,验证了改进的立方体计算方法能高效地对立方体进行存储和查询,适用于水利普查成果分析.  相似文献   

12.
民机设备系统每天都在产生大量的质量数据信息。随着时间的推移及数据量的积累,传统离散制造业的数据统计分析已经无法对这些庞大的质量数据进行有效地处理分析。为了解决这一问题,并挖掘出数据之间的隐含规律,提出了一种有效的数据挖掘方法。该方法通过集成决策树C4.5并行算法完成质量数据分析。分析结果展示了该分析方法的正确性、有效性和价值性。  相似文献   

13.
条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时重新定义条件函数依赖,改进发现条件函数依赖的算法(即CTANE算法);以水库工程数据为例,验证本文改进的算法能准确高效地发现水利普查数据中的条件函数依赖,为检测数据一致性做好准备。  相似文献   

14.
基于云计算的Web数据挖掘   总被引:3,自引:0,他引:3  
因特网是一个巨大的、分布广泛的信息服务中心,其上产生的海量数据通常是地理上分布、异构、动态的,复杂性也越来越高,若用已有的集中式数据挖掘方法则不能满足应用的要求。为了解决这些问题,提出了一种基于云计算的Web数据挖掘方法:将海量数据和挖掘任务分解到多台服务器上并行处理。采用Hadoop开源平台,建立一个基于Apriori算法的并行关联规则挖掘算法来验证了该系统的高效性。还提出计算向存储迁移的设计思想,将计算在数据存储节点就地执行,从而避免了大量数据在网络上的传递,不会占用大量带宽。  相似文献   

15.
16.
针对水利普查数据海量、多维的特点,研究近年来在“大数据”概念下发展迅速的Hadoop与Hive,结合传统数据仓库在多维数据分析方面的成熟技术,提出基于Hive的水利普查数据仓库的构建方法,描述数据仓库系统的架构,并根据Hive的设计特点,通过分桶、消减维度表和冗余事实表的方法来改进传统的多维分析模型,最后搭建集群系统对水利普查数据集进行查询与分析测试。测试结果表明该数据仓库可以满足海量多维水利普查数据的存储与查询要求。   相似文献   

17.
文章在介绍Oracle数据库服务及相关体系软件结构的基础上,给出了利用Oracle数据仓库建立水利普查数据展现系统的实现技术,解决了因为原始数据库数据量庞大,数据关系复杂,导致数据查询速度慢等性能问题,并从多方面清晰、简洁、直观地展现水利普查数据.  相似文献   

18.
数据挖掘中聚类方法比较研究   总被引:4,自引:0,他引:4  
王鑫  王洪国  王珺  王金枝 《微机发展》2006,16(10):20-22
数据挖掘是近年来信息产业界非常热门的研究方向,聚类分析是数据挖掘中的核心技术。聚类算法已被广泛深入地研究,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户。为了更好地使用这些算法,文中对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。  相似文献   

19.
水利普查数据更新维护是全国水利普查成果长期有效应用的重要支撑和保障。第一次全国水利普查后,数据更新是否及时,质量能否保障,共享能否畅通,以及现有数据能否满足需求等问题将是影响普查成果在水利信息系统应用的重要制约因素。针对这些问题,着眼于构建"统一化、专业化、标准化"的水利数据中心,形成一体化的国家基础水信息平台为总体目标,提出数据更新维护应遵循的多样性、适用性、规范性、协同性、同步性等5项原则,重点研究数据更新维护实施的技术手段及路径,并初步探讨相关标准、管理制度及工作流程,以建立数据更新维护过程的长效机制,确保水利数据资源得到充分利用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号