首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 318 毫秒
1.
提出了基于数据抽取器的知识发现模型。在模型中,将知识发现过程分成数据预处理、数据抽取、数据挖掘和结果分析四个阶段。该模型利用标准的SQL语言构造数据抽取器,为不同的学习算法准备数据,减少数据挖掘算法对数据库直接调用的次数,避免了直接对大型数据库的数据进行调用,使得对大型数据库进行快速数据挖掘成为可能。可以加快知识发现过程,提高数据挖掘效率,实现对于大型数据库的知识发现。最后设计了SQL-C4.5算法,该算法实现了利用数据抽取器为决策树算法C4.5抽取必要的统计数据,实现了C4.5决策树的构建。  相似文献   

2.
纳税信用等级评定的实现是需要对大量税收数据进行分析和判定的结果,决策树是进行数据挖掘和分类的常用工具,其中以C4.5算法最为流行。如何应用数据挖掘技术改变纳税信用等级手工评定的现状是当前税务系统税收信息化工作难点之一。文章主要讨论如何应用C4.5算法构造纳税信用等级评定决策树,通过对纳税人涉税数据的采集、预处理、属性选择、决策树生成和剪枝等一系列过程最终生成纳税信用等级评定决策树,并根据生成的决策树实现对纳税人纳税信用等级的判决。  相似文献   

3.
C4.5算法在列车轨道故障检测上的应用研究   总被引:1,自引:0,他引:1  
列车轨道故障检测的实现需要对大量的数据进行分析来判定检测结果,决策树是进行数据挖掘与分类分析的常用工具。文中主要讨论如何应用C4.5算法构造列车轨道故障检测的决策树以及根据生成的决策树实现轨道故障的判决。  相似文献   

4.
基于SQL Server 2000下数据挖掘算法的研究   总被引:1,自引:0,他引:1  
微软的SQL Server2000是当今最流行的数据库管理软件之一,研究了在SQL Server 2000上数据挖掘实现方面的决策树算法.决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识.SQL Server 2000/Analysis Service两层结构决策树,采用了以类记数表及深度优先策略生成,在建树算法和数据库间设立数据挖掘中间件.并讨论了通过使用像SQL Server 2000 Analysis Service这样的典型工具来如何实现数据挖掘模型的创建,且为商业组织的决定挖掘出必要的数据.  相似文献   

5.
阐述了饰品企业营销的现状,提出了将数据挖掘技术应用到饰品营销中的方案.在分析决策树算法的基础上,介绍了决策树算法及决策树的构造,并使用该算法对企业客户进行分类及对新客户类型预测,实现对商业数据中隐藏信息的挖掘,且对该挖掘模型进行了验证.  相似文献   

6.
决策树算法及其常见问题的解决   总被引:16,自引:0,他引:16  
决策树这种数据挖掘技术是目前最有影响和使用最多的数据挖掘技术之一,生成决策树的算法也比较多,但是在这些生成决策树的算法中都需要解决两个问题——数据过分近似和测试属性的选择。  相似文献   

7.
针对PHM(Prognostic and Health Management)中数据挖掘和知识获取困难的问题,提出一种以J48决策树算法为基础的故障诊断方法。采用了开源数据挖掘软件Weka,对CTSV滤波器故障仿真数据进行计算,对故障数据进行属性清理和参数选择。生成的决策树模型有很高的交叉验证率和分类效果。  相似文献   

8.
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。  相似文献   

9.
针对大数据背景下教育数据挖掘已成为改善教育质量重要手段的现状,提出使用CART决策树算法对计算机网络课程的数据进行分析和研究,生成基于CART树的学生成绩分类模型,最后分析结果并提出有针对性的合理教学建议。  相似文献   

10.
列车轨道故障检测的实现需要对大量的数据进行分析来判定检测结果,决策树是进行数据挖掘与分类分析的常用工具。文中主要讨论如何应用C4.5算法构造列车轨道故障检测的决策树以及根据生成的决策树实现轨道故障的判决。  相似文献   

11.
决策树算法在天气评估中的应用   总被引:1,自引:0,他引:1  
巩固  张虹 《微计算机信息》2007,23(34):245-247
分类算法是数据挖掘中的一个最重要技术.本文分析了决策树分类算法中的ID3算法和C4.5算法.利用它们建立天气评估的决策树模型.研究了该决策树模型在天气评估中的应用,分析了决策树算法应用于数据分类和知识发现的过程和特点.同时文章中也指出了分类算法的不足之处和待解决的问题。  相似文献   

12.
基于电信运营中大客户流失的数据挖掘模型   总被引:3,自引:0,他引:3  
文章描述了数据挖掘的理论和方法在电信运营行业的实际应用,从一个大客户流失的主题出发,给出了一个完整的数据挖掘实现模型,详细描述了数据挖掘的各个过程,重点描述了决策树挖掘算法,从中可归纳出电信行业如何使用数据挖掘方法来实现经营分析。此模型已经在实际中使用,效果良好。  相似文献   

13.
针对故障知识获取这一瓶颈难题,对基于数据挖掘的数据库技术去实现故障知识规则自动发现的方法进行了研究;在SQLSERVER 2005平台上,利用该平台提供的数据挖掘决策树算法,采用了将决策树算法与数据库系统的性能进行高效耦合的数据处理模式,建立了一种利用故障数据集自动获取故障知识规则的数据处理流程;最后利用转子故障实验获得的故障特征数据集进行的验证表明,该流程具有通过对故障数据集进行实时处理,自动建立起一种描述故障知识的决策树模型,并且通过对决策树枝进行结构元素的描述,可自动生成故障知识规则集合的功能;结果表明,SQL SERVER 2005数据挖掘平台提供的决策树算法,为基于故障数据资源的驱动挖掘出故障知识提供了一种新途径。  相似文献   

14.
数据仓库与数据挖掘技术的研究与应用   总被引:4,自引:0,他引:4  
讨论了数据仓库的构建方法和数据挖掘技术的应用,介绍了使用分析服务器构建数据仓库及进行联机分析的方法,实现了一个利用决策树算法建立模型对顾客的信誉度进行分类的实例。  相似文献   

15.
决策树算法的研究与应用   总被引:4,自引:1,他引:3  
主要研究了数据挖掘中决策树算法的基本思想和算法。针对目前钻井过程故障诊断的需求,结合决策树算法的特点,提出了一种基于决策树的钻井过程故障诊断专家系统模型。分析了钻井系统事故状态下的相关特征参数,并对基于决策树的钻井过程状态和知识获取进行了详细的论述。通过实例运用ID3算法实现了决策树的建立,为钻井过程故障诊断奠定了坚实的基础。最后提出了对算法的改进,综合对实际数据的处理结果表明,基于数据挖掘的决策树算法可以很好地识别钻井过程中的不同状态,能够实现故障诊断。  相似文献   

16.
杨静  张楠男  李建  刘延明  梁美红 《微机发展》2010,(2):114-116,120
主要研究了数据挖掘中决策树算法的基本思想和算法。针对目前钻井过程故障诊断的需求,结合决策树算法的特点,提出了一种基于决策树的钻井过程故障诊断专家系统模型。分析了钻井系统事故状态下的相关特征参数,并对基于决策树的钻井过程状态和知识获取进行了详细的论述。通过实例运用ID3算法实现了决策树的建立,为钻井过程故障诊断奠定了坚实的基础。最后提出了对算法的改进,综合对实际数据的处理结果表明,基于数据挖掘的决策树算法可以很好地识别钻井过程中的不同状态,能够实现故障诊断。  相似文献   

17.
针对寿险市场的现状,特点,利用数据挖掘技术中的决策树算法,通过决策树ID3算法中的信息增益确定属性,生成决策树;分析客户数据,在节点记录符合条件的统计数据,分析四个要素之间关系对客户保险意识影响的比重,实现对客户数据的最大挖掘。  相似文献   

18.
数据仓库与数据挖掘技术的研究与应用   总被引:4,自引:0,他引:4  
讨论了数据仓库的构建方法和数据挖掘技术的应用,介绍了使用分析服务器构建数据仓库及进行联机分析的方法,实现了一个利用决策树算法建立模型对顾客的信誉度进行分类的实例.  相似文献   

19.
将数据挖掘集成到关系数据库中,可以使数据挖掘技术直接利用关系数据库中的数据生成挖掘模型.以决策树技术为研究实例,通过把决策树算法重新设计为基于SQL的汇总和查询分析操作,提出一种新的基于SQL的决策树算法.同时,通过理论分析表明,在L/O性能方面,文中算法比SPRINT算法要好.  相似文献   

20.
马菁  顾景文 《微机发展》2008,18(2):66-69
在软件测试中,测试用例生成是其关键环节,也对软件测试的自动化有着重要影响。为了提高测斌用例生成的效率,提高其自动化的程度,从不同角度对软件测试用例选择策略进行介绍。决策树是数据挖掘领域中一种重要的数据分类技术.在现有的一些功能测试用例生成方法基础上提出了一种基于决策树算法的测试用例生成方法,并对其中一些关键问题进行了初步的探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号