首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
计算机及通信网络的快速发展,对数据挖掘算法的分布化提出了要求.介绍分布式数据挖掘的结构,然后重点针对分类知识的挖掘,探讨目前分布式环境下主要的分类挖掘算法.  相似文献   

2.
分布式环境下挖掘约束性关联规则的算法研究   总被引:2,自引:0,他引:2  
关联规则是数据挖掘的重要研究内容。基于约束的关联规则挖掘可以促进交互式探查与分析。该文主要研究了分布式环境中挖掘约束性关联规则的问题。在并行关联规则挖掘算法CD和约束性关联规则挖掘算法Direct的基础上,提出了一种新的分布式挖掘约束性关联规则算法DMA_IC。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。同时,文章还对DMA_IC算法的通信性能进行了讨论。  相似文献   

3.
Web Service架构下的分布式关联规则挖掘研究   总被引:1,自引:2,他引:1  
随着信息技术的不断发展,大量的分布系统和跨平台系统不断涌现,同时也给数据挖掘带来了一定难度.针对分布的、异构的应用环境,提出了一个基于Web Service架构的数据挖掘框架.该框架能极大地实现分布异构环境下的数据挖掘.在此框架基础上设计了一个改进的PF增长算法,算法主要针对分布异构环境下的关联规则挖掘并具有较高的效率,同时也证实了框架的可行性.  相似文献   

4.
为克服传统会员制营销的固有缺陷,将商务智能中的常规决策树挖掘算法进行改进,用于会员信息的挖掘和会员行为的预测,使会员营销具有智能特点,并对智能型会员营销的过程进行建模,最后利用微软商务智能开发平台从技术上实现智能型会员营销.结果显示,智能型会员营销能充分利用会员基本信息和会员消费历史,挖掘会员的消费规律,预测会员的消费倾向;据此制订会员营销方案,可极大提高营销的针对性、降低促销成本、避免营销受众的反感.  相似文献   

5.
隐私保护的分布式决策树分类算法的研究*   总被引:1,自引:0,他引:1  
针对分布式决策树构造过程中的隐私保护问题,引入安全多方计算方法设计了可以保护隐私的分布式C4.5决策树分类算法。该算法适用于数据集垂直分布和水平分布两种情况,同时提出了一种新的隐私保护程度的度量方法。实验结果证明设计的隐私保护分布式决策树分类算法不仅很好地保护了原始数据不泄露,同时保持了较高的分类精度。  相似文献   

6.
《软件工程师》2017,(9):21-23
在弱关联冗余环境下,开展的挖掘算法应用需要考虑关联属性,本文主要从模糊神经元网络学习算法与弱关联规则模型,建立两方面内容展开探讨,整理出算法应用所产生的数据信息,对大数据环境挖掘算法进行深入研究,为网络环境性信息处理任务的高效开展,建立一个稳定基础环境。  相似文献   

7.
提出了一种新的面向分布式规则挖掘的数据取样技术(DOptiSim方法),它是在分析了分布式环境中移动Agent技术特点和研究了最优K相异性数据多样化代表性子集选择方法(OptiSim算法)及其扩展技术(EOptiSim算法)的基础上提出的.该方法不仅能克服基于集中处理的分布式数据挖掘方法的不足,还能完成各场地数据是互相关联和互相依赖的分布式数据挖掘任务.实验结果证实该方法是可行、有效的.  相似文献   

8.
吴微  朱玉全  程鹏  王恒 《微计算机信息》2008,24(15):309-311
针对医学图像数据过于复杂且分布存储的特点,提出并实现了一种基于SLIQ的分布式医学图像分类框架.该框架包括:表示层、处理层和挖掘层.其中,分布式协调器(DTC)是处理层的核心,通过分析以往算法的优缺点,建立一种分布式数据挖掘的计算框架,并给出相应的求解算法.挖掘层中的分类算法采用适合处理海量数据的SLIQ决策树方法.实验结果表明该分类系统是有效和可行的.  相似文献   

9.
由于网络协议、软硬件平台、开发语言等的不同,导致异构环境下的分布式开发代价高、困难多.本文介绍了一个通用可行、低费用的,基于CORBA分布式对象技术的开发方案 .该方案化解了CORBA技术规范庞大、复杂而带来的困难.文中介绍了该方案在分布式文件系统中文件分布式访问的应用.  相似文献   

10.
在分析典型的空间关联规则算法的基础上,针对规则冗余和挖掘伸缩性差的不足,提出基于元规则和FP增长树的空间关联规则挖掘算法,该算法不用产生候选集合,而使用最不频繁的项后缀,减少了扫描数据库的次数,大大降低了搜索开销;同时,元规则的约束,提供了好的选择性,减少了规则的冗余.本文最后以水土流失的空间要素的关联关系为例,验证算法的有效性,并与典型算法比较,本文提出的算法时间性能和空间伸缩性均优于典型算法.  相似文献   

11.
决策树算法的研究及优化   总被引:16,自引:3,他引:16  
决策树算法是数据挖掘中的一个比较活跃的研究领域,是对分类问题进行深入分析的一种方法,但构造最优决策树是一个NP困难问题。文中首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优化法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。通过实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。  相似文献   

12.
该文主要探讨了基于数据仓库的数据挖掘技术中分类算法的决策树算法的基础理论和实施方法,分析并改进了分类方法中决策树算法;并在决策树预剪枝算法中,利用父结点与当前结点信息嫡的比值来作为是否停止决策树扩张的评判标准。  相似文献   

13.
决策树算法研究综述   总被引:2,自引:0,他引:2  
简要回顾了数据挖掘的应用背景和常用的数据挖掘方法,重点研究了数据挖掘方法中的决策树算法,并对其主要成就进行评述.提出今后开展研究的建议:  相似文献   

14.
简要回顾了数据挖掘的应用背景和常用的数据挖掘方法,重点研究了数据挖掘方法中的决策树算法,并对其主要成就进行评述,提出今后开展研究的建议。  相似文献   

15.
杨静  张楠男  李建  刘延明  梁美红 《微机发展》2010,(2):114-116,120
主要研究了数据挖掘中决策树算法的基本思想和算法。针对目前钻井过程故障诊断的需求,结合决策树算法的特点,提出了一种基于决策树的钻井过程故障诊断专家系统模型。分析了钻井系统事故状态下的相关特征参数,并对基于决策树的钻井过程状态和知识获取进行了详细的论述。通过实例运用ID3算法实现了决策树的建立,为钻井过程故障诊断奠定了坚实的基础。最后提出了对算法的改进,综合对实际数据的处理结果表明,基于数据挖掘的决策树算法可以很好地识别钻井过程中的不同状态,能够实现故障诊断。  相似文献   

16.
决策树C4.5算法在数据挖掘中的分析及其应用   总被引:5,自引:0,他引:5  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。  相似文献   

17.
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。  相似文献   

18.
时念云  褚希  张金明 《微计算机应用》2007,28(12):1288-1291
提出了将概念树同决策树挖掘相结合的方法,解决传统决策树挖掘缺乏语义信息的问题。该方法能提高数据挖掘系统的知识表示能力,增强知识的共享性和重用性,在一定程度上改善决策树挖掘中记录重复或语义模糊等问题。  相似文献   

19.
决策树算法及其常见问题的解决   总被引:16,自引:0,他引:16  
决策树这种数据挖掘技术是目前最有影响和使用最多的数据挖掘技术之一,生成决策树的算法也比较多,但是在这些生成决策树的算法中都需要解决两个问题——数据过分近似和测试属性的选择。  相似文献   

20.
决策树分类算法的研究及其在教学评估中的应用   总被引:1,自引:0,他引:1  
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的方法,介绍了决策树建立的基本原理,提出一种基于概率统计知识来建立决策树的方法,实验证明该方法是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号