首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
粒计算理论及其应用   总被引:1,自引:0,他引:1  
粒计算是一种新的软计算方法。文章首先介绍了粒计算产生的背景,然后在软计算概念的基础上介绍了粒计算的思想、概念、研究内容及其数学描述,并叙述了粒计算的应用领域。粒计算对人类求解复杂问题非常重要,将对人工智能系统的设计和实施有显著的影响。  相似文献   

2.
粒及粒计算在逻辑推理中的应用   总被引:26,自引:0,他引:26  
讨论了信息粒的结构及其实例。基于Rough集方法定义了决策规则粒,构造了决策规则粒库,它被用作逻辑推理。定义了粒语言,描述了这种语言的语法、语义、粒语句的运算法则和粒之相关的几个性质。定义了粒之间的相互包含(inclusion)和相似(closeness)。基于这些概念,构造了一种逻辑推理的新模型。这种推理模式的特点在于它既是逻辑的又是集合论的。所谓逻辑的就是说推理是遵循一种逻辑运算;所谓集合论的是指这种推理可利用对应于这种逻辑公式的意义集的运算进行推理,还用实例说明了这种推理模式是可行和有效的。  相似文献   

3.
针对当前基于信息增益和粗集属性约简作为属性选择标准建树算法存在的不足,以粒划分方法为理论基础,将属性按其取值划分为若干属性粒,提出以属性粒的长度量和其所对应决策属性的粒类别个数作为确定分裂属性的基本参数,自顶向下逐级构造决策树,不涉及信息增益、等价类和属性约简等复杂运算的中间过程.该算法的优点在于不仅考虑本层结点的划分而且预测下层结点的走向,具有较高的精准度,而且解决了当前建树算法不具有普遍适应的难题.  相似文献   

4.
基于信息增益法的决策树构造方法   总被引:7,自引:1,他引:6  
决策树数据挖掘技术是目前最有影响和使用最多的一种数据挖掘技术。决策树构造的方法很多,本文提出一种基于信息增益法的决策树构造方法。给出了相应的决策树构造算法,并通过一个实例对其进行了说明。最后,本文对噪声问题、子树复制和碎叶等问题提出了解决思路。  相似文献   

5.
杨烽 《计算机科学》2018,45(Z11):445-452
在数据挖掘领域,基于符号型数据分组的数据预处理是一个极富挑战性的问题,它给人们提供了一种更加简化的数据表现形式。在已往的研究中,相关学者提出了许多解决方案,例如,运用粗糙集的方法来解决这一问题。文中提出了一种基于粒计算的符号型数据分组算法,主要分为粒度生成和粒度选择两个阶段。在粒度生成阶段,对于每一条属性,以对应属性值的聚类为叶子节点,自底向上以二进制树的形式构建粒层,形成属性树森林。在粒度选择阶段,以信息增益为基础,对每棵树进行全局考虑,选取最优的粒层,选层结果就是符号型数据的分组结果。实验结果表明,本算法呈现出比已有算法更加平衡的层次结构和更加优秀的压缩效率,具有较好的应用价值。  相似文献   

6.
先给出了决策树挖掘算法和算法的改进思路,进而结合CRM的实例,详细分析了决策树构建过程和采用的处理措施,提出了将决策树挖掘用于CRM的思路,选择决策树构建评价指标的方法。通过实验进行验证,结果表明该方法是可行和有效的,为商家提供了一种新的分析思路。  相似文献   

7.
基于决策树的医疗数据分析   总被引:10,自引:0,他引:10  
刘昆  刘业政 《计算机工程》2002,28(2):41-43,78
介绍了决策树的概念和生成过程,仔细研究了决策树的几种技术,并将它们集成到作者的决策树分析系统中,在分析了医疗数据之内后,提出了今后决策树研究的一个重要方向。  相似文献   

8.
养殖业目前是农村收入主力增长点,本文主要通过对养殖业中的一种-生猪收益因素进行分析,采用决策树中经典算法,ID3算法生成决策树,对下一年养殖收益的情况进行预测,给予指导,并提供有效的建议.  相似文献   

9.
基于分形维的决策树构建及应用研究   总被引:1,自引:0,他引:1  
针对决策树构建过程中易于出现数据碎片、子树重复等问题,提出了基于分形维构建特征数据集的方法:因为信息增益表示了该属性信息量的多少,因此在确定了数据集的嵌入维数k之后,选择信息增益最大的前k个属性构造原数据集的特征数据集,并分析了依据分形维数和信息增益对冗余属性的删除以及特征集的信息损失对决策树构建的影响。实验过程中,分别采用从原始属性中选择及拟合两种方法构建特征数据集,依据对实验结果的比较分析,进一步证明了该方法的有效。  相似文献   

10.
针对公路快递企业中业务数据利用率低、提取决策信息困难等问题,本文在ID3算法的基础上引入了数据集分割技术,形成一种基于数据集分割的决策树算法,该算法突破了内存的限制,可以处理大规模数据,且提高了执行效率。并通过在公路快速业务系统中的实际应用,验证了算法良好的适应性和可扩展性。  相似文献   

11.
传统的规则挖掘算法通常先约简属性再约简属性值. 该方法存在冗余计算, 当样本集增大时, 复杂性急剧增加. 对此提出一种基于粒计算的最简决策规则挖掘算法. 首先, 在不同粒度空间下计算条件粒与决策粒之间的粒关系矩阵; 然后, 将粒关系矩阵中隐含的信息H 1、H 2 作为启发式算子, 按信息粒约简属性值; 最后, 去除冗余属性并设置终止条件, 实现决策规则的快速挖掘. 理论分析和实验结果表明, 所提出的算法可以获得更简洁的规则, 且规则的泛化能力更强.  相似文献   

12.
基于遗传算法的多属性模糊决策树的优化   总被引:1,自引:0,他引:1       下载免费PDF全文
决策树是数据挖掘中的一种高效方法,但是当训练数据的属性很多时,构建的决策树的规模会随属性个数增加而指数级增长,进而会产生海量的规则。针对该问题,提出了一种基于遗传算法的优化方法。首先根据信息增益利用轮盘赌方法选取若干组属性,构建多棵决策树,然后利用遗传算法对多棵决策树进行组合,并最终形成规则集。最后给出了实验结果,证明了该方法的可行性和有效性。  相似文献   

13.
粒计算中决策规则的提取   总被引:1,自引:1,他引:0       下载免费PDF全文
为从决策表中获取最简决策规则,在研究粒计算理论的基础上,提出了一种基于粒计算的决策规则提取算法。该算法通过引入λ阶粒库的概念,利用粒计算的方法对由同一决策表所生成的粒库,从不同的角度和多个层次进行研究,尝试从较低阶的粒库中提取出尽可能多的具有一定规则覆盖度与置信度的简洁规则。最后通过实例验证了该算法的有效性。  相似文献   

14.
基于MapReduce的决策树算法并行化   总被引:1,自引:0,他引:1  
陆秋  程小辉 《计算机应用》2012,32(9):2463-2465
针对传统决策树算法不能解决海量数据挖掘以及ID3算法的多值偏向问题,设计和实现了一种基于MapReduce架构的并行决策树分类算法。该算法采用属性相似度作为测试属性的选择标准来避免ID3算法的多值偏向问题,采用MapReduce模型来解决海量数据挖掘问题。在用普通PC搭建的Hadoop集群的实验结果表明:基于MapReduce的决策树算法可以处理大规模数据的分类问题,具有较好的可扩展性,在保证分类正确率的情况下能获得接近线性的加速比。  相似文献   

15.
针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出了一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化。首先,基于Bagging技术对C4.5算法进行了改进,通过有放回采样得到多个与初始训练集大小相等的新训练集,并在每个训练集上进行训练,得到多个分类器,再根据多数投票规则集成训练结果得到最终的分类器;然后,基于MapReduce模型对改进算法进行了并行化,能够并行化处理训练集、并行选择最佳分割属性和最佳分割点,以及并行生成子节点,实现了基于MapReduce Job工作流的并行决策树改进算法,提高了对大数据集的分析能力。实验结果表明,并行Bagging决策树改进算法具有较高的准确度与敏感度,以及较好的伸缩性和加速比。  相似文献   

16.
通过分析ID3算法的基本原理及其多值偏向问题,提出了一种基于相关系数的决策树优化算法。首先通过引进相关系数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化。通过具体数据的实例验证,说明优化后的ID3算法能够解决多值偏向问题。标准数据集UCI上的实验结果表明,在构建决策树的过程中,既提高了平均分类准确率,又降低了构建决策树的复杂度,从而还缩短了决策树的生成时间,当数据集中的样本数较大时,优化后的ID3算法的效率得到了明显的提高。  相似文献   

17.
为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想。Map函数部分的主要任务是计算每个数据对象到簇类中心点的距离并(重新)分配其所属的聚类簇;Reduce函数部分的主要任务是根据Map部分得到的中间结果,计算出新簇类的中心点,然后作为中心点集给下一次MapReduce过程使用。实验结果表明:运行在Hadoop集群上的基于MapReduce的K-Medoids并行化算法具有较好的聚类结果和可扩展性,对于较大的数据集,该算法得到的加速比更接近于线性。  相似文献   

18.
多尺度科学在数据挖掘领域的研究多见于图像和空间数据挖掘,对一般数据的多尺度特性研究较少。传统聚类算法只在单一尺度上进行,无法充分挖掘蕴藏在数据中的知识。引入粒计算思想,进行普适的多尺度聚类方法研究,对数据进行多层次、多角度分析,实现一次挖掘,多次应用。首先,介绍粒计算相关知识;然后,提出多尺度聚类尺度上推算法UAMC(Upscaling Algorithm of Multi-scale Clustering),以簇为粒子,簇心为粒子特征进行尺度转换,利用斑块模型得到大尺度知识,避免二次挖掘带来的资源浪费;最后,利用UCI公用数据集和H省全员人口真实数据集对算法性能进行实验验证,结果表明算法在准确性上优于K-Means等基准算法,是有效可行的。  相似文献   

19.
为基于已有的病例数据向医生或院方提供有效的决策支持,以肝功能检测数据为例,针对这些数据的不完备性、海量性以及数据的高维和低维并存等特性,提出了基于并行粒度进化计算的数据分析模型。该模型是群(粒)进化和超群进化的有机统一,具有良好的并行性。这为下一步数据分析系统的全面实现奠定了良好的理论基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号