首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 56 毫秒
1.
基于改进型FP-Tree的分布式关联分类算法   总被引:1,自引:0,他引:1  
传统的信息挖掘技术已经无法满足大数据环境下日益复杂的应用需求,而分布式数据挖掘技术是解决这个难题的一种手段,因此提出了基于改进型频繁模式树(FP-Tree)的分布式关联分类算法。首先,在各局部节点优化FP-Tree。生成局部条件模式树(CFP-Tree),再通过各节点间传送CFP-Tree构建全局CFP-Tree;其次,在挖掘全局CFP-Tree时通过计算显著度来获取初始的全局显著分类规则;最后,利用剪枝策略选取一个较小规则集来构造全局的关联分类器。实验结果表明该算法能够有效降低网络通信量,提高信息挖掘效率,同时保证剪枝的质量和规则的统计显著性,提高分类的精确性。  相似文献   

2.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

3.
为了解决分布式环境下挖掘全局序列模式常产生过多候选序列,加大网络通信代价问题,提出了一种基于分布式环境下的快速挖掘全局序列模式算法--DMGSP.该算法将分布式环境下的各站点得到的局部序列模式压缩到一种语法序列树上, 避免了重复的序列前缀传输. 采用合并树中结点序列规则和项序扩展策略,对非频繁序列进行剪枝,有效地约简了候选序列,减少了网络传输量,从而快速生成全局序列模式.算法分析和实验结果表明,在大数据集环境下的DMGSP算法性能优越,能够有效地挖掘全局序列模式.  相似文献   

4.
借助数据挖掘方法在图像中的应用,提出一种利用图像降阶结合Apriori算法对医学图像纹理特征进行挖掘的模型.将医院信息系统(HIS)中病患特征与病患的医学图像纹理特征相融合,通过剪枝技术建立关联规则库,采用规则库中的规则对医学图像进行信息挖掘.实验结果表明,依靠该方法挖掘的关联规则能够很好地表达纹理,并对医疗辅助诊断起到一定的帮助.  相似文献   

5.
在AFS(axiomatic fuzzy set)理论框架下,提出了一种基于模糊概念相似性与模糊熵度量的分类算法.模糊分类规则的前件通过概念聚合得到,一种基于模糊概念相似性与模糊熵度量的概念选择函数指导聚合过程;然后,利用剪枝算法对得到的模糊规则集进行剪枝,得到最终的分类规则集.用8组来自UCI数据库的数据集作为实验数据对算法进行验证,并与7种经典分类方法进行比较.实验结果表明该算法能得到较高的分类精度,分类结果明显优于参照的分类方法.  相似文献   

6.
基于蚁群优化的分类规则挖掘方法   总被引:1,自引:0,他引:1  
蚁群优化是人工智能领域中群体智能分支之一,已成功地应用于复杂优化问题的求解,但其在知识发现领域的应用还是一个新的研究课题。在此提出一种新的基于蚁群优化的分类规则挖掘方法,先利用蚁群算法通过对属性约简简化数据集,再使用蚁群算法进行分类规则的挖掘,并用新的规则剪枝方法,提高了分类算法的效率和准确率。实验表明该方法是有效的。  相似文献   

7.
分类规则挖掘的免疫算法   总被引:4,自引:0,他引:4  
为了高效地从数据库中挖掘分类规则,提出了一种基于免疫算法的分类算法.该算法的核心思想为:对规则的前件进行固定长度编码,适应度函数的计算由分类规则的较小分类错误率、简洁性、一致性和训练实例的覆盖性构成,通过把适应度最小的个体作为先验知识来修改个体的某些分量的方法进行疫苗接种,并通过检测个体是否出现退化和模拟退火来实现免疫选择,同时还采用了基于信息增益的规则剪枝策略.在美国加州大学标准数据集中的5个数据集上将该算法与RISE和OCEC算法进行了实验比较,结果表明该算法不仅具有更快的收敛速度,而且获得了更高的预测准确率及更小的规则集。  相似文献   

8.
一种基于多概念格的分类规则融合方法   总被引:1,自引:0,他引:1  
从多个数据源进行综合知识发现已经成为当前数据挖掘领域中的一个热点研究问题。然而,由于各数据源中数据的差异,使得从各数据源上提取出来的知识,在相互融合的时候会显示出各自的局部性,有时甚至彼此间会出现矛盾,因此,有效的知识融合方法对挖掘结果的质量是至关重要的。该文探讨了基于多概念格的分类规则挖掘,提出了一种融合不同数据源中的分类规则的方法,该方法能保证规则的完整性,即获得适用于全局的所有分类规则,给出了实验结果并加以验证。  相似文献   

9.
傅玥 《科技信息》2013,(22):53-54
为了进一步提高基于数据挖掘的客户关系管理系统的决策能力,本文提出了多决策树的加权平均融合模型MDWAF,其基本思想是在客户数据集上用决策树进行挖掘,形成剪枝程度不同的子决策树,然后用加权平均法将多棵子决策树对客户数据的分类结果进行融合形成最优判断。采用German数据集,实验结果表明,该方法可以得到较好的分类效果,从而提高企业的营销精度和企业效益。  相似文献   

10.
该文提出一种动态剪枝的协同稀疏表示方法,通过建立2种不同的训练样本筛选策略,再融合2种策略的优点及结合TPTSR框架进行图像识别,以求获得更好的分类效果.在带噪声的人脸数据集上进行对比实验,结果表明:该方法可以在人脸受到遮挡和光照变化的影响下达到更高的识别率,并具有较强的鲁棒性.  相似文献   

11.
基于粗集不相容系统的膨胀土分类规则提取   总被引:2,自引:0,他引:2  
分析膨胀土分类的粗糙性, 指出膨胀土分类是一个基于粗糙集的信息不相容决策系统. 针对常规方法容易引起规则失真的不足, 提出将贝叶斯理论和不相容系统决策挖掘相结合来提取膨胀土分类规则: 以膨胀土分类决策系统的可信度为先验概率, 膨胀土试验数据的支持度为后验概率, 计算膨胀土分类规则的条件概率;提取条件概率大于某一阈值的规则;通过逻辑合取与析取归并膨胀土分类规则. 实例计算和应用分析结果表明: 采用贝叶斯理论和基于粗糙集的不相容系统决策挖掘相结合的方法有利于基于粗糙集的不相容系统的数据挖掘, 而且为膨胀土分类规则的提取提供了一种切实可行的算法.  相似文献   

12.
为了提高决策系统的分类质量,探讨了一种在数据仓库中基于粗糙逼近近似度量的挖掘分类规则策略.首先介绍了数据集中挖掘分类规则的基本原理,并利用粗糙集理论中粗糙逼近近似度量概念,根据决策表条件属性重要性度量及条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,最后举例说明了如何在数据库中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

13.
0 IntroductionDiantga .cl Dasesciifsiicoanti otrneies r aengr ie smspioornta,n Bta yperosibalnem claisnsi dfiactaati omnin&-Bayesian network, decision tree[1], neural network andSVM[2 ,3]are the technologies of data classificationin commonnow. They have extensively appliedin machine learning,ex-pert systemandstatistics etc .Inthese methods ,the most tra-ditional method is C4 .5[1]based on information entropy,which had extensively applied in practical problems . But themain problemof this me…  相似文献   

14.
粗糙集作为数据挖掘工具,主要通过分类数据得到预测型知识,但分类规则过于严格,使得在挖掘带噪音的数据时,挖掘结果可能会损失一些有价值的规则.提出一种带不确定因子的信息系统及相应的分类方法,改进了传统粗糙集的分类方法.  相似文献   

15.
数据分类的方法直接影响着分类效果。用粗糙集理论中的区分矩阵和区分函数进行的属性约简可以很好地用于数据分类当中,基于此,提出一种数据分类方法,即用区分矩阵和区分函数约简掉信息系统中的冗余属性,得到必要的属性集;然后再约简掉每一条规则中的冗余属性值,提取出决策规则,最后按照决策规则进行分类。实验证明,用该方法实现的数据分类复杂馋低,且能有效提高分类效果。  相似文献   

16.
基于粒子群优化算法的模式分类规则获取   总被引:8,自引:0,他引:8  
提出了基于粒子群优化的规则提取算法.该算法将规则编码为粒子,通过粒子群优化算法的速度-位移搜索模型以及粒子保存的记忆信息指导生成模式分类规则集.算法用于Iris数据集模式分类规则的提取.与其他规则提取方法比较,该算法在提高分类规则正确率的同时减少了计算费用.  相似文献   

17.
目的为解决SVM分类器的分类模式难以为人类专家所理解等问题而提出一种有关InterRBF算法的新思路。方法通过将RBF核函数将其展开成麦克劳林级数,并从展开式中挖掘对分类分析起重要作用的关联规则,从而在SVM的分类模式中学习出关联规则分类器。结果改进后的SVM分类器具有较好的分类准确度;改变了当前研究从SVM的分类模式中抽取规则的方法仅限于IF-TEHN规则或者学习出决策树的状况。结论从RBF核函数抽取关联分类规则,对于在难以理解的知识中提取可理解的表达规则是可行的方法。  相似文献   

18.
动态环境下数据流容易出现概念漂移现象。随着数据的逐渐到达,隐含在数据中的知识在一定程度上会出现改变,当前数据分类方法无法进行动态更新,不适于动态环境下数据的分类。为此,提出一种新的基于微粒群优化算法的数据分类方法,通过K-means方法对动态环境下的数据进行分类。介绍了微粒群优化算法,将所有个体看作d维搜索空间中没有体积的微粒,在搜索空间中以某一速度飞行,该速度可通过其自身及相邻微粒的飞行经验进行动态调整。通过某种规则对新微粒的局部最优值进行更新,利用优化后的微粒群算法实现数据分类。实验结果表明,所提方法分类性能优,实时准确率高。  相似文献   

19.
基于人工鱼群算法的分类规则发现   总被引:3,自引:0,他引:3       下载免费PDF全文
人工鱼群算法(AFSA)是一种最新提出的新型仿生优化算法,具有良好的克服局部极值和获得全局极值的能力.利用鱼群算法进行分类规则挖掘,建立了相应的优化模型.通过对公用数据的实验和CN2算法的对比表明,本算法可得到预测准确率较高的分类规则,同时规则更为简单.  相似文献   

20.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号