首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 333 毫秒
1.
医疗数据中知识发现的研究   总被引:1,自引:0,他引:1  
介绍了ID3决策树算法建立决策树的基本原理和改进方法,利用改进的决策树算法对心脏病医疗诊断数据进行数据挖掘·采用VisualC++6 0进行编程建树,得到了一些有实际参考价值的诊断规则,获得了较高的分类准确率,证明了决策树算法在智能医疗诊断数据挖掘领域有着广泛的应用前景·  相似文献   

2.
多层次规则挖掘的约略集方法   总被引:1,自引:0,他引:1  
约略集理论是一种能处理数据中不确定和噪音的有效数学工具,是数据挖掘的重要方法.结合数据分类层次,提出了利用约略集理论挖掘多层次规则的方法,挖掘过程包含约减的求解、等价类的构造、差别矩阵的建立、规则的挖掘4个阶段,并举例说明了多层次规则的挖掘过程.  相似文献   

3.
基于通用入侵检测轮廓,建立了一个基于数据挖掘技术的异常检测模型,采用关联规则、序列规则对数据进行挖掘,用判定树分类技术对获得的规则进行分类.实验表明,本模型具有较好的效益.  相似文献   

4.
开放式满汉辅助翻译系统的研究和实现   总被引:1,自引:1,他引:0  
为更好地利用清朝的满文文献开发了“计算机满汉辅助翻译系统”·系统建立了一种面向满文信息处理的满文编码体系,以及一套满文字模,实现了满汉辅助翻译中首先必须解决的满文输入法和满文的屏幕编辑系统·重点介绍了包括词典管理子系统、规则管理子系统在内的开放性知识体系的构造,以及一套既适合语言学家填写又利于机器使用的知识维护系统,提出了使用一种新的对象式规则描述语言形式,完成知识的表达、存储以及解释的机制,实现了满汉辅助翻译系统·  相似文献   

5.
探讨基于粗糙集的分类规则挖掘技术,提出一种融合不同数据源中的分类规则的方法.该方法能保证规则的完整性,即获得适用于全局的所有分类规则,并通过实验进行验证,结果表明该融合方法与直接在全局数据中挖掘分类规则的方法相比,具有运算量小、效率高的优势.针对大规模数据在分类求解中出现的过融合问题,应用剪枝策略进行实验,实验结果表明该剪枝策略正确可行,可以提高分类效果.  相似文献   

6.
图案协同设计的过程规则提取及数据存储方案   总被引:1,自引:0,他引:1  
智能图案的网络化设计,关键在于对协同设计过程的规则提取,以及对图案分类并进行网络化存储.针对这些要求,提出一种网络化智能图案协同设计框架,并给出一种协同设计过程规则提取方法及对设计产生的大量图案数据进行网络存储的方案.该设计过程规则提取方法和设计知识存储方案能够合理提取图案设计过程知识,同时在图案设计数据库增大时又能保证知识应用的检索效率.  相似文献   

7.
一种基于关联性度量的决策树分类方法   总被引:9,自引:2,他引:7  
在介绍了一些典型的决策树分类算法的基础上,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法,该算法集中了ID3、C45和MedGen等典型算法的思想,并进行了改进·在建立决策树过程中采用关联性度量的计算来确定划分条件属性的顺序,通过阈值设定和处理简化了决策树的剪枝和优化过程,准确性高,分类速度快·系统已在某大型企业质量控制中得到了应用,取得了一定的经济和社会效益·文章详述了算法的执行过程、应用于冶金企业中的实例以及正确性证明和时间复杂性分析·  相似文献   

8.
基于数据挖掘的网络数据库入侵检测系统   总被引:19,自引:0,他引:19  
提出一种基于数据挖掘的网络数据库入侵检测模型 (NDBIDS) ·讨论了NDBIDS的结构及各部件的功能·利用关联规则Apriori算法 ,对用户正常历史数据进行挖掘 ,并对产生的规则进行归并更新 ,通过训练学习生成异常检测模型 ,并利用此模型实现基于数据挖掘的异常检测·NDBIDS可以检测伪装攻击、合法用户的攻击和攻击企图三种类型的攻击 ,通过实验给出了相应攻击的检测率、假报警率、漏报率和检测正确率·本系统的建立不依赖于经验 ,具有较强的灵活性  相似文献   

9.
一种应用关联规则森林的改进贝叶斯分类算法   总被引:1,自引:0,他引:1  
针对朴素贝叶斯分类方法中属性值条件独立假设不适应实际情况的问题,提出了关联规则森林表示法及应用关联规则森林的改进贝叶斯分类算法(ABC算法).ABC算法利用关联规则挖掘得到满足条件的关联规则,并由此来构造关联规则森林,而规则森林中所有根节点的概率与所有适用的规则置信度连乘,就得到所有属性值的联合概率.应用UDI数据集对分类器进行了测试,分类结果表明,ABC算法的分类准确率明显高于朴素贝叶斯分类算法,平均提高5%,特别是对属性间有着较强依赖关系的数据集,其分类准确率提高了37%.  相似文献   

10.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

11.
基于粗集不相容系统的膨胀土分类规则提取   总被引:2,自引:0,他引:2  
分析膨胀土分类的粗糙性, 指出膨胀土分类是一个基于粗糙集的信息不相容决策系统. 针对常规方法容易引起规则失真的不足, 提出将贝叶斯理论和不相容系统决策挖掘相结合来提取膨胀土分类规则: 以膨胀土分类决策系统的可信度为先验概率, 膨胀土试验数据的支持度为后验概率, 计算膨胀土分类规则的条件概率;提取条件概率大于某一阈值的规则;通过逻辑合取与析取归并膨胀土分类规则. 实例计算和应用分析结果表明: 采用贝叶斯理论和基于粗糙集的不相容系统决策挖掘相结合的方法有利于基于粗糙集的不相容系统的数据挖掘, 而且为膨胀土分类规则的提取提供了一种切实可行的算法.  相似文献   

12.
针对数据挖掘中的文本分类问题,提出了一种基于遗传算法和信息熵的文本分类规则抽取算法Genet-ic-Miner(简称GM),该算法的目标是在数据集中发现分类规则。首先利用信息熵生成初始种群,然后利用优化的遗传算法抽取相应规则。采用六个标准的公共领域的数据集比较了GM与其它两个非常著名的同类算法Ant-Miner和CN2,实验结果表明,无论是预测准确性和规则的简单性,GM都明显优于Ant-Miner和CN2,并且该算法能大大提高对知识的理解力。  相似文献   

13.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

14.
近年来,数据流作为一种特殊的数据形态,广泛出现于金融、互联网、科学研究等各个领域,引起了数据挖掘界极大的兴趣。其数据量无穷,数据概念随时间变化,对问题要求快速响应等特点给研究工作带来了极大的挑战。该文聚焦于数据流分类问题,提出了一种基于演变的规则知识库的数据流分类模型:SCBA(streamclass ification based on assoc iation ru les)。该模型随着数据流的到达,从动态维护的规则知识库中挑选适应当前数据概念的规则,构建单个分类器。与目前流行的数据流分类模型相比,SCBA具有如下特点:与层次结构的决策树相比,分类器的更新更为灵活并易于实现;与倾向“平均”的组合分类器相比,单个的分类器有利于规避“小模式问题”,并能加快对数据流概念变化的调整速度和对应用的响应速度。  相似文献   

15.
基于人工鱼群算法的分类规则发现   总被引:3,自引:0,他引:3       下载免费PDF全文
人工鱼群算法(AFSA)是一种最新提出的新型仿生优化算法,具有良好的克服局部极值和获得全局极值的能力.利用鱼群算法进行分类规则挖掘,建立了相应的优化模型.通过对公用数据的实验和CN2算法的对比表明,本算法可得到预测准确率较高的分类规则,同时规则更为简单.  相似文献   

16.
介绍了粗糙集理论实现数据分类和规则推理的基本原理,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不相容规则的决策系统的多层次数据挖掘算法,应用一实际的例子说明如何在数据库中发现分类规则.  相似文献   

17.
改进的时态关联规则在入侵检测中的应用   总被引:1,自引:0,他引:1  
入侵检测系统的性能在很大程度上与它的检测规则有关,所以如何更快更有效地从网络数据中获取有效的检测规则对于一个IDS(入侵检测系统)来说就变得格外重要.本文在分析了传统关联规则算法缺点的基础上,对关联规则挖掘算法的优化策略和时态因素的分类处理重点进行了讨论.即在利用主属性约束最后规则的同时,提出了高频属性直接入选的策略.以更快地获取有效的入侵检测规则.实验测试结果表明,优化后的算法在挖掘速度和规则的检出率等性能上有较大提高,找到了一些原来被忽略的规则并剔除了一些不重要的规则,证明此优化算法是切实有效的.  相似文献   

18.
多粒度时间序列中模糊规则的提取   总被引:2,自引:0,他引:2  
介绍了一种从多粒度时间序列中提取模糊规则的数据挖掘方法,该方法在时间序列中引入多重时间粒度,以模糊规则的形式给出数据挖掘的结果,建立多粒度时间序列的数学模型,并对提取模糊规则中所涉及的一些基本概念作出定义,在此基础上,给出数据挖掘的具体算法,通过实验证明了该挖掘算法的有效性。  相似文献   

19.
基于免疫原理和Boosting机制,提出了一种模糊分类规则挖掘算法.该算法主要借鉴于自然免疫系统中的克隆选择原理,通过抗体种群的演化来优化模糊规则.模糊规则库通过增量的方式产生,算法每次运行得到一个规则.Boosting机制用于调整训练数据的权值,使得新生成规则集中于当前未被覆盖或误分类的数据实例.仿真实验表明,所提算法可根据规则的分类精度来调整训练数据的权值,促进了模糊规则之间的协作关系,避免了规则之间相互冲突,提高了系统的分类精度.  相似文献   

20.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号