首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
探讨基于粗糙集的分类规则挖掘技术,提出一种融合不同数据源中的分类规则的方法.该方法能保证规则的完整性,即获得适用于全局的所有分类规则,并通过实验进行验证,结果表明该融合方法与直接在全局数据中挖掘分类规则的方法相比,具有运算量小、效率高的优势.针对大规模数据在分类求解中出现的过融合问题,应用剪枝策略进行实验,实验结果表明该剪枝策略正确可行,可以提高分类效果.  相似文献   

2.
多数据源高投票决策规则挖掘是指从多数据源中挖掘存在大部分数据源且具有重要意义的决策规则,此类规则在银行理财产品营销、市场营销、疾病诊断等领域中具有指导性作用.利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆盖度、投票数等多种决策规则的度量指标,用以挖掘满足这些度量指标的高投票决策规则.实验结果验证了所提算法挖掘多源决策信息系统中的高投票决策规则挖掘的有效性.  相似文献   

3.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

4.
随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅助生产或运营中的管理决策行为,以提高决策水平及决策收益。然而,受到普遍存在的异构性、私有性和平台兼容性等限制,兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等),互联于网络的数据源难于进行集中式挖掘,分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑战。根据文中给出的DDM高层架构,最终结果的质量与局部数据源的类型、可用性、局部结果的质量及整合方法等密切相关。DDM的实施未必都以站点间纯粹独立挖掘的方式进行,此外,对于数据集中,系统分布式站点多的情况,也可采用DDM。当前,DDM研究领域的挑战主要有:异构与同构挖掘、动态环境下的数据多变性、通信开销、知识整合和语义异构等。当前的DDM系统被分为4类:1)基于Multi-Agent的系统,利用Agent的自治性实现局部挖掘以保护数据私有性;利用Agent的主动性减少用户参与以提高挖掘自动化水平;利用Agent的协作性实现多算法协同挖掘等;2)基于网格的系统,利用网格在资源共享、开放服务和协同工作等方面的优势,提高挖掘的可靠性和协同性;3)基于元学习的系统,通过元学习优化挖掘算法的选择与组合,并对已获知识进行多次学习以提高结果质量;4)基于CDM(collective data mining)框架的系统,将待学习的函数表示为一组基函数的分布式存在,允许各数据源选择不同的学习算法,并以全局结果正确为前提减少网络通信量。进而,对当前DDM研究存在的共性问题进行了归纳:1)结果质量问题,不考虑各个站点数据源间的内在语义联系,各站点独立挖掘本地数据,与其他站点间无语义层面的数据交互或融合,形成纯粹的"分割式"挖掘,最终导致全局结果质量受损;2)挖掘效率问题,如何调度资源以平衡挖掘负载、减少协作挖掘中的通信开销问题。针对结果质量问题,探讨本体与数据挖掘的结合。作为语义网的基础,本体能为对象语义距离度量提供有效支持。当前,在利用本体描述挖掘任务的领域背景方面,利用本体描述DM过程本身方面,都已经有研究人员进行了探索性工作:针对关联规则挖掘中需要从海量规则中遴选有效规则的问题,提出了交互式的、用于删减冗余规则的挖掘后处理方法;针对在给定知识发现过程的输入和输出类型前提下,知识发现工作流的自动构造问题,提出了解决方法。通过阐述可知,为了提升分布式挖掘过程中局部结果和最终结果的质量,策略之一就是将DDM理论和本体理论作融合,以数据源间语义距离的度量为突破口,建立语义距离度量的复合量化体系,通过构建和求解新型DDM模型来实现目标。  相似文献   

5.
文章在分析已有并行关联规则挖掘算法的基础上,讨论了多处理器系统中影响并行关联规则挖掘算法性能的主要问题。提出了多数据源在集群系统中的分布策略、在集群系统中进行并行关联规则挖掘的过程与策略、挖掘过程中并行计算的模型与方法以及规则的合并机制。  相似文献   

6.
多数据源关联规则挖掘算法研究   总被引:5,自引:4,他引:5  
现行的关联规则挖掘算法大多只针对针对单一数据源进行挖掘,但在实验应用中,往往碰到多个数据源的情况,前面的工作已经就多数据源的挖掘做了一些基础性的研究,取得了一定的成果,在此提出一个多数据源关联规则挖掘算法,能够较好的解决在多个数据源的情况下,关联规则挖掘中所涉及的问题,并在实验部分验证了此种算法的正确性和效率。  相似文献   

7.
基于增量式遗传算法的粗糙集分类规则挖掘   总被引:8,自引:0,他引:8  
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性.  相似文献   

8.
分析了数据挖掘所获规则的不同应用类型及其实施过程中建立规则管理系统的必要性,提出了一个分类规则管理系统的构建方法,根据对分类规则挖掘过程及结果的抽象,引入元数据知识设计了分类规则的存储结构、查询操作以及建立在此基础上的应用,给出了应用实例·其特点是不仅存储了挖掘结果,同时存储了挖掘过程中涉及的相关数据,更便于对新数据分类和预测·  相似文献   

9.
粗糙集作为数据挖掘工具,主要通过分类数据得到预测型知识,但分类规则过于严格,使得在挖掘带噪音的数据时,挖掘结果可能会损失一些有价值的规则.提出一种带不确定因子的信息系统及相应的分类方法,改进了传统粗糙集的分类方法.  相似文献   

10.
为解决多数据源挖掘隐私保护问题,文章采取按相似度分类多源数据库及其增量数据库,利用原始数据库挖掘结果和增量数据库分析结果进行敏感序列模式匹配,以有效减少数据库扫描次数的方法,设计实现隐私保护的增量式的高投票率序列模式挖掘算法。实验结果表明,给出的算法既能够准确挖掘出多数据源中全局高投票率模式,又能有效地隐藏保护敏感模式,且显著缩短了挖掘时间。  相似文献   

11.
多最小支持度下的关联规则及其挖掘方法研究   总被引:4,自引:0,他引:4  
数据挖掘指的是从大量的数据中提取隐含的、事先未知的、并且潜在有用的知识技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一。关联规则是当前数据挖掘研究的主要领域之一,获取具有更高价值的规则是该领域的一个研究重点。针对目前大多数挖掘算法只能发现单一支持度下的关联规则问题,文中提出了一种基于多支持度的挖掘策略及在原有AprioriTid算法基础上的改进算法。  相似文献   

12.
一个适用于地理信息系统的数据挖掘工具——GISMiner   总被引:6,自引:1,他引:6  
论文将常用于关系型、事务型数据库的面向属性归纳的方法和关联规则挖掘方法扩展至空间数据库,开发了适用于地理信息系统(GIS)的空间数据挖掘工具-GISMiner,并将其应用于从农田GIS中挖掘农田使用情况的空间特征规则,以及从农产品市场GIS中挖掘农产品价格与铁路、国道和河流间的空间关联规则实验。结果表明,GISMiner是一个实用的、能适应于GIS且能挖掘多种知识类型的数据挖掘工具。  相似文献   

13.
用于数据挖掘的粗集产生多重知识库的方法   总被引:1,自引:0,他引:1  
提出了一种用于数据挖掘的粗集产生多重知识库的方法.该方法基于粗集理论的简化和决策矩阵.首先从知识表示系统中消除冗余属性,产生简化表,形成简化的知识表示系统,提高学习的有效性和精确性.然后从简化表中推导出决策矩阵,通过决策矩阵获取最小决策规则,计算包括所有必需属性的简化集合,给出计算最小决策规则和计算多重简化的算法.最后由相应的简化对最小决策规则进行分组形成多重知识库,给出产生多重知识库的算法.  相似文献   

14.
多粒度时间序列中模糊规则的提取   总被引:2,自引:0,他引:2  
介绍了一种从多粒度时间序列中提取模糊规则的数据挖掘方法,该方法在时间序列中引入多重时间粒度,以模糊规则的形式给出数据挖掘的结果,建立多粒度时间序列的数学模型,并对提取模糊规则中所涉及的一些基本概念作出定义,在此基础上,给出数据挖掘的具体算法,通过实验证明了该挖掘算法的有效性。  相似文献   

15.
多层次规则挖掘的约略集方法   总被引:1,自引:0,他引:1  
约略集理论是一种能处理数据中不确定和噪音的有效数学工具,是数据挖掘的重要方法.结合数据分类层次,提出了利用约略集理论挖掘多层次规则的方法,挖掘过程包含约减的求解、等价类的构造、差别矩阵的建立、规则的挖掘4个阶段,并举例说明了多层次规则的挖掘过程.  相似文献   

16.
面向属性归纳的方法以关系的或面向属性的操作实现数据挖掘过程。文中将统计分析方法和面向属性的归纳方法接合起来 ,形成了一种应用比较广的数据挖掘方法。同时提出属性数据挖掘可分为两个层次 ,包括从数据产生模型和从数据归纳出知识。从数据推导出的模型可以进行数据预处理和定量描述变量之间的关系 ;由数据挖掘出的知识可以揭示客观世界的普遍规律  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号