首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,但这类算法会产生巨大的候选集并且重复扫描数据库.本文针对这一问题,给出了一种基于FC-tree的频繁闭项目集挖掘算法Max-FCIA,该算法将频繁项目集存储在哈希表中,节省了程序的搜索时间.此外,利用广度优先搜索和有效的剪枝策略,大大限制了候选项目集的生成,缩小了搜索空间从而提高了程序的性能.实验结果表明该算法是快速有效的.  相似文献   

2.
通过构造边支配集,提出了求解无线网络中弱连通支配集的集中式构造算法,该算法的时间复杂度为O(|N|+|E|)。同时在保证支配集的支配性和弱连通性不变的情况下,给出了两种修剪策略,以减小所求弱连通支配集的规模。从理论上证明了本算法的正确性,并通过仿真验证了算法的有效性。与已有结果相比,该算法可以产生规模更小的弱连通支配集。  相似文献   

3.
一种基于关联规则Apriori算法的改进研究   总被引:1,自引:0,他引:1  
介绍Apriori算法的原理和基础,并对制约Apriori算法效率的瓶颈问题提出一种改进策略,针对该算法的两个缺陷,多次扫描事务数据库并产生大量的候选集,提出一种0-1矩阵的改进算法改变由低维频繁项目集到高维频繁项目集的多次连接运算。此改进算法大大减少了访问数据库的次数,提高系统的运行效率,同时还减少大量的候选集的产生,节约存储空间。  相似文献   

4.
分布式环境下约束性关联规则的快速挖掘   总被引:2,自引:0,他引:2  
研究人员针对单机环境提出了约束性关联规则的挖掘算法,但它们不适用于分布式环境.为此本文讨论分布式环境下约束性关联规则的快速挖掘技术,提出一种基于分布式环境的约束性关联规则快速挖掘算法DCAR,其中包括局部约束性频繁项目集挖掘算法MLFC和全局约束性频繁项目集挖掘算法MGFC.该算法根据布尔约束条件产生向导集,采用一种新的候选项集生成函数Reorder-gen,该函数通过向导集高效地产生分布式环境中满足约束条件的、数量较少且完备的候选项集,并且求解全局约束性频繁项集过程中,传送局部候选项集支持数的通信量为O(n),从而提高了算法的挖掘效率.将本文提出的算法加以实现,实验结果表明DCAR算法高效可行,其效率大约是DMA-IC算法的2-3倍.  相似文献   

5.
最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快速挖掘算法FMMFIBFM,FMMFIBFM采用FP-tree的存储结构,仅须扫描数据库两遍且不产生候选频繁项目集,有效地提高了频繁项目集的挖掘效率。实验结果表明,FMMFIBFM算法是有效可行的。  相似文献   

6.
在对Apriori算法分析的基础上,针对该算法存在的两个缺陷,即多次扫描事务数据库和产生大量的候选数据集,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,只扫描1次数据库,改变由低维频繁项目集到高维频繁项目集的多次连接运算,直接从高阶项目集着手寻找最大频繁项目集,从而提高了运算效率。  相似文献   

7.
从不一致例子中控制规则的粗集方法MIE—RS   总被引:3,自引:0,他引:3  
该文研究不一致例子中的多概念学习。所得不一致的例子是指具有相同的条件属性值却属于不同概念的矛盾例子。该文提出了一个基于粗集扩展模型的数据挖掘算法MIE-RS,能有效处理例子集的不一致性,并且通过确定每个概念的覆盖,即最小相关属性集,为每一概念产生最间的满足给定可信度的产生或规则知识。  相似文献   

8.
本文讨论了有关等价属性集的一些性质,提出了准等价属性集和基本等价属性集的概念。在此基础上给出了一种求等价属性集的算法。  相似文献   

9.
Apriori算法强项集产生的二维哈希算法   总被引:4,自引:0,他引:4  
从大型事务数据库中发现关联规则是KDD中的一个重要课题,而如何求得强项集又是关联规则发现的核心问题,特别是低阶强项集求解的方法决定了整个规则发现算法的性能和速度,本文提出的二维哈希算法能较快速地求得低阶强项集,特别是在产生一阶强项集扫描数据库的同时进行二维哈希投影,有利于迅速产生二阶强项集,从而大幅度地提高强项集产生的效率。  相似文献   

10.
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则.文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法.与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备.  相似文献   

11.
本文利用粗糙集与布尔逻辑离散约简算法改进了粗糙自组织映射算法,并应用于基因表达数据的分析中.算法改进了传统自组织映射收敛慢、网络规模难以确定的缺点,减小了网络规模不确定对分类效果的影响.使用酵母茵基因表达数据进行实验,得到了较好的网络质量、网络规模和分类效果,相比传统自组织映射使分类正确率提高了10.15%.  相似文献   

12.
一种基于粗糙集理论的最简规则挖掘方法   总被引:4,自引:0,他引:4  
赛煜  王海洋 《计算机工程》2003,29(20):77-79
提出了一种基于粗糙集理论的最简规则挖掘方法,它是一个采用基于分类正确度的粗糙集模型进行多概念分类规则挖掘的新方法,能有效处理决策表的不一致性,采用启发式算法,挖掘出满足给定精确度的最简产生式规则知识。用多个UCI数据集对算法进行了测试,并且与著名的Rosetta软件进行实验对比,结果说明此方法大大提高了总的数据约简量,可以有效地简化最终得到的规则知识。  相似文献   

13.
This paper presents the relations between rough set reducts and jumping emerging patterns. Observations are introduced formally and supported by brief examples. Furthermore, we propose practical applications of these observations to the minimal reduct problem and to testing whether a given attribute set is differentiating. We believe that our study can be expanded so as to include other types of reducts and emerging patterns.  相似文献   

14.
This paper presents a hybrid soft computing modeling approach, a neurofuzzy system based on rough set theory and genetic algorithms (GA). To solve the curse of dimensionality problem of neurofuzzy system, rough set is used to obtain the reductive fuzzy rule set. Both the number of condition attributes and rules are reduced. Genetic algorithm is used to obtain the optimal discretization of continuous attributes. The fuzzy system is then represented via an equivalent artificial neural network (ANN). Because the initial parameter of the ANN is reasonable, the convergence of the ANN training is fast. After the rules are reduced, the structure size of the ANN becomes small, and the ANN is not fully weight-connected. The neurofuzzy approach based on RST and GA has been applied to practical application of building a soft sensor model for estimating the freezing point of the light diesel fuel in fluid catalytic cracking unit.  相似文献   

15.
基于相似Rough集的模糊检索策略   总被引:7,自引:1,他引:6  
Rough集理论作为一种具有模糊边界的集合理论,被广泛运用于不确定环境下的信息处理。文章探讨了一种基于相似关系Rough集的模糊查询技术,它是对普通Rough集在数据库中应用的推广,能有效地提高查询的灵活度及效率。  相似文献   

16.
可变精度粗集模型约简异常分析   总被引:2,自引:0,他引:2  
粗糙集理论一直致力于研究不确定或不精确信息的数据分析问题。本文基于可变精度粗糙集模型相关概念,对其约简异常进行了深入研究,分析了包含度区间的动态变化和正区域变化引起的约简异常,提出了消除异常的基本思想,从而完善了基于可变精度粗集模型的约简。  相似文献   

17.
基于相容关系的粗糙集理论的推广   总被引:7,自引:0,他引:7  
文章给出了一种基于相容关系的推广的粗糙集模型。当传递性不能满足时,等价关系弱化为相容关系,用相容核代替等价类来构造上、下近似算子,从而给出一种推广的粗糙集模型。较之于以R(x)代替等价类所得到粗糙集模型,该文所得到的上、下近似算子分别是闭包算子和内部算子,而且对未知知识的(近似)刻画更为精确。  相似文献   

18.
基于核属性依赖的属性约简算法研究   总被引:1,自引:0,他引:1  
路松峰  胡波 《计算机仿真》2007,24(4):69-71,107
数据库中的数据往往含有大量冗余或不必要的属性,严重降低了数据挖掘算法的时间效率和算法质量,因此删除数据的冗余属性和无关属性即属性约简就成了数据预处理过程中的主要任务,而粗糙集理论是处理属性约简的一个非常实用的理论工具.在深入研究粗糙集理论的基础上,结合数据库操作知识给出了基于核属性依赖的属性约简新方法.该算法能过滤掉属性集合中的无关属性和冗余属性,从而得到满意的属性约简,该算法复杂度较小.实验结果证明了该算法有效.  相似文献   

19.
随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点.传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响.提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果.  相似文献   

20.
魏立力  韩崇昭 《计算机仿真》2007,24(5):72-74,106
近年来粗糙集数据分析已经成为定性数据分析的一个常用方法,而信息系统的属性约简是粗糙集理论的一个基本问题.粗糙集方法虽然不需要数据之外的其它信息,但所得结果同时也缺乏统计证据.文中运用非参数统计的思想研究了信息系统的属性约简问题,首先将原始信息系统整理成任意两个属性子集之间的列联表,然后给出了基于卡方统计量的属性相关性的一个新度量,基于此度量给出了信息系统属性约简的新方法.数值例子说明了该方法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号