首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
关联规则的数据挖掘是当今数据挖掘领域的重要内容之一。国内现有的关联规则挖掘算法大多是在最小支持度的限定条件下,发现挖掘数据的各属性间所有关联型知识,而事实上由于基于不同数据属性的事件的发生频率是不同的,这样仅通过唯一的支持度限定的挖掘就无法正确反映挖掘对象本身的特性,本文从客观事实的本质出发,在原有Apriori算法的基础上,采用了一种多支持度的关联规则挖掘策略,最后通过实验结果表明,这种挖掘方法能够更加准确和高效地进行知识挖掘。  相似文献   

2.
关联规则挖掘作为一种大数据挖掘方法,被用于确定不同项目间存在的内在联系,并以大于某一阈值作为评判不同项间存在关联的依据。传统关联规则挖掘方法仅能建立不同项间的布尔型关联规则,存在硬化数据"尖锐边界"问题导致关联规则挖掘性能下降的缺点。为克服经典数据挖掘算法的这一缺陷,提出一种新型中智关联规则挖掘算法。基于专家知识对语言学术语进行量化预处理,得到不同指标的量化数据资料库;基于关联规则支持度定义计算不同指标项集合的支持度;通过考虑不同项间的隶属度、不确定度和非隶属度函数生成关联规则。将该中智挖掘算法与模糊挖掘算法进行对比,结果表明,该算法能够增加生成关联规则数量,有助于提高数据挖掘的准确性。  相似文献   

3.
目前数据库关联规则的增量挖掘作为数据挖掘的一个重要的领域, 已经广泛应用于教育, 医疗, 卫生等领域, 因此它成为了当今数据挖掘中最活跃, 最重要的一个分支领域. 数据库中的数据存在大量未知的数据以及不可知的数据变化. 若采用Apriori算法进行计算, 一方面很难取得较好的结果, 另一方面支持度的变化对结果的影响很大, 无法确定支持度的变化, 因此借助属性论中定性属性的机理以及属性计算网络的边界学习算法, 结合IUBM算法提出了一种基于定性属性的关联规则的增量挖掘算法. 比如在以分数划线招生制度下, 定性基准的一分之差, 可能完全改变一个学生的一生的命运. 通过实验表明, 该算法在处理大规模数据的增量式关联规则的挖掘中减少了冗余规则的产生, 同时挖掘效率得到了很大的提升. 对于诸如预测大学生就业的情况及招聘企业对于应届生学习情况的了解等应用十分有意义.  相似文献   

4.
关联规则的挖掘是一个重要的数据挖掘问题.目前的算法主要是研究支持-信任框架理论的关联规则挖掘,基于支持-信任理论的关联规则挖掘布尔型描述的数据已经比较成熟,但是现实的数据库中有许多数值属性的数据,从这些数据中挖掘潜在的规则,经典的关联规则方法(Apriori)就显得力不从心了.这里介绍将数值数据映射到二维空间,利用基于密度分布函数的聚类分析方法将数值属性区间分段,并在此基础上挖掘容易理解并且具有概括性和有效的数值属性关联规则.  相似文献   

5.
一般的关联规则发现算法使用的都是支持度、置信度框架.但是在增量的数据挖掘过程中,该类算法却需要不断改变支持度、置信度,使得算法本身效率下降,并缺乏可说服性,比如Apriori算法.为了解决该类问题,使用兴趣度框架对增量的数据进行了关联规则挖掘,比较了基于支持度、置信度框架的算法(如Apriori,FUP算法)和基于兴趣度的算法之间的优缺点.试验结果表明:兴趣度能够有效地筛选关联规则,在进行增量的数据挖掘的情况下得到的关联规则总是小于等于支持度、置信度(Aprori)算法挖掘出的规则.  相似文献   

6.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上,介绍了该算法的C#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

7.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上.介绍了该算法的c#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

8.
数据挖掘是从数据库中发现潜在有用知识或者感兴趣模式的过程。在数据挖掘领域中主要集中于单一支持度下的关联规则挖掘,在事务数据库中发现项目之间的关联性,而在实际应用中,项目可以有不同的最小支持度,不同的项目可能具有不同的标准去判断其重要性,因此提出一个在最大值支持度约束下,发现有用的模糊关联规则挖掘算法,在该约束下,利用逐层搜索的迭代方法发现频繁项目集,通过实例证明了该挖掘算法是易于理解和有意义的,具有很好的效率。  相似文献   

9.
一种自适应的模糊关联规则挖掘算法   总被引:4,自引:4,他引:0  
关联规则是数据挖掘的重要研究内容之一.传统的关联规则挖掘算法仅适于处理二元属性与分类属性.为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算法.该算法克服了传统的离散分区法的不足,改进了已有模糊关联规则支持度的计算方法.引入了一种基于聚类的隶属函数自动生成方法,使得模糊关联规则的发现不依赖于人类专家给出的隶属函数,使得关联规则的表示自然、简明,有利于专家理解.实验表明该算法是有效的.  相似文献   

10.
吴爱华  陈出新 《计算机仿真》2021,38(9):344-347,352
针对传统分布式数据库中关系数据正负关联规则挖掘的准确度较低、挖掘效率较低等问题,提出一种新的分布式数据库中关系数据正负关联规则挖掘方法.在关联规则基本概念和性质分析基础上,利用多级支持度从频繁项集中生成正关联规则,结合根据频繁项集和非频繁项集生成负关联规则,通过最小支持度合理设置相关置信度,引入不同权重值于各数据库中,实现分布式数据库中关系数据正负关联规则的挖掘.仿真结果表明,以上算法可有效识别结果规则集中的负关联规则和弱关联规则,确保数据库中关联数据挖掘更加准确;在不同最小支持度或不同事务数条件下,挖掘速度较快,提升了挖掘效率.  相似文献   

11.
最大值控制的多最小支持度关联规则挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
何朝阳  赵剑锋  江水 《计算机工程》2006,32(11):103-105
大部分关联规则挖掘算法使用同一最小支持度阈值进行挖掘,但在实际使用中由干各项目发生频率的不同,理应有不同的最小支持度支持。该文提出了一种多最小支持度关联规则挖掘算法,为每一项目设置一最小支持度,同时在生成舒选集和最大频繁集的过程中使用最大值控制来实现剪枝,有效地提高了该算法的效率,最后用一个超市销售物品的例子来说明该算法的使用。  相似文献   

12.
A genetic-fuzzy mining approach for items with multiple minimum supports   总被引:2,自引:2,他引:0  
Data mining is the process of extracting desirable knowledge or interesting patterns from existing databases for specific purposes. Mining association rules from transaction data is most commonly seen among the mining techniques. Most of the previous mining approaches set a single minimum support threshold for all the items and identify the relationships among transactions using binary values. In the past, we proposed a genetic-fuzzy data-mining algorithm for extracting both association rules and membership functions from quantitative transactions under a single minimum support. In real applications, different items may have different criteria to judge their importance. In this paper, we thus propose an algorithm which combines clustering, fuzzy and genetic concepts for extracting reasonable multiple minimum support values, membership functions and fuzzy association rules from quantitative transactions. It first uses the k-means clustering approach to gather similar items into groups. All items in the same cluster are considered to have similar characteristics and are assigned similar values for initializing a better population. Each chromosome is then evaluated by the criteria of requirement satisfaction and suitability of membership functions to estimate its fitness value. Experimental results also show the effectiveness and the efficiency of the proposed approach.  相似文献   

13.
分组多支持度关联规则研究   总被引:3,自引:1,他引:3  
关联规则是数据挖掘的重要任务之一,传统关联规则算法只有一个最小支持度,假设项出现的频率大致相同,而在谮实际中并非如此,由此产生了多支持度关联规则问题.该问题针对每个项给定不同的支持度,而在实际应用中项可以划分成若干个组,每组有一个支持度.由此提出了分组多支持度关联规则问题,针对该问题给出了基于多支持度性质对项进行分组的方法.该方法可以降低2-项候选集的数目.在此基础上,进一步给出了相应的多支持度关联规则发现算法,并通过实验证明了算法的有效性.  相似文献   

14.
适合于高效更新的关联规则挖掘算法   总被引:6,自引:0,他引:6  
实用的关联规则挖掘算法,为了发现事先未知的关联规则,用户需要通过对最小支持度和最小可信度这两个阈值的不断调整来逐步聚焦到那些真正令其感兴趣的关联规则上去,这将是一个动态的交互过程,因此,迫切需要高效的更新算法来满足用户对较快的响应时间的需求,基于这种思想,并深入分析了已有的诸关联规则挖掘与更新算法且指出其共同存在的问题与不足,在此基础上,提出一种当数据库数据不变时,仅扫描数据库一次,即可反复调整最小支持度和最小可信度进行关联规则挖掘与更新的高效、实用的算法,特别在对关联规则进行更新时,该算法对最初和前次挖掘过程中所得到的信息加以充分的利用,从而对关联规则进行更新时算法的执行效率得到进一步的提高,并对算法进行了分析与讨论.  相似文献   

15.
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个基于Web日志文件的关联规则挖掘模块。该系统应能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和访问兴趣。为了识别用户浏览模式,实现了利用关联规则挖掘算法Apriori对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行挖掘的模块,该模块针对用户选定的若干页面产生满足最小支持度和最小置信度的页面之间的强关联规则,并以文本的形式显示挖掘的结果。  相似文献   

16.
一种新的基于FP-Tree的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的.针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论.  相似文献   

17.
在研究负关联规则相关特性的基础上,将向量内积引入到该领域,提出了一种基于向量内积的多最小支持度正负关联规则挖掘算法。考虑到事务数据库中各项集分布不均而导致的单一最小支持度难以设定的问题,采用了多最小支持度策略,设计了一种能同时挖掘出频繁与非频繁项集,以及从这些项集中挖掘出正负关联规则的算法。实验结果表明,该算法仅需扫描一次数据库,且具有动态剪枝,不保留中间候选项和节省大量内存等优点,对事务数据库中负关联规则的挖掘具有重要意义。  相似文献   

18.
一种基于关联分类方法的Web用户兴趣预测   总被引:1,自引:0,他引:1  
对用户分类是Web挖掘的一个重要的研究方向。文中提出一种基于关联规则的分类方法,并且将它应用于用户兴趣预测。首先对服务器日志文件预处理,形成一个访问事务集。然后对该事务集进行数据挖掘,找出所有的满足最小支持度的类别关联规则。最后用这些类别关联规则去预测用户的兴趣。实验证明此方法是有效的。  相似文献   

19.
郑涛  张伟 《计算机工程》2003,29(13):103-104,111
数据挖掘的一个重要方面是挖掘关联规则,目前已提出了包括经典算法Apriori在内的许多算法,而在实际关联规则的挖掘过程中,用户将需要不断调整用于描述用户兴趣程度的阈值:最小支持度和最小置信度。如何维护已发现的关联规则变得至关重要。该文提出的GIUA算法解决了在数据库D不变的情况下,最小支持度和最小置信度发生变化时关联规则的维护问题,最大效率地利用原有结果,通过动态分组将连接步和修剪步的循环减到最少,并尽可能地将挖掘过程并行化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号