首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 547 毫秒
1.
影响关联规则挖掘的有趣性因素的研究   总被引:7,自引:2,他引:7  
关联规则挖掘是数据挖掘研究中的一个重要方面,而其中一个重要问题是对挖掘出的规则的感兴趣程度的评估。实际应用中可从数据源中挖掘出大量的规则,但这些规则中的大部分对用户来说是不一定感兴趣的。关联规则挖掘中的有趣性问题可从客观和主观两个方面对关联规则的兴趣度进行评测。利用模板将用户感兴趣的规则和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测;在关联规则的置信度和支持度基础上对关联规则的有趣性的客观评测增加了约束。  相似文献   

2.
Rough集理论提供了一种新的处理不精确,不完全与不相容知识的数学方法,从不一致决策表中快速,有效地挖掘出缺省规则是决策规则挖掘研究的一个热点,文中引入了决策规则的相似度概念,并提出了基于Rough集的兴趣缺省规则挖掘算法(IDRMA),依据IDRMA算法对决策规则进行合理的分类,可获取用户的兴趣缺省规则。  相似文献   

3.
基于综合度量的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陆晶  赛英 《计算机工程》2004,30(22):89-90,131
从确定性,有用性,简洁性和新奇性4个方面对规则进行综合度量,给出了规则长度和兴趣度约束的定义,在传统算法基础上提出了基于综合度量的关联规则挖掘算法,使关联规则的挖掘质量得到提高。  相似文献   

4.
基于兴趣度的时态关联规则挖掘算法   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘研究中的一个重要方面,给出了一个关联规则中事件所包含信息的模型,在此基础上,提出了一种基于兴趣度的时态关联规则挖掘算法。该算法较好地弥补了应用模板匹配方法筛选基于兴趣度的关联规则时主观性太强,兴趣度阈值的定义过于简单,所挖掘出来的关联规则没有体现时态约束的缺陷。最后,将该算法应用到了股票数据的趋势挖掘中,得到了满意的实验结果。  相似文献   

5.
在粗糙集理论的基础上,对决策信息系统中边界区域的数据进行研究,提出一种从边界区域数据中挖掘决策规则的算法——近似序列决策规则挖掘算法。在16个UCI数据集上的测试表明,该算法在规则的准确度和平均前件长度2个指标上优于ID3算法,能简洁、高效地挖掘出决策信息系统中的全部决策规则,为挖掘未知知识提供了新的思路。针对挖掘出的全部决策规则,提出新的确定性度量和一致性度量指标,用以准确地反映决策规则的性能。  相似文献   

6.
空间关联规则的双向挖掘   总被引:9,自引:0,他引:9  
空间数据库中关联规则挖掘不仅需要考虑关系元组属性之间的关系——纵向关系,更需要挖掘元组之间的关系——横向关系,如相邻、相交、重叠等。本文通过分析空间数据库的存储模式,借鉴事务数据库关联规则的挖掘方法,对空间关联规则进行完整定义,并对规则的兴趣度度量进行探讨。根据挖掘的方向将空间数据挖掘归纳为纵向挖掘、横向挖掘、双向挖掘。在双向挖掘中,提出一种新算法,该算法根据挖掘任务进行约束,缩小挖掘空间,然后通过空间计算将空间关系转化为非空间关系,经过多次循环,获取非空间项集,进而挖掘出空间关联规则。据此提出空间数据双向挖掘工作流程,并通过实例进行了验证。  相似文献   

7.
基于Apriori的有效关联规则挖掘算法的研究   总被引:29,自引:0,他引:29  
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了关联规则的两个性质和引入兴趣度的第三个度量———相关支持度,设计了挖掘出有效关联规则算法,较好地解决了上述问题。  相似文献   

8.
1引言 在事务数据库中挖掘关联规则是数据挖掘领域中的一个十分重要的研究课题,是由R.Agrawal等人于1993年在ACM SIGMOD上首次提出的[1].经典的关联规则挖掘问题是指从数据库中挖掘出那些支持度和信任度都大于用户给定的最小支持度和最小信任度的关联规则.  相似文献   

9.
传统的多维关联规则挖掘过程通常以规则出现的频率来判定规则的有效性,并以支持度与置信度作为度量标准。这种挖掘方法只考虑规则间的统计相关性,忽略了规则自身的语义重要性,即规则能够为商家带来的期望效益。因此在多维关联规则挖掘过程中,引入效用函数作为统计相关性与语义重要性的综合度量指标。效用函数主要从潜在机会、购买概率、期望效益三个方面来度量规则的有效性,潜在机会与购买概率表示统计相关性,期望效益表示语义重要性。结果表明,以效用函数作为度量挖掘出的规则既符合客观上要求的较高频率,又具有主观上期望的较高效益。  相似文献   

10.
挖掘支持度和兴趣度最优的数量关联规则   总被引:4,自引:0,他引:4  
讨论了数量关联规则提取过程中的连续属性离散化方法和规则的有趣性问题,给出了数量关联规则的客观兴趣度的度量函数,提出用模板匹配方法挖掘用户感兴趣的规则,以解决数量关联规则有趣性的主观评测,研究了一种挖掘支持度和兴趣度最优的形如(A∈[v1,v2]∧)C1)推出C2(其中A为连续属性,C1、C2为类别属性)的数量关联规则方法,并将该方法应用于股市行情分析,实验结果表明是非常有效的.  相似文献   

11.
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。  相似文献   

12.
一种高效的多维多层关联规则挖掘算法   总被引:1,自引:0,他引:1  
关联规则是数据挖掘中一个重要的研究方向。文章提出了一种基于遗传算法的多维多层关联规则挖掘算法。算法针对现有多维多层关联规则挖掘中存在阈值定义不合理的缺点,依据多维和多层数据的共同特点,提出了一种启发式的阈值自定义方式,来提高挖掘效率和结果的准确性。实验结果证明这种算法是有效。  相似文献   

13.
Data mining is most commonly used in attempts to induce association rules from databases which can help decision-makers easily analyze the data and make good decisions regarding the domains concerned. Different studies have proposed methods for mining association rules from databases with crisp values. However, the data in many real-world applications have a certain degree of imprecision. In this paper we address this problem, and propose a new data-mining algorithm for extracting interesting knowledge from databases with imprecise data. The proposed algorithm integrates imprecise data concepts and the fuzzy apriori mining algorithm to find interesting fuzzy association rules in given databases. Experiments for diagnosing dyslexia in early childhood were made to verify the performance of the proposed algorithm.  相似文献   

14.
基于本体论的数据挖掘方法   总被引:16,自引:1,他引:15  
数据挖掘是一个人机交互的过程,领域知识对数据挖掘起着重要作用,提出一种基于本体的数据挖掘算法,使领域知识和数据库无缝连接,该算法能更有效地发现有意义的多层次规则。  相似文献   

15.
基于频繁模式树的分布式约束性关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
在分布式环境中挖掘约束性关联规则是当前研究的热点问题之一。该文在FP-growth算法的基础上,提出了一种新的分布式挖掘约束性关联规则算法DAMICFP。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。  相似文献   

16.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

17.
关联规则挖掘是最常用、最重要的数据挖掘任务之一,经典的关联规则挖掘算法有Apriori、FP-Growth、Eclat等。随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。本文对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。  相似文献   

18.
Mining multiple-level association rules in large databases   总被引:2,自引:0,他引:2  
A top-down progressive deepening method is developed for efficient mining of multiple-level association rules from large transaction databases based on the a priori principle. A group of variant algorithms is proposed based on the ways of sharing intermediate results, with the relative performance tested and analyzed. The enforcement of different interestingness measurements to find more interesting rules, and the relaxation of rule conditions for finding “level-crossing” association rules, are also investigated. The study shows that efficient algorithms can be developed from large databases for the discovery of interesting and strong multiple-level association rules  相似文献   

19.
Web挖掘及其应用研究   总被引:7,自引:0,他引:7  
Web挖掘就是利用数据挖掘技术,从Web文档和Web活动中提取感兴趣的,潜在的有用模式和隐藏的信息,本文详细阐述了Web的特点,Web挖掘的分类及应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号