共查询到18条相似文献,搜索用时 46 毫秒
1.
2.
挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系。现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息。文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用。 相似文献
3.
概念指导的关联规则的挖掘 总被引:4,自引:0,他引:4
关联规则是数据依赖关系泊有效描述方法,是知识发现研究的重要内容,传统的关联规则挖掘算法缺少挖掘的针对性,挖掘速度慢,挖掘效果难于理解,挖掘析数量巨大,需要进行大量的筛选以便抽取出有用规则,文中提出了将概念融入挖掘过程中,提高挖掘的效率和挖掘的针对性的方法,给出了概念指导的关联规则挖掘算法CGARM和大数据库中概念的交互式生成方法。算法CGARM是对基于分类的挖掘算法的拓展。实验结果表明,算法CGA 相似文献
4.
多概念层次的数值关联规则挖掘 总被引:2,自引:0,他引:2
1 引言文[6]中将分类规则挖掘的方法扩展到数值关联规则挖掘的情况,其基本思想是:把一个数值属性x划分为若干个等分区间,于是一个三元组便可对应于一个布尔项目,其中[1,u]表示一个数值区间,之后再用类似于布尔关联规则的挖掘算法进行挖掘。这种采用区间分割的方法来刻画数值属性,存在三点不足之处;1)致使信息丢失;2)经常使规则具有误导性; 相似文献
5.
基于概念格的关联规则挖掘 总被引:2,自引:0,他引:2
关联规则的挖掘是知识发现领域重要的研究方向之一,因此开展这方面的研究是很有意义的。论文给出了一种基于概念格的关联规则的算法,该算法首先通过约化形式背景,然后通过给定的阈值在约简的背景上建格,最后在格上提取符合条件的关联规则。例子说明了该算法的可行性和有效性。 相似文献
6.
提出了一种新的基于模糊概念的量化关联规则挖掘方法,该方法利用在量化属性域上定义的一组模糊概念表示属性间的关联关系,克服了传统的离散分区法的不足,使得规则的表示自然,简明,有利于专家理解,同时,给出了挖掘算法。 相似文献
7.
8.
关联规则挖掘是数据挖掘中的一项核心任务,而由二元关系导出的概念格则是一种非常有用的形式化分析工具,它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系。一个概念内涵与一个关联规则中的闭合项集可以一一对应。提出了一种新有基于概念格的关联规则挖掘算法Arca(Association Rule based Concept lAttice)。Arca算法通过概念矩阵构造部分概念格,使概念格中的每个概念对应一个闭合频繁项集。然后生成一些关联规则,在这些关联规则上通过定义了四个算子来生成了所有关联规则。 相似文献
9.
10.
基于概念格挖掘GIS中的关联规则 总被引:1,自引:0,他引:1
挖掘隐藏在地理信息系统(GIS)的空间数据中的知识是GIS研究领域和数据挖掘领域的重要方向。概念格是关联分析的重要技术之一。为了提高关联规则的挖掘速度,提出了一种基于增量式算法的概念格构造算法,通过用比较概念外延的方法建格,同时在建格过程中引入支持度约束,使得概念格的建格速度得到提高,并使建成的格具有高度的约简性,让后续的规则挖掘变得更容易。将所提算法应用于GIS的空间数据挖掘,取得了切实可行的应用结果。 相似文献
11.
从人类认知思维习惯出发,以概念作为算法的纽带,把两个形式化的概念处理工具--概念格、云模型结合起来,研究基于概念的不确定性关联规则算法,实验表明,新算法能取得令人满意的结果. 相似文献
12.
关系数据库中多层次关联规则的采掘及其实现 总被引:3,自引:0,他引:3
讨论了在关系数据库中进行多层次的关联规则采掘的概念和在关系数据库中的实现方法。提出并实现了利用关系数据库的特点,高效地得到满足要求的多层次关系规则,并进行了必要的讨论和总结。 相似文献
13.
基于频繁模式树的普遍化关联规则挖掘 总被引:2,自引:1,他引:2
提出了基于频繁模式树的普遍化关联规则挖掘算法 MGAR- FP,充分利用频繁模式树的性质 ,避免大量候选模式的生成和频繁模式匹配 ,提高了挖掘的效率和速度 .实验表明 ,算法是有效的 ,比传统的普遍化关联规则挖掘算法Cum ulate快 相似文献
14.
Mining Frequent Generalized Itemsets and Generalized Association Rules Without Redundancy 总被引:1,自引:0,他引:1 下载免费PDF全文
This paper presents some new algorithms to efficiently mine max frequent generalized itemsets (g-itemsets) and essential generalized association rules (g-rules). These are compact and general representations for all frequent patterns and all strong association rules in the generalized environment. Our results fill an important gap among algorithms for frequent patterns and association rules by combining two concepts. First, generalized itemsets employ a taxonomy of items, rather than a flat list of items. This produces more natural frequent itemsets and associations such as (meat, milk) instead of (beef, milk), (chicken, milk), etc. Second, compact representations of frequent itemsets and strong rules, whose result size is exponentially smaller, can solve a standard dilemma in mining patterns: with small threshold values for support and confidence, the user is overwhelmed by the extraordinary number of identified patterns and associations; but with large threshold values, some interesting patterns and associations fail to be identified. Our algorithms can also expand those max frequent g-itemsets and essential g-rules into the much larger set of ordinary frequent g-itemsets and strong g-rules. While that expansion is not recommended in most practical cases, we do so in order to present a comparison with existing algorithms that only handle ordinary frequent g-itemsets. In this case, the new algorithm is shown to be thousands, and in some cases millions, of the time faster than previous algorithms. Further, the new algorithm succeeds in analyzing deeper taxonomies, with the depths of seven or more. Experimental results for previous algorithms limited themselves to taxonomies with depth at most three or four. In each of the two problems, a straightforward lattice-based approach is briefly discussed and then a classificationbased algorithm is developed. In particular, the two classification-based algorithms are MFGI_class for mining max frequent g-itemsets and EGR_class for mining essential g-rules. The classification-based algorithms are featured with conceptual classification trees and dynamic generation and pruning algorithms. 相似文献
15.
16.
17.
采掘关联规则是数据采掘的重要研究内容.本文针对交易项目中广泛存在的包含和泛化关系,充分利用已采掘出交易项目集的频繁模式集合,提出了一种快速的基于概念提升的多层次关联规则更新采掘方法与算法UMARCP. 相似文献
18.
针对模糊多层关联规则挖掘算法的不足,引入了蕴涵度的方法,实现了基于蕴涵度的模糊多层关联规则挖掘算法.推导出了蕴涵度可以用支持度来表示,这样有效地缩短了程序的执行时间.实验结果证明了采用蕴涵度代替置信度的方法提高了模糊多层关联规则挖掘算法的效率. 相似文献