共查询到19条相似文献,搜索用时 547 毫秒
1.
影响关联规则挖掘的有趣性因素的研究 总被引:7,自引:2,他引:7
关联规则挖掘是数据挖掘研究中的一个重要方面,而其中一个重要问题是对挖掘出的规则的感兴趣程度的评估。实际应用中可从数据源中挖掘出大量的规则,但这些规则中的大部分对用户来说是不一定感兴趣的。关联规则挖掘中的有趣性问题可从客观和主观两个方面对关联规则的兴趣度进行评测。利用模板将用户感兴趣的规则和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测;在关联规则的置信度和支持度基础上对关联规则的有趣性的客观评测增加了约束。 相似文献
2.
3.
基于综合度量的关联规则挖掘算法 总被引:2,自引:0,他引:2
从确定性,有用性,简洁性和新奇性4个方面对规则进行综合度量,给出了规则长度和兴趣度约束的定义,在传统算法基础上提出了基于综合度量的关联规则挖掘算法,使关联规则的挖掘质量得到提高。 相似文献
4.
基于兴趣度的时态关联规则挖掘算法 总被引:1,自引:1,他引:1
关联规则挖掘是数据挖掘研究中的一个重要方面,给出了一个关联规则中事件所包含信息的模型,在此基础上,提出了一种基于兴趣度的时态关联规则挖掘算法。该算法较好地弥补了应用模板匹配方法筛选基于兴趣度的关联规则时主观性太强,兴趣度阈值的定义过于简单,所挖掘出来的关联规则没有体现时态约束的缺陷。最后,将该算法应用到了股票数据的趋势挖掘中,得到了满意的实验结果。 相似文献
5.
6.
空间关联规则的双向挖掘 总被引:9,自引:0,他引:9
空间数据库中关联规则挖掘不仅需要考虑关系元组属性之间的关系——纵向关系,更需要挖掘元组之间的关系——横向关系,如相邻、相交、重叠等。本文通过分析空间数据库的存储模式,借鉴事务数据库关联规则的挖掘方法,对空间关联规则进行完整定义,并对规则的兴趣度度量进行探讨。根据挖掘的方向将空间数据挖掘归纳为纵向挖掘、横向挖掘、双向挖掘。在双向挖掘中,提出一种新算法,该算法根据挖掘任务进行约束,缩小挖掘空间,然后通过空间计算将空间关系转化为非空间关系,经过多次循环,获取非空间项集,进而挖掘出空间关联规则。据此提出空间数据双向挖掘工作流程,并通过实例进行了验证。 相似文献
7.
基于Apriori的有效关联规则挖掘算法的研究 总被引:29,自引:0,他引:29
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了关联规则的两个性质和引入兴趣度的第三个度量———相关支持度,设计了挖掘出有效关联规则算法,较好地解决了上述问题。 相似文献
8.
9.
《计算机应用与软件》2017,(12)
传统的多维关联规则挖掘过程通常以规则出现的频率来判定规则的有效性,并以支持度与置信度作为度量标准。这种挖掘方法只考虑规则间的统计相关性,忽略了规则自身的语义重要性,即规则能够为商家带来的期望效益。因此在多维关联规则挖掘过程中,引入效用函数作为统计相关性与语义重要性的综合度量指标。效用函数主要从潜在机会、购买概率、期望效益三个方面来度量规则的有效性,潜在机会与购买概率表示统计相关性,期望效益表示语义重要性。结果表明,以效用函数作为度量挖掘出的规则既符合客观上要求的较高频率,又具有主观上期望的较高效益。 相似文献
10.
挖掘支持度和兴趣度最优的数量关联规则 总被引:4,自引:0,他引:4
讨论了数量关联规则提取过程中的连续属性离散化方法和规则的有趣性问题,给出了数量关联规则的客观兴趣度的度量函数,提出用模板匹配方法挖掘用户感兴趣的规则,以解决数量关联规则有趣性的主观评测,研究了一种挖掘支持度和兴趣度最优的形如(A∈[v1,v2]∧)C1)推出C2(其中A为连续属性,C1、C2为类别属性)的数量关联规则方法,并将该方法应用于股市行情分析,实验结果表明是非常有效的. 相似文献
11.
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。 相似文献
12.
一种高效的多维多层关联规则挖掘算法 总被引:1,自引:0,他引:1
关联规则是数据挖掘中一个重要的研究方向。文章提出了一种基于遗传算法的多维多层关联规则挖掘算法。算法针对现有多维多层关联规则挖掘中存在阈值定义不合理的缺点,依据多维和多层数据的共同特点,提出了一种启发式的阈值自定义方式,来提高挖掘效率和结果的准确性。实验结果证明这种算法是有效。 相似文献
13.
A. M. Palacios M. J. Gacto J. Alcalá-Fdez 《Soft Computing - A Fusion of Foundations, Methodologies and Applications》2012,16(5):883-901
Data mining is most commonly used in attempts to induce association rules from databases which can help decision-makers easily
analyze the data and make good decisions regarding the domains concerned. Different studies have proposed methods for mining
association rules from databases with crisp values. However, the data in many real-world applications have a certain degree
of imprecision. In this paper we address this problem, and propose a new data-mining algorithm for extracting interesting
knowledge from databases with imprecise data. The proposed algorithm integrates imprecise data concepts and the fuzzy apriori
mining algorithm to find interesting fuzzy association rules in given databases. Experiments for diagnosing dyslexia in early
childhood were made to verify the performance of the proposed algorithm. 相似文献
14.
15.
基于频繁模式树的分布式约束性关联规则挖掘算法研究 总被引:1,自引:0,他引:1
在分布式环境中挖掘约束性关联规则是当前研究的热点问题之一。该文在FP-growth算法的基础上,提出了一种新的分布式挖掘约束性关联规则算法DAMICFP。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。 相似文献
16.
17.
关联规则挖掘是最常用、最重要的数据挖掘任务之一,经典的关联规则挖掘算法有Apriori、FP-Growth、Eclat等。随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。本文对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。 相似文献
18.
Mining multiple-level association rules in large databases 总被引:2,自引:0,他引:2
Jiawei Han Yongjian Fu 《Knowledge and Data Engineering, IEEE Transactions on》1999,11(5):798-805
A top-down progressive deepening method is developed for efficient mining of multiple-level association rules from large transaction databases based on the a priori principle. A group of variant algorithms is proposed based on the ways of sharing intermediate results, with the relative performance tested and analyzed. The enforcement of different interestingness measurements to find more interesting rules, and the relaxation of rule conditions for finding “level-crossing” association rules, are also investigated. The study shows that efficient algorithms can be developed from large databases for the discovery of interesting and strong multiple-level association rules 相似文献
19.
Web挖掘及其应用研究 总被引:7,自引:0,他引:7
Web挖掘就是利用数据挖掘技术,从Web文档和Web活动中提取感兴趣的,潜在的有用模式和隐藏的信息,本文详细阐述了Web的特点,Web挖掘的分类及应用。 相似文献