首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 264 毫秒
1.
模糊集与本体结合的数据挖掘方法得到了广泛的关注。为了丰富数据挖掘效果以及数据挖掘得出的规则的完整性,本文在模糊本体的挖掘算法基础上,提出了模糊本体中叶子结点的相似度定义以及不同语义层次所含项目集的数目定义多重最小支持度,提出了基于模糊本体的广义关联规则算法。对比实验证明,基于模糊本体的广义关联规则算法的挖掘具有更强的可读性,获得的语义关联规则更加丰富,促进了在广义关联规则挖掘过程中使概念泛化更加合理,提高了算法效率。  相似文献   

2.
关系数据库中的模糊关联规则挖掘算法研究   总被引:2,自引:2,他引:0  
韩涛  张春海  李华 《计算机工程与设计》2005,26(7):1842-1844,1899
关联是数据挖掘领域的一个重要研究课题。对模糊关联规则挖掘进行了研究,针对普通关联规则不能精确表达数据库中模糊信息关联性的问题,提出了一种新的模糊关联规则挖掘算法FARM_New,结果表明算法是有效的,提高了模糊挖掘的速度。  相似文献   

3.
针对传统数据挖掘中的“尖锐边界”问题,采用将模糊理论和关联规则挖掘技术相结合的思想,在改进传统Apriori算法的基础上,结合多层关联规则挖掘的方法,提出了一种模糊多层关联规则挖掘算法。对模糊多层关联规则挖掘的基本概念进行了定义,详细描述了模糊多层关联规则挖掘算法。最后用Visual FoxPro6.0语言实现了该算法程序,通过交易数据库挖掘实验表明算法是有效的。  相似文献   

4.
针对Apriori算法的缺陷,同时由于OLAP关联规则挖掘方法是一种灵活的、多维的、多层次的高性能方法,将OLAP技术和Apriori关联规则相结合,提出了一种针对Apriori算法的改进的多层次关联规则数据挖掘算法,在分析了关联规则数据挖掘结构的基础上,给出了该算法的思想与执行步骤。  相似文献   

5.
王琼  曹奎 《福建电脑》2012,28(12):84-86
关联规则的提取是数据挖掘中重要的研究课题,目的在于挖掘事务数据库中有趣的关联,Apriori算法是挖掘关联规则的经典算法。该文对Apriori算法进行研究,发现该算法存在着一些缺点,并对其进行改进,用实例说明这些改进能够正确有效的实现该算法。  相似文献   

6.
1 引言数据挖掘是一个从数据中提取出有效的、新颖的、潜在有用的、并能最终被人理解的模式的非平凡过程。数据挖掘可以挖掘出的知识包括关联规则(Association)、特征规则(Characterization)、分类规则(Classification)、聚类规则(Clustering)和趋势规则(Trend)等。数据挖掘是一交叉学科,涉及到诸如统计学、数据库、人工智能、数据可视化等学科。在数据挖掘的研究领域,对于关联规则挖掘的研究开展得比较积极和深入。关联规则挖掘就是要找出隐藏在数据间的相互关系。它展示了数据间未知的依赖关系,根据这种关联性就可从某一数据对象的信息来推断另一数据对象的信息。文[8~13]对关联规则的挖掘作了有意义的研究。R.Agrawal等提出了Aprilri算法和挖掘多层次关联规则的Culmulate,Stratify等算法,J. S.Park等提出了DHP算法,J.Han等提出了面向属性归纳的关联规则挖掘算法ML—T2L1等。  相似文献   

7.
张琰 《网友世界》2012,(12):4-6
数据挖掘技术能使我们从模糊的、不完全的、随机的、大量的数据中,提取潜在的有用的信息和知识。经过20几年的发展,数据挖掘已取得了巨大成就。Web挖掘是数据挖掘技术的一个重要分支,它是随着人工智能技术、数据库技术和网络技术的发展而提出来的。本文针对Web日志挖掘的特性,对关联规则的挖掘算法进行深入的研究,系统地探讨了关联规则挖掘算法在Web日志挖掘的应用。利用优化Apriori算法,使之更具有效率。  相似文献   

8.
为了挖掘可疑通信的行为模式,定位发生了可疑通信行为的上网账户,本文首先分析了可疑通信行为特点。然后针对已有关联规则挖掘算法不能同时满足多层次数据挖掘和加权关联规则挖掘的问题,分析对比两种典型的基本关联规则算法,以FP-tree为基础,提出了ML-WFP多层次加权关联规则挖掘算法。针对算法中数据项权重的确定问题,由用户设置数据项间的重要性比较关系,借鉴模糊一致矩阵的概念,利用模糊层次分析法计算数据项的权重。最后将该算法应用于可疑通信行为的挖掘。实验测试结果表明可疑通信行为挖掘方案合理有效。  相似文献   

9.
提出了一种挖掘量化关联规则的MQAR算法。此算法在挖掘关联规则时,只需扫描事务数据库一遍,提高了数据挖掘的效率;并且存放辅助信息所占的内存空间大大少于现有的挖掘算法;同时此算法不仅能挖掘出有关联的数据项集,还能找出这些项集之间数量上的相互关系。  相似文献   

10.
对于经典的关联规则数据挖掘算法,其采用的重复性事务分析策略会导致频繁项集在计算中存在一定的不确定性,从而不利于算法的精简和优化。为此提出一种基于兴趣度度量函数的Web服务多类数据挖掘算法。采取差异概率兴趣度量规则对关联规则算法中的时序事务进行估计和权重的预测;基于Web服务用户兴趣度进行约束条件设计,实现数据挖掘关联规则的精简;基于支持度函数和期望函数进行事务项集的提取,结合事务项集的置信度对其规则进行导出。选取经典的Web服务UCI Web测试集作为实验对象进行算法的性能验证,结果显示该算法可有效提升数据挖掘算法的性能,对于降低用户Web访问复杂性具有非常好的效果。  相似文献   

11.
运用模糊集挖掘数量属性数据的关联规则   总被引:3,自引:0,他引:3  
王咏  申瑞民 《计算机仿真》2004,21(8):129-131
绝大多数关联规则的挖掘方法基于布尔属性数据,但在现实应用中会经常需要对数量属性的数据进行关联挖掘。该文就提出一种算法,在经典Apriori后选集算法的基础上引入了模糊逻辑集合的概念,将数据集中的数量属性按照模糊集合定义进行划分从而将原始事务数据转化成基于模糊集的数据,然后再运用Apriori算法发现潜在的关联规则。  相似文献   

12.
杨泽民 《计算机科学》2013,40(3):259-262
为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约束函数和剪枝定理进行事务集化简,然后根据支持度和寿支持期望进行加权频繁事务集抽取,最后依据置信度进行加权关联规则导出。实验结果证明,该算法能够快速有效地挖掘出符合用户兴趣度的关联规则。  相似文献   

13.
Today, development of e-commerce has provided many transaction databases with useful information for investigators exploring dependencies among the items. In data mining, the dependencies among different items can be shown using an association rule. The new fuzzy-genetic (FG) approach is designed to mine fuzzy association rules from a quantitative transaction database. Three important advantages are associated with using the FG approach: (1) the association rules can be extracted from the transaction database with a quantitative value; (2) extracting proper membership functions and support threshold values with the genetic algorithm will exert a positive effect on the mining process results; (3) expressing the association rules in a fuzzy representation is more understandable for humans. In this paper, we design a comprehensive and fast algorithm that mines level-crossing fuzzy association rules on multiple concept levels with learning support threshold values and membership functions using the cluster-based master–slave integrated FG approach. Mining the fuzzy association rules on multiple concept levels helps find more important, useful, accurate, and practical information.  相似文献   

14.
谢皝  张平伟  罗晟 《计算机工程》2011,37(19):44-46
在模糊关联规则的挖掘过程中,很难预先知道每个属性合适的模糊集。针对该问题,提出基于次胜者受罚竞争学习的模糊关联规则挖掘算法,无需先验知识,即可根据每个属性的性质找出对应的模糊集,并确定模糊集的数目。实验结果表明,与同类算法相比,该算法可以挖掘出更多有趣的关联规则。  相似文献   

15.
Association rule mining is an important data analysis method for the discovery of associations within data. There have been many studies focused on finding fuzzy association rules from transaction databases. Unfortunately, in the real world, one may have available relatively infrequent data, as well as frequent data. From infrequent data, we can find a set of rare itemsets that will be useful for teachers to find out which students need extra help in learning. While the previous association rules discovery techniques are able to discover some rules based on frequency, this is insufficient to determine the importance of a rule composed of frequency-based data items. To remedy this problem, we develop a new algorithm based on the Apriori approach to mine fuzzy specific rare itemsets from quantitative data. Finally, fuzzy association rules can be generated from these fuzzy specific rare itemsets. The patterns are useful to discover learning problems. Experimental results show that the proposed approach is able to discover interesting and valuable patterns from the survey data.  相似文献   

16.
一种快速有效的分布式开采多层关联规则的算法   总被引:6,自引:0,他引:6  
关联规则(association rules)是数据开采的重要研究内容,建立项目的层次关系可以发现更加有意义的规则,主要研究分布式环境下开采多层关联规则的问题,提出了一种快速有效的MLFDM算法,采用的技术包括分布式编码交易表的有效修剪,侯选集的产生及修剪技术,侯选项集的全局支持数的计算方法等,论述了它的原理,具体实现方法及其几个改进算法,实验结果表明,算法MLFDM是有效的,并对MLFDM算法的几个变种进行了讨论。  相似文献   

17.
加权关联规则挖掘算法的研究   总被引:20,自引:0,他引:20  
讨论了加权关联规则的挖掘算法,对布尔型属性,在挖掘算法MINWAL(O)和MINWAL(W)的基础上给出一种改进的加权关联规则挖掘算法,此算法能有效地考虑布尔型属必的重要性和规则中所含属性的个数,对数量型属性,应用竞争聚集算法将数量型属性划分成若干个模糊集,产系统地提出加权模糊关联规则的挖掘算法,此算法能有效地考虑数量型属性的重要性和规则中所含属性的个数,并适用于大型数据库。  相似文献   

18.
Data mining is most commonly used in attempts to induce association rules from transaction data. Transactions in real-world applications, however, usually consist of quantitative values. This paper thus proposes a fuzzy data-mining algorithm for extracting both association rules and membership functions from quantitative transactions. We present a GA-based framework for finding membership functions suitable for mining problems and then use the final best set of membership functions to mine fuzzy association rules. The fitness of each chromosome is evaluated by the number of large 1-itemsets generated from part of the previously proposed fuzzy mining algorithm and by the suitability of the membership functions. Experimental results also show the effectiveness of the framework.  相似文献   

19.
基于最大粒的规则获取算法   总被引:1,自引:0,他引:1  
粒计算是模拟人类思维和解决复杂问题的方法,它是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具。文中首先分析并指出传统的规则获取方法存在的某些弊端,并从粒计算的角度分析属性约简的粒度原理,指出属性约简过程的本质是寻找决策划分空间的一个极大近似划分空间,而在极大近似划分空间上提取的规则可能不是最简规则。为此,提出一种基于最大粒的规则获取算法,该算法根据条件属性对论域形成的分层递阶的划分空间,自顶向下逐渐提取最大粒对应的规则。仿真实验表明该算法提高粗糙集的泛化能力。  相似文献   

20.
Genetic-Fuzzy Data Mining With Divide-and-Conquer Strategy   总被引:1,自引:0,他引:1  
Data mining is most commonly used in attempts to induce association rules from transaction data. Most previous studies focused on binary-valued transaction data. Transaction data in real-world applications, however, usually consist of quantitative values. This paper, thus, proposes a fuzzy data-mining algorithm for extracting both association rules and membership functions from quantitative transactions. A genetic algorithm (GA)-based framework for finding membership functions suitable for mining problems is proposed. The fitness of each set of membership functions is evaluated by the fuzzy-supports of the linguistic terms in the large 1-itemsets and by the suitability of the derived membership functions. The evaluation by the fuzzy supports of large 1-itemsets is much faster than that when considering all itemsets or interesting association rules. It can also help divide-and-conquer the derivation process of the membership functions for different items. The proposed GA framework, thus, maintains multiple populations, each for one item's membership functions. The final best sets of membership functions in all the populations are then gathered together to be used for mining fuzzy association rules. Experiments are conducted to analyze different fitness functions and set different fitness functions and setting different supports and confidences. Experiments are also conducted to compare the proposed algorithm, the one with uniform fuzzy partition, and the existing one without divide-and-conquer, with results validating the performance of the proposed algorithm.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号