首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 505 毫秒
1.
文中研究一种如何有效挖掘含有未知数值属性的多属性数据关联规则方法。对FPL算法进行了改进,扫描一次数据库,就可以找出所有频繁项集,且当最小支持度变动时,不需重新构建FPL,能快速找出所有频繁项集。  相似文献   

2.
基于频繁概念格的电子病历关联规则挖掘研究   总被引:3,自引:0,他引:3  
提出了一种基于频繁概念格的FC Lattice电子病历关联规则挖掘算法,该算法在渐进式建格的同时能发现最大频繁项集和提取相应关联规则,并进行基于FC Lattice算法的电子病历挖掘相关实验,结果表明该算法在运行速度和挖掘性能上都是高效的.  相似文献   

3.
基于数据挖掘的电网故障关联性分析与研究   总被引:1,自引:1,他引:0  
将数据挖掘技术中的关联规则应用到电网故障分析中,从故障数据中发现分类属性与决策属性间的频繁模式、相关性或因果关系,以便从宏观上把握电网故障元素间的关联特性.讨论了关联规则应用于电网故障分析的体系结构及实现的具体步骤,重点对电网故障关联性分析中的频繁项挖掘算法进行了研究,对传统的Apriori算法进行了改进,提出了一种高效的基于数组的类频繁项集挖掘算法.  相似文献   

4.
《现代电子技术》2019,(19):90-94
传统Apriori挖掘算法需多次扫描数据库、多次连接频繁项集,导致挖掘效率较低,为此对Apriori挖掘算法加以改进,设计一种新的Apriori挖掘算法用于音乐节目分类。改进的Apriori挖掘算法采用莱特准则对音频数据进行野值与噪声平滑处理,改进Apriori挖掘算法的音频数据库映射令两个线性表分别负责音频数据存储和对应项存储,音频数据库扫描次数降为一次;改进Apriori挖掘算法的连接次数无需对不具备交运算能力的元素进行交运算操作,减少频繁项集连接次数。基于改进频繁项集Apriori挖掘算法挖掘频繁项集、生成音频数据关联规则,基于关联规则集构建分类器,实现音乐节目分类。实验结果显示,改进Apriori挖掘算法用于音乐节目分类的效率优势突出,准确度高。  相似文献   

5.
关联规则的开采是数据挖掘中的一个重要问题,其核心是频繁模式挖掘。频繁模式挖掘算法的高效率性近年来是许多学者研究的方向。首先对关联规则挖掘问题进行了描述,其次对一种基于项目可辨识向量及其“与”运算设计的频繁项集快速挖掘算法SLIG进行了分析,最后利用二元关系矩阵及其项之间的二元关系数目,缩减候选频繁k项集的产生,提出了改进算法SLIG*,提高了SLIG算法的效率。  相似文献   

6.
刘波  潘久辉 《电子学报》2007,35(8):1612-1616
关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁模式图MP-graph,按照深度优先搜索方法,动态挖掘频繁谓词集,只需扫描数据库一次.此外,该方法至多增加一次数据库扫描,就能扩展为IMPG算法,进行增量关联规则挖掘.文章分析了算法时间和空间性能,用实验说明了算法的有效性.  相似文献   

7.
《信息技术》2017,(5):110-116
以模糊集成联机分析处理(On-Line Analytical Processing,OLAP)为基础对关联规则挖掘算法进行改进,该算法为多维联机研究提供一种关联规则计算架构。基于模糊数据立方体的知识发现,为用户提供灵活的多维数据层次抽象模式。在多维数据集的多维属性处理中,引入模糊数据立方体作为问题措施补充,并利用不同层次的模糊关联规则构造模糊数据立方体,然后利用权重和多层次的概念构建模糊加权多层次关联规则。最后,通过对所提算法在合成数据集以及2000年中国人口普查的数据仿真测试,验证了基于OLAP的挖掘方法要比离散关联规则挖掘方法、单独支持阈值关联规则及最小挖掘项集关联规则三种对比算法,在最小支持度、置信度、权重均值等指标上,性能更加优异。  相似文献   

8.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

9.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。  相似文献   

10.
提出了一种有效的多维多层关联规则增量更新算法(EARIU),对商品信息进行概念分层,把用户属性作为维信息,放入FP树中进行挖掘,使挖掘得到的关联规则有更多有趣信息,根据购买数量对支持度闻值进行调整,利用新增记录对原有项/维集的影响的本质特性,更新原有和挖掘新增数据库的频繁项/维集.  相似文献   

11.
At present, most of the association rules algorithms are based on the Boolean attribute and single-level association rules mining. But data of the real world has various types, the multi-level and quantitative attributes are got more and more attention. And the most important step is to mine frequent sets. In this paper, we propose an algorithm that is called fuzzy multiple-level association (FMA) rules to mine frequent sets. It is based on the improved Eclat algorithm that is different to many researchers’ proposed algorithms that used the Apriori algorithm. We analyze quantitative data’s frequent sets by using the fuzzy theory, dividing the hierarchy of concept and softening the boundary of attributes’ values and frequency. In this paper, we use the vertical-style data and the improved Eclat algorithm to describe the proposed method, we use this algorithm to analyze the data of Beijing logistics route. Experiments show that the algorithm has a good performance, it has better effectiveness and high efficiency.  相似文献   

12.
Rule mining was an important research content of data mining,and it was also a hot research topic in the fields of decision support system,artificial intelligence,recommendation system,etc,where attribute reduction and minimal rule set extraction were the key links.Most importantly,the efficiency of extraction was determined by its application.The rough set model and granular computing theory were applied to the decision rule reduction.The decision table was granulated by granulation function,the grain of membership and the concept granular set construction algorithm gener-ated the initial concept granular set.Therefore,attribute reduction could be realized by the distinguish operator of concept granule,and decision rules extraction could be achieved by visualization of concept granule lattice.Experimental result shows that the method is easier to be applied to computer programming and it is more efficient and practical than the existing methods.  相似文献   

13.
The mining of association rules is one of the primary methods used in telecommunication alarm correlation analysis,of which the alarm databases are very large.The efficiency of the algorithms plays an important role in tackling with large datasets. The classical frequent pattern growth(FP-growth) algorithm can produce a large number of conditional pattern trees which made it difficult to mine association rules in are telecommunication environment.In this paper,an algorithm based on layered frequent pattern tree(LFP-tree) is proposed for mining frequent patterns. Efficiency of this alagorithm is achieved with following techniques:1) All the frequent patterns are condensed into a layered structure,which can save memory time but also be very useful for updating the alarm databases.2) Each alarm item can be viewed as a triple,in which t is a Boolean vaviable that shows the item frequent or not.3) Deleting infrequent items with dynamic pruning can avoid produce conditional pattern sets. Simulation and analysis of algorithm show that it is a valid method with better time and space efficiency,which is adapted to mine association rules in telecommunication alarm correlation analysis.  相似文献   

14.
电信网络中各种频繁告警事件的发生通常具有一定的时序关系,据此提出了一种具有时序特征的告警关联挖掘算法。该方法解决了以往算法中无法发现告警序列之间时序关系的问题。其核心思想是在建立FP-tree时加入告警的时间特征,然后对FP-tree进行挖掘。实验证明,该算法能够快速、准确地从海量数据中挖掘出具有时序特征地关联规则。  相似文献   

15.
关联规则在电子商务推荐系统中的应用   总被引:1,自引:0,他引:1  
王江伟  郭民 《现代电子技术》2011,34(19):179-182
以数据挖掘中的关联规则为基础,深入研究了基于关联规则的个性化推荐技术在电子商务中的应用,提出了电子商务推荐系统的体系结构,并对系统涉及到的关键技术进行了详细的描述.系统采用FP-Growth算法进行关联规则的挖掘,紧紧结合了数据库技术的优势,对当前电子商务系统中大量复杂的数据具有很好的适应性.  相似文献   

16.
基于频繁集的多层次交互式关联规则挖掘   总被引:2,自引:1,他引:1  
文章研究了一种知识发现与数据挖掘中关联规则的发现方法,针对现有大型超市销售事务数据库,提出了一种新的多层次信息获得取方法。运用关联规则挖掘所产生的频繁集对数据压缩表示,并给出了按用户的实际需求交互式挖掘感兴趣关联规则的算法。该算法在挖掘速度和效率上有较大提高。  相似文献   

17.
Liao  Jiyong  Wu  Sheng  Liu  Ailian 《Wireless Personal Communications》2021,116(3):1639-1657

High utility itemsets mining has become a hot research topic in association rules mining. But many algorithms directly mine datasets, and there is a problem on dense datasets, that is, too many itemsets stored in each transaction. In the process of mining association rules, it takes a lot of storage space and affects the running efficiency of the algorithm. In the existing algorithms, there is a lack of efficient itemset mining algorithms for dense datasets. Aiming at this problem, a high utility itemsets mining algorithm based on divide-and-conquer strategy is proposed. Using the improved silhouette coefficient to select the best K-means cluster number, the datasets are divided into many smaller subclasses. Then, the association rules mining is performed by Boolean matrix compression operation on each subclass, and iteratively merge them to get the final mining results. We also analyze the time complexity of our method and Apriori algorithm. Finally, experimental results on several well-known real world datasets are conducted to show that the improved algorithm performs faster and consumes less memory on dense datasets, which can effectively improve the computational efficiency of the algorithm.

  相似文献   

18.
粗糙集和概念格是两种不同的知识发现和数据挖掘有效工具,已被广泛应用于许多领域。在对粗糙集和概念格基本理论研究基础上,提出了利用扩展粗糙集模型对概念格近似使其得以改进,即在概念格中引入β-多数蕴涵关系实现概念格中结点近似合并以及近似概念格(ACL)的构建,由此提出概念格粗糙近似和规则挖掘算法(LCRA)。最后通过UCI机器学习数据库相关测试表明该算法的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号