期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

孙序《科技信息》2011,(27):I0045-I0047

最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它直接决定了文本关联规则挖掘算法的效率。本文首先分析了当前在最频繁项集挖掘方面的不足,然后给出了几个命题和推论,紧接着结合最小支持度阈值动态调整策略,提出了一个基于倒排表和集合的TOP-N最频繁项集挖掘IntvSet算法,最后对所提算法进行验证。实验结果表明,该算法的规则有效率和时间性能比常用的两个TOP-N最频繁项集挖掘算法:NApriori算法,IntvMatrix算法都好。相似文献

2.

基于图的挖掘关联规则改进算法

唐德权《湖南文理学院学报(自然科学版)》2006,18(3):72-74,79

关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优. 相似文献

3.

一种快速的频繁项集挖掘算法

王朝辉王婷婷《贵州工业大学学报(自然科学版)》2006,35(6):60-63,69

挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法,所以提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进改进以提高算法的效率。该文提出了一种基于位表的频繁项集挖掘算法,用一种特别的数据结构———位表来压缩数据库以便快速产生候选集和支持计数,实验结果表明;此算法大大减少了遍历的时间,是性能比较好的算法。相似文献

4.

基于两级多支持度的非频繁项集挖掘方法

李刚王洪国董祥军杨越越郭跃斌《郑州大学学报(理学版)》2007,39(4):94-97

现有关联规则挖掘算法都是在频繁项集基础上进行挖掘,关于非频繁项集的资料很少.特别是在研究负关联规则后,非频繁项集因包含重要的负关联规则而变得非常重要.针对这一问题,在多支持度算法的基础上提出了一种新的算法模型,能够在挖掘频繁项集的同时得到非频繁项集,实验结果表明了该算法的有效性. 相似文献

5.

应用个性化推荐的Web日志关联规则挖掘算法研究

邹丽霞《河南科学》2010,28(9):1125-1129

对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间. 相似文献

6.

频繁项集挖掘技术述评

袁鼎荣李波《广西民族大学学报》2005,11(1):86-90

阐述了关联规则挖掘对象事务数据库的特性, 对关联规则挖掘的关键问题频繁项集的几种挖掘方法:Apriori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究,并指出了频繁项集挖掘算法优化的必要途径相似文献

7.

关联规则挖掘算法研究 总被引：5，自引：0，他引：5

周涛陆惠玲《齐齐哈尔大学学报(自然科学版)》2004,20(3):58-62

本文论述了关联规则的基本概念、分类、基于频繁项集思想的关联规则挖掘算法——Apriofi算法，以及在基础上对Apfiofi算法的各种改进算法。然后对基于非频繁项集的各种关联规则挖掘算法，多维多层次挖掘算法思想进行了讨论。最后指出了关联规则挖掘的未来研究方向。相似文献

8.

频繁项集挖掘技术述评

袁鼎荣李波《广西民族大学学报》2005,11(1):86-90

阐述了关联规则挖掘对象事务数据库的特性，对关联规则挖掘的关键问题频繁项集的几种挖掘方法：Aptiori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究，并指出了频繁项集挖掘算法优化的必要途径。相似文献

9.

基于分辨矩阵的关联规则挖掘改进及实现

王培吉赵玉琳白金牛《兰州理工大学学报》2012,38(1):98-101

Apriori算法是关联规则数据挖掘领域中最重要的挖掘方法,针对Apriori算法中挖掘频繁项集的效率问题和产生关联规则的合理性问题,改进相关定义及其使用,并提出改进的Apriori算法,然后将改进算法用于教学评价仿真系统.仿真结果表明,改进算法可高效、合理地挖掘关联规则,为做好课程安排和教学工作提供支持. 相似文献

10.

关联规则挖掘技术在冠心病诊断中的应用

林长方吴扬扬《江南学院学报》2014,(1):60-66

针对传统的关联规则算法挖掘效率低且产生的频繁项集庞大的缺陷,提出一种改进的基于直接频繁闭超项集理论的关联规则挖掘算法。该算法针对候选频繁闭项集具有快速检测闭合性和缩减查找范围的优势,有效地提高了挖掘效率。在冠心病诊断中的应用结果表明,该算法可有效地挖掘冠心病诊疗规则。相似文献

11.

基于Apriori算法的多维关联规则挖掘研究

绳英英闫仁武王加民李佳《科学技术与工程》2009,9(7)

关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率. 相似文献

12.

数据挖掘关联规则Apriori算法的优化 总被引：3，自引：0，他引：3

陈则芝李冬梅《山西大同大学学报(自然科学版)》2008,24(4):35-37

关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能. 相似文献

13.

基于区间映射的约束拓扑关联规则挖掘

方刚熊江吴鸿娟钟静《云南大学学报(自然科学版)》2011,(5):521-526

针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效. 相似文献

14.

改进的关联规则挖掘算法-MIFP-Apriori算法

曾子贤巩青歌张俊《科学技术与工程》2019,19(16):216-220

Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优化策略提出了一种改进的关联规则挖掘算法——MIFP-Apriori算法。实验表明,该算法能够将扫描数据库次数降低到一次,有效解决产生大量冗余候选集的缺陷,提高算法效率。相似文献

15.

快速关联规则挖掘算法 总被引：1，自引：0，他引：1

刘景春《佳木斯大学学报》2004,22(2):151-156,177

提出了一种新颖的关联规则挖掘算法QAIS，与经典两阶段式关联规则挖掘算法不同的是，它只需扫描一遍事务数据库，不需要生成候选集，并且可以方便的应用在增量式关联规则挖掘算法中，该算法经合成数据验证是有效的．同时针对关联规则生成过程中出现大量冗余规则的问题，还讨论了冗余关联规则去除的问题．相似文献

16.

一种高效挖掘关联规则的算法研究

金玮张克君杨炳儒《北京工商大学学报(自然科学版)》2006,24(6):35-39,44

在对经典的关联规则算法进行了分析后,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARM LL.实验结果表明该算法是可行的,并具有较高的效率. 相似文献

17.

一种高效的频集挖掘算法

罗可张学茂《长沙理工大学学报(自然科学版)》2006,3(3):84-90

频集挖掘是关联规则挖掘的关键步骤,它对强规则、相关分析和时间序列有着重要的意义.常用的频集算法包括Apriori和FP-G rowth.为了提高算法效率,提出了一种基于D iffset的混合算法———D iffsetHybrid,该算法根据数据集的稀疏程度决定采用D iffset的某种形式来挖掘频集,减少了存储空间,提高了算法效率.试验表明,该算法对于稀疏数据集和稠密数据集都有良好的计算性能. 相似文献

18.

基于遗传算法和信息熵的文本分类规则抽取方法研究

唐华曾碧卿《中山大学学报(自然科学版)》2007,46(5):18-21,24

针对数据挖掘中的文本分类问题,提出了一种基于遗传算法和信息熵的文本分类规则抽取算法Genet-ic-Miner(简称GM),该算法的目标是在数据集中发现分类规则。首先利用信息熵生成初始种群,然后利用优化的遗传算法抽取相应规则。采用六个标准的公共领域的数据集比较了GM与其它两个非常著名的同类算法Ant-Miner和CN2,实验结果表明,无论是预测准确性和规则的简单性,GM都明显优于Ant-Miner和CN2,并且该算法能大大提高对知识的理解力。相似文献