首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
《信息技术》2016,(5):144-146
面对不断增长的数据量,企业需要的是对数据的实时分析和挖掘,以更快的速度和更精确的预测分析结果支持商业决策。基于Chameleon聚类算法和FP-growth关联规则挖掘算法,通过对原始数据的聚类操作,化简数据,在此基础上进行关联规则挖掘。实验证明,当数据日渐庞大时,不仅速度快,节省内存空间,而且达到很好的预测效果。  相似文献   

2.
本文提出了改进关联挖掘算法的数据挖掘方式.在自然连接产生候选集以前,先进行一个修剪过程,减少参加连接的项集数量,进而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数,避免传统方法的弊端.仿真实验证明,这种改进算法能够大幅提高数据的查询速度,取得很好的效果.  相似文献   

3.
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。  相似文献   

4.
给出一种基于遗传算法和蚂蚁算法相结合的多维多层关联规则挖掘算法,新算法利用了遗传和蚂蚁算法共有的良好全局搜索能力,并克服了经典频集算法的不足,以及遗传算法局部搜索能力弱和蚂蚁算法搜索速度慢的缺陷.实验结果表明,新算法在对具有稀疏特性的多维关联规则的挖掘中体现了良好的性能,提高了生成关联规则的有效性.  相似文献   

5.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

6.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。  相似文献   

7.
通过对数据挖掘中聚类技术和关联规则挖掘技术的多种算法进行比较研究,提出了基于聚类的关联规则挖掘算法,阐明了具体聚类方法选择的依据,详述了该算法的实现过程,并利用该算法挖掘出校园卡用户消费行为之间简单的关联规则.  相似文献   

8.
文章提出了一种基于关联规则挖掘的关联检索建议模型。该模型提供关联关键词建议服务,引导用户进行有效检索。同时模型在用户检索兴趣分析和图书采购中也起到决策支持作用。  相似文献   

9.
关联规则反映了大量数据中项集之间的相互依存性和关联性,Apriori算法是关联规则挖掘中的经典算法。本文利用关联规则的Apriori算法对校园物资管理系统中的数据进行了挖掘,找出物品潜在的频繁集以达到提高工作效率的目的。  相似文献   

10.
随着网络攻击数量和种类的不断增加,基于蜜罐(Honeypot)系统的海量攻击日志分析变得更加困难和耗时。仅仅凭借一个事件推断黑客意图和行为是非常困难的。这就要求在蜜罐系统的研究中进行整体性分析,数据挖掘技术就是这样的整体性分析工具。首先阐述了蜜罐系统的原理,然后以开源蜜罐系统Honeyd捕获的真实日志数据为例,使用关联规则挖掘先验(Apriori)算法对日志的特定属性进行分析,找出不同网络连接记录属性之间的关联规则,从中发现并理解攻击者的攻击行为和攻击模式,验证了数据挖掘技术应用于蜜罐日志分析中的可行性。  相似文献   

11.
提出了一种基于关联规则二进制数组密集树的数据挖掘算法——BSC-tree算法,该算法将传统的交易数据库简化成二进制序列;其次在此基础上构造出BSC-trees,作为数据挖掘的准备条件,并由此求出BSC-trees的所有路径码,进而通过BSC-trees路径码间的逻辑与运算,他一次只需扫描整个数据库就能够快速地求出所有的关联规则。并将该算法用于交通事故历史数据的挖掘,他能够提取隐含在交通事故中未知的有用信息,为分析交通事故中各种诱因提供辅助性的决策。试验结果表明该算法优于其他算法。  相似文献   

12.
At present, most of the association rules algorithms are based on the Boolean attribute and single-level association rules mining. But data of the real world has various types, the multi-level and quantitative attributes are got more and more attention. And the most important step is to mine frequent sets. In this paper, we propose an algorithm that is called fuzzy multiple-level association (FMA) rules to mine frequent sets. It is based on the improved Eclat algorithm that is different to many researchers’ proposed algorithms that used the Apriori algorithm. We analyze quantitative data’s frequent sets by using the fuzzy theory, dividing the hierarchy of concept and softening the boundary of attributes’ values and frequency. In this paper, we use the vertical-style data and the improved Eclat algorithm to describe the proposed method, we use this algorithm to analyze the data of Beijing logistics route. Experiments show that the algorithm has a good performance, it has better effectiveness and high efficiency.  相似文献   

13.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。  相似文献   

14.
数据挖掘技术已经在入侵检测当中得到应用。为了进一步提高效率。提出将井行关联规则应用到入侵检测的挖掘中,以提高入侵检测的效率。本文提出一个新的分布式的入侵检测系统结构,重点介绍了井行关联规则挖掘算法如何应用于此系统.及其应用于此系统之后的优点。  相似文献   

15.
遗传算法在Web关联挖掘中的应用研究   总被引:2,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

16.
本文介绍了软件质量平台中关联规则挖掘的应用,利用关联规则挖掘的原理,将其运用到软件开发过程中,依据大量的客观数据来支持关联规律,提高规律的可信度。根据规模、配置申请、风险问题、错误缺陷、小组士气、任务进度六种属性来测量关联规则。  相似文献   

17.
关联规则挖掘是数据挖掘和知识发现中一门重要技术,但基于支持度-置信度框架的关联规则挖掘存在一些问题。文章引入了双向关联规则的概念,实现了基于遗传算法的双向关联规则挖掘算法。实验证明,它能弥补传统关联规则挖掘算法的不足。  相似文献   

18.
基于关联规则的数据挖掘系统实现及应用   总被引:9,自引:1,他引:9  
文章首先介绍了数据挖掘的基本概念和主要过程,接着描述了一个基于关联规则的数据挖掘工具,讨论了系统的结构、特点和功能,包括数据转换、概念层次泛化、包含负项的关联规则挖掘及系统的二次开发接口,最后对一个应用工具的实例企业客户资源分析器模型及一些相关的问题进行了讨论。  相似文献   

19.
基于项集特性的关联规则挖掘中Apriori算法的改进   总被引:2,自引:0,他引:2  
提出一个改进Apriori的算法IApr,利用事务数据库的事务数相对于项集的项的个数而言要大得多这一特点,采用线性存储结构,并结合推出并证明的项集特性,考虑候选频繁项目集的各个项的应满足的条件,只需扫描一次事务数据库,有效减少了生成候选频繁项集的数目,从数据扫描量、搜索空间、时间复杂度上分析都提高了算法效率。  相似文献   

20.
挖掘关联规则中对Apriori算法的一个改进   总被引:12,自引:6,他引:12  
文章针对关联规则中的Apriori算法进行了深入研究,提出了Apriori-I算法。由于这个算法只需要对交易数据库进行一次搜索。能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则算法相比具有快速的优点.适用于大型交易数据库。使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号