共查询到20条相似文献,搜索用时 15 毫秒
1.
针对渐进式关联规则挖掘问题提出了一个有效的处理算法,即IDM—A算法。它能根据数据库的动态变化,高效地进行关联规则的更新。通过知识数据库的维护,最多只需要扫描原始数据库一次,就能得到所需的频繁项目集,能有效地降低更新关联规则所需的时间成本。 相似文献
2.
发现最大频繁(项目)集是关联规则挖掘中的重要问题。提出一个基于频繁模式树FP—Tree(Frequent Pattern Tree)的快速发现最大频繁项目集算法MFP—growth(Maximum Frequent Pattern growth),其发现过程中不需要产生候选(项目)集,从而提高了挖掘效率。由实验结果表明,此算法在发现最大频繁项目集方面具有很好的性能。 相似文献
3.
4.
王举辉 《信息技术与信息化》2005,(5):39-40
本文描述了数据挖掘的过程,对关联规则挖掘的核心算法及常用的优化方法进行了研究,最后通过一个例子介绍了关联规则分析在数据挖掘中的应用,并展望了数据挖掘的发展趋势及热点研究. 相似文献
5.
当前是信息爆炸的时代,推荐系统已成为解决当前网络信息超载的有效工具。文章针对网上书店的电子商务网站的销售特点,详细地设计了推荐系统,并利用挖掘技术中的FP-tree关联规则算法实现数据挖掘运算,很好的实现了在线推荐的系统功能。 相似文献
6.
关联规则增量式快速更新方法的研究 总被引:1,自引:2,他引:1
杨君锐 《微电子学与计算机》2004,21(9):120-124
随着最小支持度的不同,就会产生不同的频繁项目集,而频繁项目集的发现又是一个高花费的过程。如何实现不同最小支持度下频繁项目集的更新就显得尤为重要。提出了一种新的增量更新策略,用来解决这一关联规则的高效维护问题。 相似文献
7.
在电力故障发生时,会产生大量的电力故障告警信息数据,如何从电力故障告警信息中挖掘出可靠的关联规则,对后续电力的调度运维有着重要的影响。广义序列模式(Generalized Sequential Pattern,GSP)算法通过增加时间上的约束条件提高算法的效率,适合应用于电力故障告警信息挖掘的场景。针对GSP算法中的关键参数多和不同的参数组合影响算法的准确性和可靠性的问题,将遗传算法与GSP算法相结合,自适应地得到一组较好的参数,将参数代入GSP算法,从而得到更加可靠的关联规则,以此来解决在电力故障告警信息应用中很难为不同的数据集找到合适的参数组合的问题。通过实例验证,电力故障告警信息数据应用遗传算法结合GSP算法能够有效地得到更加准确和可靠的计算结果。 相似文献
8.
在众多不确定因素很强的数据中,如何挖掘数据是非常重要的,这时候关联规则挖掘理论就出现了.因此,在数据挖掘的领域中,关联规则有着突出的研究地位.本文从关联规则的产生背景和相关概念做出了论述. 相似文献
9.
10.
现代社会的高速发展,信息量与日俱增,面对如此巨量的信息,如何才能够从众多信息中提取出有效的信息作为决策支持成为一难题并亟需解决。文中在系统研究数据挖掘相关技术基础上,改进、优化了以往的算法,并将其应用于高校毕业生就业领域之中。 相似文献
11.
数据挖掘中一个重要的问题是从事物数据库中发现关联规则,其中最耗时的操作是候选项集出现频率的计算.实现的并行算法基于Apriori算法的Count Distribution Algorithm基本思想,在机群环境下用DCOM方式实现求解频繁项集的并行算法.实验结果表明,该并行算法能充分利用各节点机上CPU的资源,提高程序的运行效率,利用DCOM技术能够方便、有效地实现并行算法. 相似文献
12.
频繁模式树算法是一种优秀的关联规则挖掘算法.频繁模式树算法的挖掘对象是水平数据分布的数据库,现实中有大量数据垂直分布的数据库不能直接应用频繁模式树算法进行挖掘.本文针对垂直数据分布的数据库,提出一种有效的频繁模式树生长算法,只需两次数据库扫描,即可生成相应的频繁模式树. 相似文献
13.
网络的迅速发展使得网络流量越来越大,这对于网络管理员的网络分析工作提出新的挑战.数据挖掘是可以从海量数据中挖掘出有意义的、无法通过一般的查询统计得到的数据模式的过程.文中对关联规则的相关概念和Apriori算法进行了分析,阐述了如何运用Apriori算法对网络数据集进行挖掘的过程,详细介绍了进行数据预处理、字段编码的方法,并在设置合适的支持度进行挖掘方面作了探论. 相似文献
14.
针对自动从文档中导出关键词/词条之间的关联性问题,在研究加权挖掘算法和向量空间模型中权值特点的基础上,提出了一种新的矩阵加权关联规则挖掘算法。 相似文献
15.
数据挖掘就是从大量的数据中挖掘出有用的信息。数据挖掘与传统的数据分析的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。文章分析了数据挖掘算法的关联规则特性,对其在股票市场中的应用进行了重点,以便更好的应用在更多的领域。 相似文献
16.
17.
挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP—tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递候选最大频繁项目集的方法。实验表明该算法是有效的并行算法。 相似文献
18.
基于关联规则的特征选择方法 总被引:2,自引:0,他引:2
提出了一种基于关联规则的特征选择方法,在市场分析中,人们用关联规则来发掘大量数据集中项目之间的关系。关联规则的方法非常适用于图像分析中的特征选择,可以自动地选出可信度较高的特征。使用这一方法挑选合适的纹理特征用于图像分类,并对结果进行分析。 相似文献
19.
关联规则分析作为数据挖掘的主要手段之一,在发现海量事务数据中隐含的有价值信息方面具有重要的作用。该文针对Apriori 算法的固有缺陷,提出了AWP (Apriori With Prejudging) 算法。该算法在Apriori 算法连接、剪枝的基础上,添加了预判筛选的步骤,使用先验概率对候选频繁k项集集合进行缩减优化,并且引入阻尼因子和补偿因子对预判筛选产生的误差进行修正,简化了挖掘频繁项集的操作过程。实验证明AWP算法能够有效减少扫描数据库的次数,降低算法的运行时间。 相似文献
20.
单维关联规则快速Apriori算法研究 总被引:5,自引:3,他引:2
文章通过Apriori和Apriori Tid算法结合生成局部频繁项集,改进了Apriori算法运行速度过慢的问题.再通过程序优化进一步提高了算法运行速度.得到了快速Apriori算法。 相似文献