首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
传统的关联规则Apriori算法中,只要两个k-1维的频繁项集有k-2个元素相同就可以生成维数为k的候选集,但在利用Web访问信息挖掘用户浏览模式发现频繁路径时,效率比较低下,本文利用Apriori算法的思想,对其进行了改进,进行频繁路径挖掘。  相似文献   

2.
分析了基于频繁模式的关联规则算法Fptree,给出了一种基于二进制表示的改进算法,详细介绍了该算法的主要思想,算法实现方案.并通过实例比较了两种算法,证明新算法提高了挖掘规则的效率.  相似文献   

3.
提出一种有效的基于频繁闭项目集的关联规则挖掘算法RIFCI.该算法采用挖掘频繁项目闭集取代传统的频繁项目集,同时在项目集和事务集中展开搜索.通过对UCI机器学习库中10个数据集的测试,与工业标准C4.5比较,错误率低于19.48%,在准确度不变的情况下,生成规则数目低于传统算法,提高了算法的效率.  相似文献   

4.
利用关联规则建立故障与故障表象之间的关系,对故障进行分析和预测是一种重要的故障检测手段.然而普通关联规则具有表达冗余量大和计算复杂的缺点,为此,提出采用频繁闭模式的方法来挖掘故障特征间的关联关系,并以此建立故障分析过程.由于频繁闭模式挖掘剔除冗余复杂,计算量大,在挖掘简洁故障状态关联规则过程中,采用搜索空间提前剪枝的方法直接生成频繁闭模式,避免了保存频繁模式并反复扫描原始数据和过滤候选频繁闭模式的过程.同时整个挖掘结构在挖掘过程中由于不断被删除回收,占用内存会越来越少,最终在枚举出的基于闭模式简洁规则的基础上,建立故障事件转换图,进行故障诊断.实验部分验证了方法的有效性.  相似文献   

5.
姚青山  张春霞 《河南科学》2008,26(3):329-332
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息.  相似文献   

6.
大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难.该文提出一种分布式Web日志挖掘模型DWLMS,并以路径分析技术为例,提出了基于DWLMS的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性.  相似文献   

7.
基于频繁模式树的关联分类规则挖掘算法   总被引:1,自引:1,他引:1  
构建精确而有效的分类器是数据挖掘和机器学习中的一个重要任务.提出了一种基于频繁模式树的关联分类规则挖掘算法,该算法同时考虑所有属性,并对现有关联分类规则挖掘算法中内存要求高、类别属性处理难、I/O访问次数多等问题提出了相应的解决方案.试验结果表明,该方法可以取得比同样基于关联规则的分类算法CMAR更高的执行效率以及基于规则的决策树分类算法C4.5更好的分类效果.  相似文献   

8.
用户访问预测是根据用户的历史访问信息和当前的访问路径预测用户下一步或将来可能访问的页面.因此可以利用预测结果提高服务器的性能,提高缓存的利用率和为用户提供个性化服务.提出了基于Markov链和关联规则的预测模型MAPM(Markov chain and association rule prediction model),该模型首先使用二阶Markov链找到用户下一步或将来可能访问的页面集,生成预测候选集;然后再使用二项关联规则从正向和反向两个角度修正Markov的预测结果,从而生成最后的预测页面.  相似文献   

9.
潘东静 《枣庄师专学报》2001,18(5):15-17,22
本文介绍了关联规则的概念,并通过一个例子说明了关联规则挖掘的一种算法--Apriori算法,指出了数据挖掘未来研究的重点和方向。  相似文献   

10.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

11.
关联规则算法已成为数据挖掘算法中的重要课题。通过对关联规则挖掘算法Apriori进行分析,指出了该算法存在的三个主要问题。在此基础上,提出一种快速算法来压缩数据存储空间,减小时间复杂度。  相似文献   

12.
关联规则挖掘方法自提出以来已有很多改进算法,但均局限于布尔关联规则的挖掘.已有的数量关联规则挖掘主要考虑了连续属性值离散化、最优的数量关联规则挖掘等问题,但存在过小支持度和过小置信度问题.研究了这一问题并提出了一个在频繁2-项集的基础上挖掘数量关联规则的改进算法.它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的关联规则挖掘问题,如带数量的捆绑销售问题.  相似文献   

13.
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响   总被引:9,自引:2,他引:7  
通过对两个有代表性的算法Apriori和FP-Growth的剖析, 说明频集模式挖掘的过程 , 比较有候选项集产生和无候选项集产生算法的特点, 并给出FP-tree结构的构造方法以 及对挖掘关联规则的影响, 提出了对算法的改进方法.  相似文献   

14.
提出了基于数组的关联规则挖掘算法,该算法只扫描一次数据库,将数据库中的数据存于数组中,提高了内存的利用效率,同时也提高了算法效率.  相似文献   

15.
挖掘关联规则Apriori算法的一种改进   总被引:1,自引:0,他引:1  
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

16.
基于时间段的时序规则发现   总被引:1,自引:0,他引:1  
时序规则挖掘用以挖掘数据库中与时间相关的规则及模式.现今大部分时序数据挖掘均是针对基于时间点的,基于时间段的挖掘相对较少.在此提出一个新的基于时间段的时序规则挖掘算法,通过挖掘频繁闭模式集取代完整频繁模式集,减少了挖掘时间,算法效率很高.  相似文献   

17.
有效地进行频繁项挖掘一直以来都是数据挖掘任务中最为重要的组成部分。已有的大部分频繁项挖掘算法在数据项多及支持度低的情况下,算法的效率急剧下降。为了有效地解决此类问题,提出了一种采用双向十字链表结构的频繁项挖掘算法(two-way crossed list for frequent itemsets mining,TCLFI)。极大地降低了搜索空间,加快了频繁项的筛选过程,减少了所需保存的数据项个数,从而降低了时间复杂度,提高了频繁项的挖掘效率。实验通过真实数据集和合成数据集验证了算法的有效性和扩展性。  相似文献   

18.
提高最大频繁项目集挖掘算法的效率是关联规则挖掘研究一个重点领域。本文主要对影响最大频繁项目集挖掘效率的数据分布、搜索策略、支持度计算及剪枝策略等技术进行研究。  相似文献   

19.
针对基于Web日志挖掘的用户访问预测经典算法的不足,提出了基于Markov链和关联规则的预测算法(MAPA).使用二阶Markov链找到用户下一步或将来可能访问的页面集,生成预测候选集;使用二项关联规则从正向和反向2个角度修正Markov的预测结果,从而生成最后的预测页面.通过引入用户反馈机制,提出了带反馈的Markov预测算法(MPAF),即在预测过程中逐步构造历史预测树,把历史预测信息保存到历史预测树中,并根据用户的反馈来判断预测的正确性.在预测过程中,用二阶Markov预测算法生成预测候选集,再利用历史预测信息动态地调整预测算法,从而生成预测页面.理论分析证明,这2种预测算法具有线性时间复杂度的预测效率.实验结果表明,MAPA和MPAF在预测准确率上平均提高5%和10%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号