首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 641 毫秒
1.
在并发序列模式挖掘基础上进一步挖掘偏序关系模式,讨论相关度、有序度、有序关系序列、偏序关系和偏序关系模式等概念,给出基于并发序列模式的偏序模式挖掘方法,该方法利用并发和偏序之间的联系,应用并发与偏序之间的包含关系,有效的在并发序列模式的基础上得到偏序关系模式.  相似文献   

2.
基于序列模式图可以定义某些结构化的新知识,如分支模式、重复模式以及它们的组合——结构模式.在基于事件的数据或序列数据中发现结构模式是后序列模式挖掘的任务.基于Apriori算法思想,介绍结构模式的主要形式——并发分支模式及其挖掘算法,并通过示例解释挖掘算法的实现过程.该算法的基本思想是在粗并发分支模式的基础上生成并发分支模式,在并发分支模式生成过程中采用自底向上的方法.基于Apriori的并发分支模式挖掘算法的提出为进一步挖掘结构模式提供了重要的理论支持.  相似文献   

3.
序列挖掘算法产生冗余序列,造成其运行时间过长.对此,提出了一种新的闭合序列挖掘算法——时序关系下的闭合序列模式挖掘算法.依据闭合序列模式的性质,通过比较频繁序列与每个1-项频繁序列之间的时序关系,推断频繁序列模式是否可扩展.基于IBM公司的合成数据,将其与闭合序列模式挖掘算法进行比较,实验结果表明,这种新的闭合序列挖掘算法可以有效降低运行时间且不易受到属性值个数的影响.  相似文献   

4.
序列模式挖掘是数据挖掘的一个重要领域,在序列挖掘的基础上有了结构关系模式的概念,重点研究结构关系模式的一个重要分支——互斥关系模式.首先给出互斥关系模式的定义,然后讨论什么是负关联规则挖掘及其与互斥关系模式之间的联系与区别,从而得到互斥关系模式挖掘的过程;给出互斥关系模式挖掘过程采用的主要算法,并针对算法进行设计与实现,实验证明算法正确有效.  相似文献   

5.
序列模式挖掘是数据挖掘中的一个重要研究方向,对序列模式挖掘中的4种算法(AprioriAll、 GSP、 FreeSpan 、Prefixspan)的执行过程及其特点进行了研究,并对这几种算法的时空执行效率进行了定性和定量的分析比较,指出了4种算法各自的适用范围,得出的结果对序列模式挖掘系统的设计具有一定的参考价值。  相似文献   

6.
与布尔型数据的频繁模式挖掘相比,时间序列的频繁模式挖掘是一个相对复杂的问题,目前对此类问题还缺少深入的研究.通过对小波滤波的研究,提出了一种时间序列的频繁模式挖掘算法,Frequent-Wavelet算法.该算法的特点是采用多孔平滑滤波器组对时间序列做低通平滑处理,用得到的多个尺度序列表示原序列,较好地解决了时间序列的平凡相似问题和时间轴伸缩问题.实验表明,Frequent-Wavelet算法对于时间序列的频繁模式挖掘具有较好的效果.  相似文献   

7.
序列模式挖掘算法多是利用了关联规则挖掘中的 Apriori特性 .利用灰关联方法对原始序列 进行净化处理 ,从而减少挖掘算法中的噪声数据 . 其理论依据在于 ,如果一个序列是频繁的 ,那么该序列的时间间隔也必然是频繁的. 利用了灰关联分析方法找出两个项之间的频繁时间间隔 ,再利用该间隔扫描事务序列数据库 ,从而最终找出频繁序列 .  相似文献   

8.
在前期研究工作的基础上,研究在单序列中序列模式的概念,讨论了相关的性质,这些概念和性质与多序列情况有很大的不同.在此基础上给出了在单序列中基于滑动窗口概念挖掘序列模式的方法及相关算法,为进一步研究序列模式及其挖掘算法提供了一定的理论基础.  相似文献   

9.
序列模式挖掘在网络告警分析中的应用   总被引:2,自引:0,他引:2  
序列模式挖掘可以用来有效地发现网络系统中的告警关联知识.论文研究了序列模式挖掘在网络告警分析中的具体应用.首先,将挖掘过程分成了特定设备告警序列挖掘、同类设备告警序列挖掘和互联设备告警序列挖掘等3类,根据不同的用户意图来有效地确定挖掘范围,避免对无关数据的访问.为了进一步提高挖掘算法的执行效率,又提出了用于描述网络拓扑信息的拓扑约束,并设计了基于拓扑约束的互联设备告警序列模式挖掘算法.  相似文献   

10.
通过论述数据挖掘和序列模式关联规则的概念及作用,对序列模式关联规则的挖掘算法进行研究,以100期彩票开奖结果为挖掘对象,从中找出各个号码的最长序列模式,并对算法进行实现。  相似文献   

11.
增加交易时序列模式的维护   总被引:3,自引:0,他引:3  
挖掘序列模式是数据挖掘的主要内容之一,目前已有许多序列模式模型和相应的挖掘算法。本文讨论了在交易数据库中增加新的交易时,发现序列模式的维护问题,并提出了一种有效的维护算法- 增量更新算法。  相似文献   

12.
针对序列模式挖掘进行探索,通过对项目加权体现项目的重要性,进而实现序列的加权;加权后,频繁序列的子序列不一定频繁,因此提出序列的最小加权支持概念,并由此提出了加权序列模式挖掘算法MWSP。仿真实验结果表明,与同类算法WSpan比较,MWSP算法更能体现序列的重要性。  相似文献   

13.
基于深度报文检测的网络流量识别方法因其识别准确率高在现有网络流量识别设备中应用广泛,但其识别特征的自动提取存在困难.提出了基于PrefixSpan算法的连续序列模式挖掘算法,在连续序列和偏移属性约束下,引入跨度策略,在网络流量中自动提取同一网络协议或应用的应用层签名特征.实验结果表明,该算法减小了投影数据库的规模,具有良好的时间性能,挖掘的应用层签名特征规模小,可有效地应用于网络流量识别.  相似文献   

14.
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan 算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(Prefix of First Position on BitMap)表用于记录序列中的每个项在位图中第1次出现的位置.实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更好地挖掘出序列模式.  相似文献   

15.
分析了序列模式图构造算法的效率,采用实际开发工具具体予以实现,并对实验结果进行分析.序列模式图构造算法的实现对基于序列模式图进行进一步的挖掘有重要意义.  相似文献   

16.
大量的候选项集是挖掘路径遍历模式中的主要问题.针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈.另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小.实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号