共查询到17条相似文献,搜索用时 62 毫秒
1.
提出了两种在多粒度时间下的部分周期挖掘算法。第1种算法利用模式的父子关系、支持度和置信度阈值裁剪候选模式集。第2种算法对每个输入寻找覆盖它的周期模式,由此来计算模式的支持度和置信度。实验表明了提出的算法在多粒度时问下挖掘部分周期是有效的。 相似文献
2.
3.
时间的描述和划分是时态数据采掘中一个非常重要的方面,针对目前时态数据采掘中缺少对多粒度时间等的研究的现状,提出了多粒度时间,粒度转换,时态序等的严格数学定义,并研究和证明了它们的相关性质.以此为基础引出了一个多粒度时间部分周期模型,对模型的支持度和置信度等性质进行了详细讨论,并将多粒度时间下的部分周期模型运用到股票数据实验中,实验表明所提出的模型对于研究时态数据采掘具有重要意义. 相似文献
4.
5.
6.
研究一类在多粒度时间下单事件同属性不同状态之间有一定关联的近似周期规律挖掘问题。给出了多粒度近似周期关联规则模型形式化的数学定义和性质,构造了相关模型,提出了利用聚类算法挖掘周期模式并应用于股票数据进行实验,实验结果表明算法是有效的。 相似文献
7.
8.
现有的时间序列异步周期模式挖掘方法是在获取1-pattern有效段及周期的基础上再以枚举法得到i-patterns,时间复杂度较高。为解决该问题,提出一种改进的异步周期模式挖掘方法。在时间序列符号化后,使用基于Sequitur的候选模式算法获取候选i-patterns及其事件位置序列,通过基于OEOP的i-patterns有效段生成算法得到1-pattern和i-patterns的有效段及周期,从而生成有效子序列。实验结果表明,该方法具有较高的挖掘效率。 相似文献
9.
为克服已有时序数据周期模式挖掘算法中限制过多过严的问题。提出一种可以应用于弱限制的、不需要给出目标模式或周期长度的、借鉴蚁群算法思想的用于时序数据周期模式的挖掘算法,使得需要验证的怀疑周期消减,算法效率提高。 相似文献
10.
针对动态时序数据部分周期模式挖掘过程存在的计算复杂度过高和扩展性差等问题,提出了一种结合多尺度理论的时间序列部分周期模式挖掘算法(MSI-PPPGrowth),所提算法充分利用了时序数据客观存在的时间多尺度特性,将多尺度理论引入时序数据的部分周期模式挖掘过程。首先,将尺度划分后的原始数据以及增量时序数据作为更细粒度的基准尺度数据集进行独立挖掘;然后,利用不同尺度数据间的相关性实现尺度转换,以间接获取动态更新后的数据集对应的全局频繁模式,从而避免了原始数据集的重复扫描和树结构的不断调整。其中,基于克里金法并考虑时序周期性设计了一个新的频繁缺失计数估计模型(PJK-EstimateCount),以有效估计在尺度转换过程中的缺失项支持度计数。实验结果表明,MSI-PPPGrowth具有良好的可扩展性和实时性,尤其是对于稠密数据集,其性能优势更为突出。 相似文献
11.
基于时间衰减模型的数据流频繁模式挖掘 总被引:1,自引:0,他引:1
频繁模式挖掘是数据流挖掘中的重要研究课题. 针对数据流的时效性和流中心的偏移性特点, 提出了界标窗口模型与时间衰减模型相结合的数据流频繁模式挖掘算法. 该算法通过动态构建全局模式树, 利用时间指数衰减函数对模式树中各模式的支持数进行统计, 以此刻画界标窗口内模式的频繁程度; 进而, 为有效降低空间开销, 设计了剪枝阈值函数, 用于对预期难以成长为频繁的模式及时从全局树中剪除. 本文对出现在算法中的重要参数和阈值进行了深入分析. 一系列实验表明, 与现有同类算法MSW相比, 该算法挖掘精度高(平均超过90%), 内存开销小, 速度上可以满足高速数据流的处理要求, 且可以适应不同事务数量、不同事务平均长度和不同最大潜在频繁模式平均长度的数据流频繁模式挖掘. 相似文献
12.
13.
高效隐私保护频繁模式挖掘算法研究 总被引:1,自引:0,他引:1
阐述了隐私保护数据挖掘的目标,即在获取有效的数据挖掘结果的同时,满足用户对隐私保护的要求.针对个体用户及组织用户的隐私保护,论述了不同的方法,并归纳出隐私保护数据挖掘中所采用的两种主流算法.改进了高效隐私保护关联规则挖掘算法(EMASK)中需要完全的数据库扫描并且进行多次比较操作的弊端,提出了基于粒度计算的高效隐私保护频繁模式挖掘算法(BEMASK).该算法将关系数据表转换成面向机器的关系模型,数据处理被转换成粒度计算的方式,计算频繁项集变成了计算基本颗粒的交集.特别是数据的垂直Bitmap表示,在保证准确性不降低的情况下,一方面减少了I/O操作的次数,另一方面较大地提高了效率. 相似文献
14.
15.
在多维时态近似周期模型的基础上,提出了一种基于时态数据库技术和层次聚类技术的多维时态近似周期挖掘算法,并应用于股票数据。实验表明此算法是有效的。 相似文献
16.
17.
Qinghua Zou Wesley Chu David Johnson Henry Chiu 《Knowledge and Information Systems》2002,4(4):466-482
Efficient algorithms to mine frequent patterns are crucial to many tasks in data mining. Since the Apriori algorithm was
proposed in 1994, there have been several methods proposed to improve its performance. However, most still adopt its candidate
set generation-and-test approach. In addition, many methods do not generate all frequent patterns, making them inadequate
to derive association rules. We propose a pattern decomposition (PD) algorithm that can significantly reduce the size of the
dataset on each pass, making it more efficient to mine all frequent patterns in a large dataset. The proposed algorithm avoids
the costly process of candidate set generation and saves time by reducing the size of the dataset. Our empirical evaluation
shows that the algorithm outperforms Apriori by one order of magnitude and is faster than FP-tree algorithm.
Received 14 May 2001 / Revised 5 September 2001 / Accepted in revised form 26 October 2001
Correspondence and offprint requests to: Qinghua Zou, Department of Computer Science, California University–Los Angeles, CA 90095, USA. Email: zou@cs.ucla.eduau 相似文献