首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
研究时态数据库中多粒度时间下的近似周期的挖掘问题。在多粒度时间、多粒度时问格式的基础上引入多粒度时间间隔的定义以及相关性质,构造多粒度近似周期模型,提出一个基于SOM聚类的多粒度近似周期的挖掘算法。利用高频股票数据580000宝钢JBT1进行实验,证明了该算法的有效性。  相似文献   

2.
研究一类在多粒度时间下单事件同属性不同状态之间有一定关联的近似周期规律挖掘问题。给出了多粒度近似周期关联规则模型形式化的数学定义和性质,构造了相关模型,提出了利用聚类算法挖掘周期模式并应用于股票数据进行实验,实验结果表明算法是有效的。  相似文献   

3.
孟志青  楼婷渊  胡强 《计算机科学》2013,40(Z11):251-254,262
大规模文本数据挖掘是大数据分析的重要分支,也是近年来的一个研究热点。研究了多粒度时间文本数据周期模式挖掘算法,首先提出了时间粒度转换、多粒度时间间隔等概念,然后建立了文本数据的周期模型,给出了一个多粒度时间文本下的周期模式挖掘算法,最后对大量病毒文本文献数据进行了实验,表明了提出的算法可以挖掘一些有效的周期模式,讨论了周期宽松度对支持度和置信度的影响。该研究为大文本数据分析提供了一种新的方法。  相似文献   

4.
程昱  古华茂 《计算机工程》2005,31(24):93-95
提出了两种在多粒度时间下的部分周期挖掘算法。第1种算法利用模式的父子关系、支持度和置信度阈值裁剪候选模式集。第2种算法对每个输入寻找覆盖它的周期模式,由此来计算模式的支持度和置信度。实验表明了提出的算法在多粒度时问下挖掘部分周期是有效的。  相似文献   

5.
孟慧丽  马媛媛  徐久成 《计算机科学》2016,43(2):83-85, 104
将下近似分布约简引入变精度悲观多粒度粗糙集,定义了变精度悲观多粒度粗糙集的下近似分布粒度熵,基于下近似分布粒度熵定义了变精度悲观多粒度粗糙集粒度的重要度,并设计了基于下近似分布粒度熵的悲观多粒度粗糙集启发式粒度约简算法,通过实例验证了算法的有效性。  相似文献   

6.
挖掘多粒度时间下异步周期的模式   总被引:1,自引:0,他引:1  
夏卓群  程昱  梁涤青 《计算机应用》2006,26(12):2985-2987
把异步周期和多时间粒度下的时态模型结合起来研究,并利用异步周期的特点提出了一种有效的挖掘算法。算法先找到所有的有效时间节,再通过有效时间节求出最长的有效时间段。实验表明所提出的算法是稳定而有效的。  相似文献   

7.
研究了时态近似周期的挖掘问题,提出了近似周期模式,引进了近似精度、近似周期模式覆盖等概念及性质,提出了一个基于SOM (自组织特征映射)聚类来寻找近似周期模式的算法,实验表明算法是有效的。  相似文献   

8.
基于多粒度树模型的Web站点描述及挖掘算法   总被引:2,自引:0,他引:2  
田永鸿  黄铁军  高文 《软件学报》2004,15(9):1393-1404
随着Web所拥有的信息量和信息种类的急剧增长,Web站点挖掘对于自动实现特定主题的Web资源发现和分类具有重要的意义.然而现有的Web站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入研究.从站点的采样尺寸、分析粒度和描述结构3个方面分析了设计高效的Web站点挖掘算法所需要解决的问题.在此基础上,提出了一种新的Web站点多粒度树描述模型,并描述了包括基于隐Markov树的两阶段分类算法、粒度间上下文融合算法、两阶段去噪程序以及基于熵的动态剪枝策略在内的多粒度Web站点挖掘算法.站点的多粒度描述方法及挖掘算法为多站点查询优化、Web效用挖掘等的深入研究奠定了基础.实验表明,该算法相对于基线系统平均可以提高16%的分类准确率,并减少了34.5%的处理时间.  相似文献   

9.
在多维时态近似周期模型的基础上,提出了一种基于时态数据库技术和层次聚类技术的多维时态近似周期挖掘算法,并应用于股票数据.实验表明此算法是有效的.  相似文献   

10.
在多维时态近似周期模型的基础上,提出了一种基于时态数据库技术和层次聚类技术的多维时态近似周期挖掘算法,并应用于股票数据。实验表明此算法是有效的。  相似文献   

11.
现有的时间序列异步周期模式挖掘方法是在获取1-pattern有效段及周期的基础上再以枚举法得到i-patterns,时间复杂度较高。为解决该问题,提出一种改进的异步周期模式挖掘方法。在时间序列符号化后,使用基于Sequitur的候选模式算法获取候选i-patterns及其事件位置序列,通过基于OEOP的i-patterns有效段生成算法得到1-pattern和i-patterns的有效段及周期,从而生成有效子序列。实验结果表明,该方法具有较高的挖掘效率。  相似文献   

12.
序列模式挖掘是数据挖掘的一个重要问题.传统的序列模式仅能揭示频繁出现的项目以及出现的顺序,但不能揭示在前续项目出现的情况下,后续项目出现的时间.在本文中,引入一种新的多时间粒度序列模式,模式中相邻项目之间的转换时间采用从原数据集中导出的、多时间粒度下的最小有界时间区间和平均时间标注.建立了多时间粒度序列模式挖掘模型,提出了一种新的多时间序列模式挖掘算法MG-PrefixSpan.实验表明,算法是有效的.  相似文献   

13.
The goal of analyzing a time series database is to find whether and how frequent a periodic pattern is repeated within the series. Periodic pattern mining is the problem that regards temporal regularity. However, most of the existing algorithms have a major limitation in mining interesting patterns of users interest, that is, they can mine patterns of specific length with all the events sequentially one after another in exact positions within this pattern. Though there are certain scenarios where a pattern can be flexible, that is, it may be interesting and can be mined by neglecting any number of unimportant events in between important events with variable length of the pattern. Moreover, existing algorithms can detect only specific type of periodicity in various time series databases and require the interaction from user to determine periodicity. In this paper, we have proposed an algorithm for the periodic pattern mining in time series databases which does not rely on the user for the period value or period type of the pattern and can detect all types of periodic patterns at the same time, indeed these flexibilities are missing in existing algorithms. The proposed algorithm facilitates the user to generate different kinds of patterns by skipping intermediate events in a time series database and find out the periodicity of the patterns within the database. It is an improvement over the generating pattern using suffix tree, because suffix tree based algorithms have weakness in this particular area of pattern generation. Comparing with the existing algorithms, the proposed algorithm improves generating different kinds of interesting patterns and detects whether the generated pattern is periodic or not. We have tested the performance of our algorithm on both synthetic and real life data from different domains and found a large number of interesting event sequences which were missing in existing algorithms and the proposed algorithm was efficient enough in generating and detecting periodicity of flexible patterns on both types of data.  相似文献   

14.

The temporal and spatial characteristics of users are involved in most Internet of Things (IoT) applications. The spatial and temporal movement patterns of users are the most direct manifestation of the temporal and spatial characteristics. The user’s interests, activities, experience and other characteristics are reflected by mobile mode. In view of the low clustering efficiency of moving objects in convergent pattern mining in the IoT, a spatiotemporal feature mining algorithm based on multiple minimum supports of pattern growth is proposed. Based on the temporal characteristics of user trajectories, frequent and asynchronous periodic spatiotemporal movement patterns are mined. Firstly, the location sequence is modeled, and the time information is added to the model. Then, a mining algorithm of asynchronous periodic sequential pattern is adopted. The algorithm is based on multiple minimum supports of pattern growth. According to multiple minimum supports, the sequential pattern of asynchronous period is mined deeply and recursively. Finally, the proposed method is validated and evaluated by Gowalla dataset, in which the user characteristics are truly reflected. It is shown by the experimental results that the average pointwise mutual information (PWI) of the proposed algorithm reaches 0.93. And the algorithm is proved to be effective and accurate.

  相似文献   

15.
为拓展覆盖粗糙集模型,用多粒度方法研究了张燕兰等提出的广义覆盖决策信息系统模型,定义了多粒度意义下的覆盖上下近似,提出了多粒度属性约简算法。用实例对多粒度覆盖粗糙集属性约简方法和胡清华等提出的单粒度方法进行了比较。  相似文献   

16.
Partial periodic pattern mining is one of the important issues in the field of data mining due to its practical applications. A partial periodic pattern consists of some periodic and non-periodic events in a specific period length, and is repeated with high frequency in an event sequence. In the past, a max-subpattern hit set algorithm was developed to discover partial periodic patterns, but its drawback is spending a large amount of time in calculating frequency counts from the redundant candidate nodes. In this study, we thus adopt an efficient encoding strategy to speed up the efficiency of processing period segments in an event sequence, and combined with the projection method to quickly find the partial periodic patterns in the recursive process. Finally, the experimental results show the superior performance of the proposed approach.  相似文献   

17.
针对小文本的Web数据挖掘技术及其应用   总被引:4,自引:2,他引:4  
现有搜索引擎技术返回给用户的信息太多太杂,为此提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,该技术根据用户的兴趣程度形成词汇库,利用模糊聚类方法获得分词词典组,采用MD5算法去除重复页面,采用近似网页聚类算法对剩余页面聚类,并用马尔可夫Web序列挖掘算法对聚类结果排序,从而提供用户感兴趣的网页簇序列,使用户可以迅速找到感兴趣的页面。实验证明该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,所研究的算法时间和空间复杂度都不高,因此有望成为一种实用、有效的信息检索技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号