首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
研究时态数据库中多粒度时间下的近似周期的挖掘问题。在多粒度时间、多粒度时间格式的基础上引入多粒度时间间隔的定义以及相关性质,构造多粒度近似周期模型,提出一个基于SOM聚类的多粒度近似周期的挖掘算法。利用高频股票数据580000宝钢JBT1进行实验,证明了该算法的有效性。  相似文献   

2.
孟志青  楼婷渊  胡强 《计算机科学》2013,40(Z11):251-254,262
大规模文本数据挖掘是大数据分析的重要分支,也是近年来的一个研究热点。研究了多粒度时间文本数据周期模式挖掘算法,首先提出了时间粒度转换、多粒度时间间隔等概念,然后建立了文本数据的周期模型,给出了一个多粒度时间文本下的周期模式挖掘算法,最后对大量病毒文本文献数据进行了实验,表明了提出的算法可以挖掘一些有效的周期模式,讨论了周期宽松度对支持度和置信度的影响。该研究为大文本数据分析提供了一种新的方法。  相似文献   

3.
研究时态数据库中多粒度时间下的近似周期的挖掘问题。在多粒度时间、多粒度时问格式的基础上引入多粒度时间间隔的定义以及相关性质,构造多粒度近似周期模型,提出一个基于SOM聚类的多粒度近似周期的挖掘算法。利用高频股票数据580000宝钢JBT1进行实验,证明了该算法的有效性。  相似文献   

4.
研究一类在多粒度时间下单事件同属性不同状态之间有一定关联的近似周期规律挖掘问题。给出了多粒度近似周期关联规则模型形式化的数学定义和性质,构造了相关模型,提出了利用聚类算法挖掘周期模式并应用于股票数据进行实验,实验结果表明算法是有效的。  相似文献   

5.
挖掘多粒度时间下异步周期的模式   总被引:1,自引:0,他引:1  
夏卓群  程昱  梁涤青 《计算机应用》2006,26(12):2985-2987
把异步周期和多时间粒度下的时态模型结合起来研究,并利用异步周期的特点提出了一种有效的挖掘算法。算法先找到所有的有效时间节,再通过有效时间节求出最长的有效时间段。实验表明所提出的算法是稳定而有效的。  相似文献   

6.
一个好的数据库逻辑设计目标是消除数据冗余以及插入、删除和更新异常.对于时态数据库,通过具有多时间粒度的时态函数依赖约束对时态数据库进行规范化已有大量研究.基于时态函数依赖和多值依赖理论提出了多时间粒度约束的时态多值依赖(TMVD)等概念,并给出了时态多值依赖的推理规则,对其有效性、完备性进行了证明.由于包含有限个TMVD的TMVD集通常蕴含着无限个TMVD,给出了TMVD的有限推理规则,对其有效性、完备性进行了证明.最后,基于时态多值依赖集提出了时态第四范式,并给出了时态模式的T4NF的无损分解算法,对算法的可终止性、正确性进行了证明,并对时间复杂度进行了分析.  相似文献   

7.
具有多时间粒度的强全序时态模式中多值依赖问题研究   总被引:5,自引:1,他引:4  
在时态数据库中存在着与时态多值依赖相关的存储冗余、更新异常等问题.但由于时态多值依赖的复杂性,使得根据时态多值依赖所进行的范式分解并不能总保持无损联接,为此对强全序时态模式中时态多值依赖与无损分解的相关性进行了深入研究,给出了规则的时态多值依赖(RTMVD)和属性集的时间粒度等概念,并给出了RTMVD的一套有效的推理规则,针对强全序时态模式中时态多值依赖与无损分解的相关性给出了相关定理,解决了规则的时态多值依赖环境下时态模式在多粒度上的无损分解问题,为规则时态多值依赖环境下时态模式的进一步规范化奠定了基础.  相似文献   

8.
时态应用的需要是推动时态问题深入研究的动力,时态原语之间的运算是时态研究与应用中不可忽视的基本问题之一,对时态数据库、时态知识推理、时态数据挖掘等研究领域均有深远的影响.由于时态原语进行加减运算后的结果可能为负时间因子,也可能溢出相应粒度下度的值,得出非规范的时态元素,从而影响其使用.为此,必须对非规范的时态原语进行规范化处理,使其成为规范时态原语.文章对时态粒度的度、象与转换等进行了刻画,描述了时态粒度约束与性质.在此基础上,深入地探讨了时态原语的规范化处理问题,提出了时态粒点的规范化处理算法,并将该算法应用于公历系统中典型的非规范时态原语的取值情形.  相似文献   

9.
基于粒度层次映射转换的时态粒点差运算方法   总被引:1,自引:0,他引:1  
计算两个时态粒点在任意时态粒度下的差值是时态断言的基础,提出基于时态粒度的层次映射转换方法,将时态粒点映射为各时态粒度下的可列集,差运算可转换为不同粒度映射下的自然数差运算.并论证了时态论域T与自然数集N间的对等关系以及映射的连续性,证明了方法的正确性.克服了弹性时态粒度的影响,适应任何基于非规则时态粒度集或者自定义时态粒度集上的时态粒点差运算.  相似文献   

10.
时态的粒度刻画及演算问题研究   总被引:2,自引:0,他引:2  
左亚尧  汤庸  舒忠梅  李磊  刘海 《计算机科学》2010,37(12):114-119
时态的建模及演算是时态信息处理中的逻辑基本问题,从粒度思想出发,根据时态的粒度划分,研究了时态粒度的语义与性质。并基于时态粒度对时态原语进行刻画,进而基于代数系统分析了时态的粒度转换算子及不同粒度下的时态关系,构建了时态粒度关系的演算系统。  相似文献   

11.
Temporal Granularity: Completing the Puzzle   总被引:1,自引:0,他引:1  
Granularity is an integral feature of both anchored (e.g., 25 October 1995, July 1996) and unanchored (e.g., 3 minutes, 6 hours 20 minutes, 5 days) temporal data. In supporting temporal data that is specified in different granularities, numerous approaches have been proposed to deal with the issues of converting temporal data from one granularity to another. The emphasis, however, has only been on granularity conversions with respect to anchored temporal data. In this paper we provide a novel approach to the treatment of granularity in temporal data. A granularity is modeled as a special kind of unanchored temporal primitive that can be used as a unit of time. That is, a granularity is modeled as a unit unanchored temporal primitive. We show how unanchored temporal data is represented, give procedures for converting the data to a given granularity, provide canonical forms for the data, and describe how operations between the data are performed. We also show how anchored temporal data is represented at different granularities and give the semantics of operations on anchored temporal data.  相似文献   

12.
This paper addresses the problem of granularity in temporal representation in the context of text analysis. In contrast with other fields where granularity levels are essentially quantitative, in natural language the different levels are not always precisely defined and granularity is of a more subtle and qualitative nature. A model is proposed for representing such phenomena, based on time units and time units intervals. Time units represent chunks of time which are considered indivisible at a given granularity level, but which may be refined and contain other time units or intervals at a higher granularity level. The structure of the set of time units and intervals is studied and a relation algebra is defined which extends the traditional Allen's Point or Interval Algebra. Weak and strong representations of this algebra are proposed. We claim that such representations, called grained temporal structures, are adequate for coping with dynamic qualitative changes of granularity. A logic with restricted quantifiers is proposed for formalizing temporal knowledge and examples are discussed which show the relevance of the model for natural language analysis.  相似文献   

13.
数据仓库中的事实数据一般以最小粒度存储。而大量的细粒度数据具有很大的随机性,很少直接进行分析和处理,往往被聚集到一定层次的粗粒度数据。另一方面若采用ROLAP存储数据,则大量的细粒度数据将会影响查询的效率。本文介绍了一种基于时间维层次查询频率的粒度调整模型,它能根据用户在时间维层次的查询频率实现对数据粒度的调整。  相似文献   

14.
针对时态粒度约束下的时态元素之间的定性关系,引入向量空间思想,将时态粒点间的关系转换为向量空间中的运算。提出时态粒点的向量判别方法以比较两个时态粒点的先后关系,通过粒度缩放操作探讨了时态粒区之间的关系、时态粒点与时态粒区之间的定性关系,对时态数据库、时态知识推理、时态数据挖掘等时态应用研究领域起到了良好的基础支持作用。  相似文献   

15.
传统变精度多粒度粗糙集模型是基于单一变精度阈值的,而多粒度粗糙集模型是从多角度和多层次处理数据,数据往往是多源的或者是分布式的,其噪音数据的含量也各不相同。因此,不同知识粒度层次所应具有的变精度阈值也不相同,这使得现有的模型难以适应多粒度环境。为克服上述缺点,提出了基于多重阈值的变精度多粒度粗糙集模型,该模型使得不同知识粒度层次的变精度阈值可独立调整,更符合多粒度粗糙集模型的数据特征。该模型更好地结合了多粒度粗糙集模型和变精度粗糙集模型,可从多角度分析解决问题又兼具更灵活的容错能力。  相似文献   

16.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

17.
代价敏感学习中经常考虑测试代价和误分类代价。在实际应用中,一个属性的测试代价常跟属性值的粒度有关,而一个具有多个属性的对象的误分类代价又常受它的属性的总测试代价大小的影响。基于这一点,研究在总测试代价受限的情形下,数据的属性和粒度选择的问题。以最小化数据处理的平均总代价为目标提出了一种方法,该方法能同时选择最优的属性子集和数据粒度。首先建立了该方法的理论模型,再设计了一个高效的算法。实验结果表明,所提算法能有效地进行不同大小的测试代价约束下的属性和粒度选择。  相似文献   

18.
电信运营商为了发现可能离网的客户,针对不同的场景研究开发了多种离网预测模型。目前的离网预测模型首先选择一种时间粒度抽取特征,之后使用机器学习算法对抽取的数据建模。这类方法只考虑了模型对分类性能的影响,没有充分考虑数据的作用。针对上述问题,提出一种使用多种时间粒度抽取特征的方法,并尝试在模型训练的不同阶段对不同粒度的特征进行融合。实验结果表明,使用多种粒度抽取特征训练出来的模型性能会明显优于使用单一粒度抽取特征的模型。  相似文献   

19.
粒度计算理论为知识发现的研究提供了新的理论工具,通过引入全粒度空间的概念,对信息系统的论域空间进行等价划分,给出了论域子空间可精确粒度表示的充分条件,建立了目标概念的外延和内涵的粒度计算关系,揭示了目标概念学习中的粒度计算过程,提出了一种新的数据分类模型。  相似文献   

20.
时间粒度是所有时态数据所拥有的共同特点。在许多时态数据库应用中,都涉及多时间粒度约束,但是,具有多时间粒度的时态数据库的设计相当复杂,难以实现。而现实世界中的许多应用涉及到的时态类型集都能满足全序关系,由于具有全序时态类型集的全序时态模块模式有着良好的特性,文章提出了全序时态模块模式、时刻关系模式、全序时态模块投影和全序时态BC范式(TO_TBCNF)等概念,并给出了全序时态BC范式的分解算法,对其正确性、可终止性进行了证明,并对时间复杂度进行了分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号