首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
到目前为止能够计算字符化时间序列的距离度量的方法很少,为此,提出了一种新的字符化的时间序列表示方法BSAP。该方法既能进行维度约简又允许在符号化后的时间序列表示法上定义距离度量。实验分别在合成数据和实际数据上进行,实验表明该方法具有更高的运算效率且需要较少的空间。  相似文献   

2.
一种基于分形时变维数的非平稳时间序列相似性匹配方法   总被引:2,自引:0,他引:2  
随机非平稳时间序列在时空动力学演化过程中呈现出非线性特征和分形特征,传统相似性查询的维数约简方法导致时间序列的非线性和分形这些重要特征消失,序列相似性匹配的局部误差也就会增大.该文提出了序列分形时变维数的概念,给出了时变Hurst指数的小波估计式和算法;提出了一种新的序列相似性判别标准.新方法在某一分辨级水平上进行曲线形状相似性查询和度量的同时也进行维数曲线的度量和匹配.用仿真算例对方法的有效性进行了验证。  相似文献   

3.
基于回归系数的时间序列维约简与相似性查找   总被引:1,自引:0,他引:1  
在时间序列中进行相似性查找往往需要进行维约简.以往的维约简方法或者时间复杂度太大并且不直观(如DWT、DFT等),或者无法用于准确的相似性查找(如PAA方法).本文提出一种新的基于回归系数的时间序列维约简方法--逐段回归近似(PRA).该方法具有线性时间复杂度,并且对均值平稳的独立噪声干扰不敏感,同时证明了基于PRA方法的相似性查找满足下界定理,因而是实用有效的.对实际数据的实验结果验证了本文的结论.  相似文献   

4.
由于传统的时序相似性度量方式不满足距离三角不等式关系,影响后续的相似性搜索及关联规则的获取,在时序符号化的基础上,提出一种满足三角不等式的符号化距离度量方式。与MINDIST_PAA_SAX和Sym_PAA_SAX度量方式进行比较,其结果表明,该度量方式在异常检测和相似性查询上具有较好的优越性。实验结果表明,该方法在相似性搜索及关联规则的获取方面具有更高的可信度。  相似文献   

5.
随机非平稳时间序列数据的相似性研究   总被引:3,自引:0,他引:3       下载免费PDF全文
赵慧  侯建荣  施伯乐 《软件学报》2004,15(5):633-640
传统相似性查询的维数约简方法导致时间序列的非线性和分形这些重要特征消失,基于小波变换的匹配方法是通过某一分辨级的距离标准来度量相似性.但是,在未知非平稳时间序列分形维数的情况下,序列相似性匹配的局部误差就会增大,曲线形状的相似性查询过程在一定程度上也因此受到影响.鉴于随机非平稳时间序列在时空动力学演化过程中呈现出非线性特征和分形特征,提出了序列分形时变维数的概念,原始分数布朗运动模型被加以改造成为一个具有局部自相似性的随机过程.给出了时变Hurst指数的估计式和算法,提出了一种新的序列相似性判别标准.在某一分辨级水平上进行曲线形状的相似性查询和度量,同时,对于局部相似性的局部维数曲线进行匹配.最后,用仿真算例对方法的有效性加以验证.  相似文献   

6.
刘芬  郭躬德 《计算机应用》2013,33(1):192-198
基于关键点的符号化聚合近似(SAX)改进算法(KP_SAX)在SAX的基础上利用关键点对时间序列进行点距离度量,能更有效地计算时间序列的相似性,但对时间序列的模式信息体现不足,仍不能合理地度量时间序列的相似性。针对SAX与KP_SAX存在的缺陷,提出了一种基于SAX的时间序列相似性复合度量方法。综合了点距离和模式距离两种度量,先利用关键点将分段累积近似(PAA)法平均分段进一步细分成各个子分段;再用一个包含此两种距离信息的三元组表示每个子分段;最后利用定义的复合距离度量公式计算时间序列间的相似性,计算结果能更有效地反映时间序列间的差异。实验结果显示,改进方法的时间效率比KP_SAX算法仅降低了0.96%,而在时间序列区分度性能上优于KP_SAX算法和SAX算法。  相似文献   

7.
提出了一种基于最小边界矩形的新颖的时间序列表示方法(GMBR),该方法将网格的概念引入到MBR中,能够在保证低开小的情况下有效地提高查找的准确性,最后通过实验证明了该方法的有效性,实验分别在实际数据和合成数据上进行。结果表明该方法的剪枝率为69%~92%,高出MBR方法4%~9%。  相似文献   

8.
廖建平 《计算机系统应用》2013,22(4):138-141,124
针对传统的数据管理中的数据表示、存储与索引、查询与挖掘等所有技术, 不能直接应用于不确定性时间序列数据的相似性查找的不足. 研究了可用于不确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术, 针对不确定性时间序列数据结构的复杂性, 首次给出了不确定性时间序列上的概率最近邻的定义; 将不确定性时间序列进行了PLA降维, 转换到PLA空间, 并提出了三个引理, 用以加速查找效率; 基于该三个引理, 提出了概率K最近邻查找算法PKNNS. 通过实验, 验证了PKNNS算法的有效性和效率.  相似文献   

9.
一种时间序列快速分段及符号化方法   总被引:1,自引:0,他引:1  
任江涛  何武  印鉴  张毅 《计算机科学》2005,32(9):166-169
作为一类重要的复杂类型数据,时间序列已成为数据挖掘领域的热点研究对象之一.针对时间序列的挖掘通常首先需要将时间序列分段并转变为种类有限的符号序列,以利于进一步进行时间序列模式挖掘.针对当前的时间序列分段方法复杂度较大,效率不高等问题,本文提出了一种简单高效的基于拐点检测的时间序列分段方法,并且采用动态时间弯曲度量计算不等长子序列的相异度,最后运用层次化聚类算法实现子序列的分类及符号化.实验表明,本文所提出的方法切实可行,实验结果具有较为明显的物理意义.  相似文献   

10.
基于开矿表示的时间序列相似性搜索   总被引:3,自引:0,他引:3  
时间序列是一类重要的复杂数据,时间序列知识发现正成为知识发现的研究热点之一,时间序列的相似性搜索是时间序列知识发现的重要方面,提出一种新的基于形态表示的时间序列相似性搜索机制。该机制采用逐段线性化技术,将复杂的时间序工线简化为多个直线段,同时,结合时间序列的符号表示思想,构造了基于云模型的形态概念树,提出了时间序列的形态描述方法-基于云模型的时间序列表示法,并在此基础上采用增强动态编程算法实现了时  相似文献   

11.
为了减少噪声数据对查询最优序列的影响,避免Euclidean距离对形态的敏感性,以及要求序列等长的缺点,提出了面向噪声数据的时间序列相似性搜索算法.运用SPC方法去除序列中的噪声数据;采用DTW距离作为度量函数,使用规范化方法使序列处于相同的分辨率下;采用LB_ Keogh下界函数对候选序列集合进行筛选.仿真实验结果表明,该算法在阈值较小时,对含有噪声数据序列的匹配能力较强.  相似文献   

12.
基于斜率偏离的时间序列相似性搜索方法研究*   总被引:1,自引:3,他引:1  
摘要:针对数据挖掘领域中时间序列的相似性度量问题,提出了基于斜率偏离度量的浮动索引相似性搜索算法。在斜率偏离度量的基础上建立分箱标志,通过浮动索引方法有效实现高维多元时间序列的准确索引,用实际的飞行数据进行仿真验证获得好的效果,证明这种方法的有效性和可靠性。  相似文献   

13.
Improving the recall of information retrieval systems for similarity search in time series databases is of great practical importance. In the manufacturing domain, these systems are used to query large databases of manufacturing process data that contain terabytes of time series data from millions of parts. This allows domain experts to identify parts that exhibit specific process faults. In practice, the search often amounts to an iterative query–response cycle in which users define new queries (time series patterns) based on results of previous queries. This is a well-documented phenomenon in information retrieval and not unique to the manufacturing domain. Indexing manufacturing databases to speed up the exploratory search is often not feasible as it may result in an unacceptable reduction in recall. In this paper, we present a novel adaptive search algorithm that refines the query based on relevance feedback provided by the user. Additionally, we propose a mechanism that allows the algorithm to self-adapt to new patterns without requiring any user input. As the search progresses, the algorithm constructs a library of time series patterns that are used to accurately find objects of the target class. Experimental validation of the algorithm on real-world manufacturing data shows, that the recall for the retrieval of fault patterns is considerably higher than that of other state-of-the-art adaptive search algorithms. Additionally, its application to publicly available benchmark data sets shows, that these results are transferable to other domains.  相似文献   

14.
在时间序列相似性问题中滑动窗口的确定   总被引:1,自引:0,他引:1  
作为一个非平凡命题,大多数时间序列相似性查找方法都涉及到了对原数据的维度简约.在保持原序列中有效信息量的同时,尽量降低计算复杂度是这些算法的关键.讨论滑动窗口在时间序列相似性降维技术中的实际应用,从中发现确定自适应滑动窗口大小的一种新方法.通过对时序特征值分布函数的挖掘,发现时间序列中的若干有效点,从而确定一组合适的滑动窗口大小,并根据序列变化的来决定最佳的滑动窗口.  相似文献   

15.
一种高效的多变量时间序列相似查询算法   总被引:1,自引:0,他引:1  
周大镯  吴晓丽  闫红灿 《计算机应用》2008,28(10):2541-2543
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+ 树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。  相似文献   

16.
时间序列的相似性度量是时间序列分析的基础工作之一,是进行相似匹配的关键。针对欧几里德距离描述分段趋势的不足和各种模式距离对应分段之间距离值的离散化问题,提出一种基于形态相似距离的时间序列相似性度量方法,标准数据集上完成的识别和聚类实验表明了该方法的可行性和有效性。  相似文献   

17.
为了更好地体现时间序列的形态特征,并探索更适合于较长时间序列之间相似性度量的方法,在动态时间弯曲算法的基础上进行改进,提出了基于分层动态时间弯曲的序列相似性度量方法。对时间序列进行多层次分段,并从分段中均匀抽取相对应的层次分段子序列,然后将层次分段子序列抽象为三维空间的点(反映了分段子序列的均值、长度和趋势)进行相似性度量,最后综合各个层次的相似性度量作为结果。实验表明,在参数设置合理的情况下,此方法能获得较高的序列相似性度量准确度和效率。  相似文献   

18.
王燕  马倩倩  韩萌 《计算机工程与应用》2012,48(33):162-166,202
现有的各种多元时间序列相似性搜索方法难以准确高效地完成搜索任务。提出了一种基于特征点分段的多元时间序列相似性搜索算法,提取所定义的用于分段的特征点,分段后将原时间序列转化为模式序列,该模式序列能够很好地保留原序列的全局形状特征,再用分层匹配的方法进行相似性搜索。实验结果表明,该方法能够有效刻画序列的全局形状特征,通过分层匹配保留局部的相似性,同时提高搜索准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号