首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
面向相似性查询的时间序列距离度量方法述评   总被引:1,自引:0,他引:1  
从一元时间序列和多元时间序列两个方面对当前提出的主要时间序列距离度量方法进行了述评.深入分析了各种算法的原理和特点,比较了算法对时间序列形变的支持情况以及时间复杂度.从客观上讲,各种算法之间并不具有绝对的优劣关系,每种算法的原理和特点各异,适用的问题领域也不一样.对于工程应用中选择时间序列距离度量方法具有指导意义,同时对于设计新的距离度量方法也具有参考价值.  相似文献   

2.
朱天  白似雪 《微计算机信息》2007,23(30):216-217
时间序列的相似性搜索是时间序列知识发现的重要方面。该文提出了一种新的基于距离度量的时间序列相似性搜索算法。该算法采用分段线性表示,同时使用改进的模式距离来度量序列间的距离。  相似文献   

3.
在时间序列相似性的研究中,通常采用的欧氏距离及其变形无法对在时间轴上发生伸缩或弯曲的序列进行相似性度量,本文提出了一种基于分段极值DTW距离的时间序列相似性度量方法可以解决这一问题。在动态时间弯曲(DTW)距离的基础上,本文定义了序列的分段极值DTW距离,并阐述了其完整的算法实现。与传统的DTW距离相比,分段极值DTW距离在保证度量准确性的同时大大提高了相似性计算的效率。文中最后运用MATLAB作对比实验,并给出实验结果数据,验证了该度量方法的有效性与准确性。  相似文献   

4.
基于事件的时间序列相似性度量方法   总被引:2,自引:0,他引:2  
吴学雁  黄道平 《计算机应用》2010,30(7):1944-1946
为了在时间序列相似性度量过程中更好地体现用户的需求,提高相似性度量的准确度,提出了基于事件的时间序列相似性度量方法(SMBE)。首先将用户的需求定义为事件,将原始时间序列转化为事件序列;然后,构建了基于事件序列的相似性度量模型(SMBE),SMBE定义了不同事件序列中各元素之间的相似性,并构成相应的相似性矩阵,对相似性矩阵进行搜索得到最优路径的值作为序列之间的相似性度量;最后,提出了基于SMBE的聚类方法。实验表明,在参数设置合理的情况下,能获得接近0.90的聚类精度。  相似文献   

5.
时间序列的特征表示与相似性度量是时间序列数据挖掘的重要基础。针对现有的序列表示方法难以具体反映序列的形态变化趋势,导致相似度量结果不精确的问题,提出一种新的基于形态模式的相似性度量算法。该算法在分段线性表示的基础上,根据序列在不同时段的斜率变化情况,划分序列的分段形态模式并用特殊的字符进行表示,把时间序列转换成字符串序列,利用最长公共子序列方法计算字符串序列的距离作为时间序列之间的距离。最后通过实验验证该方法的有效性。理论分析和实验证明该方法对数据点的值不敏感,能够减少噪声的干扰,而且具有较高的准确性。  相似文献   

6.
针对传统的动态时间弯曲算法的性能容易受到离群点以及局部噪声点的影响,同时对于复杂数据的处理能力较差。对此,文中提出基于形态距离及自适应权重的相似性度量算法。该算法首先利用 趋势滤波对原始待比较序列进行降维,压缩;其次引入形态距离计算两时间序列的距离矩阵,最后利用自适应赋权的距离函数抽取出各个子序列所含的信息量差异并结合动态时间弯曲完成最终时间序列相似度量。实验表明该算法有更强的鲁棒性,能够更好的利用序列的形态特征完成宏观的相似性度量,同时在处理复杂数据时更加精确,高效,稳定。  相似文献   

7.
针对时间序列距离度量的算法很多,但没有适用于不规则时序距离度量算法的现状,基于寻求全局序列点构成的边集之间的距离路径最小的思想,提出一种不规则时序距离度量的算法,并给出了事件序列生成算法和不规则时序距离度量算法的实现,最后利用UCI KDD的时间序列测试数据对算法进行了测试。测试结果证明了该不规则时序距离算法能够有效度量不规则时序的相似性。  相似文献   

8.
一种基于权重的时间序列相似性度量   总被引:1,自引:0,他引:1  
依据时间序列的形态特征,为基于欧氏距离的相似性度量加入奖惩因子,使其能反映序列形态的相似性.同时根据相关的背景知识给时间序列不同的维设定不同的权重,并给出一种自动求权重集合的算法.该算法成功应用于福泉高速行车数据以及仿真数据的相似性度量.  相似文献   

9.
现有的时间序列相似度量方法难以兼顾微观形状与宏观结构两方面的相似性,同时存在易受异常值、位移拉伸影响等问题。针对上述情况,提出具有更高精度与鲁棒性,更小时间复杂度的优化DTW与面积距离结合的算法。首先在DTW中引入分段聚合与相似度阈值,前者能降低数据维度,减少DTW的计算量,后者能够过滤数据中的异常值,提高算法的鲁棒性;其次提出面积距离度量,描述整体序列中的起伏变化,发现序列的整体相似性;从微观形状与宏观结构两方面表述时序序列,能够进一步提升算法精度。在UCR的30个不同数据集上进行的实验表明,该方法与现有相似度量方法相比,具有更高的精度与鲁棒性。  相似文献   

10.
由于时间序列的长度很大,并且不确定时间序列在每个采样点的取值具有不确定性,导致时间序列在相似性匹配和聚类挖掘中时间复杂度很高,为了解决该问题,提出了基于趋势的时间序列相似性度量方法和聚类方法.其中基于趋势的相似性度量方法根据时间序列的整体变化趋势,将时间序列映射为短的趋势符号序列,并利用各趋势的一阶连接性指数和塔尼莫特系数完成相似性度量;基于趋势的聚类方法通过定义趋势高度,并对趋势符号序列迭代进行区间划分和趋势判断,并以此构建趋势树,最后将趋势树根节点中趋势符号相同的序列聚集为一类.实验结果表明:a)五种趋势符号的一阶连接性指数可唯一地表示一条时间序列;b)基于趋势的相似性度量方法在多项式时间内可有效完成时间序列的相似性匹配;c)基于趋势的聚类方法将序列的相似性度量和聚类过程集中在一起,聚类效果显著.  相似文献   

11.
时间序列相似性度量在挖掘时间序列模式,提取时间序列关联关系上发挥着重要作用。分析了当前主流的时间序列相似性度量算法,分别指出了各度量算法在度量时序数据相似性时存在的缺陷,并提出了基于数学形态学的时间序列相似性度量算法。通过将归一化的时间序列二值图像化表示,再引入了图像处理领域中的膨胀、腐蚀操作对时序数据进行形态变换分析,提高相似时序数据部分的抗噪性,同时又不降低时序数据非相似部分间的差异度,实现时序数据相似性度量分类精度的提高。在八种时间序列测试数据集合上进行分类实验,实验结果表明提出的基于数学形态学的时间序列相似性度量算法在时间序列分类精度上得到有效改善,相比于DTW相似性度量算法,分类精度平均水平提升了8.74%,最高提升20%。  相似文献   

12.
基于时间序列演变分析的有效相似性定义和聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列广泛存在于商业应用中,比如电力负荷序列、网络日志等。挖掘时间序列数据对决策分析非常重要,特别地,决定时间序列的相似性在各种实际问题中起关键的作用,比如分析各个区域的电力需求特征。以前的相似性度量方法从未使用过演变这种特性去度量时间序列的相似性,基于演变分析提出了有效的时间序列相似性度量方法(SEA),该方法通过量化演变趋势构建了有效的相似性定义,并且提出了基于该方法的聚类策略。通过在实际数据集上和其它方法的实验比较,证明了提出方法的有效性,因此也证明了时间序列演变分析对相似性度量的重要意义。  相似文献   

13.
从海量的轨迹数据中发现用户的相似轨迹是实现基于位置的个性化服务推荐的关键技术之一.位置和时间是轨迹数据的两个重要属性,而已有的基于Hausdorff距离的轨迹相似度量只着重关注了位置属性.针对在计算轨迹间相似性时忽略了轨迹的时间属性这一问题,提出一种基于时间约束的Hausdorff距离的时空轨迹相似度量.利用滑动窗口挖掘两条较长轨迹中所有相似的子轨迹,进而判断较长轨迹间的相似性.实验结果表明,该时空轨迹相似度量具有更好的效果.  相似文献   

14.
为了更好地体现时间序列的形态特征,并探索更适合于较长时间序列之间相似性度量的方法,在动态时间弯曲算法的基础上进行改进,提出了基于分层动态时间弯曲的序列相似性度量方法。对时间序列进行多层次分段,并从分段中均匀抽取相对应的层次分段子序列,然后将层次分段子序列抽象为三维空间的点(反映了分段子序列的均值、长度和趋势)进行相似性度量,最后综合各个层次的相似性度量作为结果。实验表明,在参数设置合理的情况下,此方法能获得较高的序列相似性度量准确度和效率。  相似文献   

15.
刘芬  郭躬德 《计算机应用》2013,33(1):192-198
基于关键点的符号化聚合近似(SAX)改进算法(KP_SAX)在SAX的基础上利用关键点对时间序列进行点距离度量,能更有效地计算时间序列的相似性,但对时间序列的模式信息体现不足,仍不能合理地度量时间序列的相似性。针对SAX与KP_SAX存在的缺陷,提出了一种基于SAX的时间序列相似性复合度量方法。综合了点距离和模式距离两种度量,先利用关键点将分段累积近似(PAA)法平均分段进一步细分成各个子分段;再用一个包含此两种距离信息的三元组表示每个子分段;最后利用定义的复合距离度量公式计算时间序列间的相似性,计算结果能更有效地反映时间序列间的差异。实验结果显示,改进方法的时间效率比KP_SAX算法仅降低了0.96%,而在时间序列区分度性能上优于KP_SAX算法和SAX算法。  相似文献   

16.
符号化表示是一种有效的时间序列降维技术,其相似性度量是诸多挖掘任务的基础。基于SAX(sym-bolic aggregate approximation)的距离MINDIST_PAA_iSAX不满足对称性,在时间序列挖掘中具有局限性,提出了对称的度量Sym_PAA_SAX,且下界于欧拉距离。在真实数据集和合成数据集上的实验说明下界紧密性较好,相似搜索错报率较低。  相似文献   

17.
针对时间序列的全序列聚类展开,提出一种新的相似性度量——全局特征,即从时间序列的统计分布特征、非线性和Fourier频谱转换等3个方面提取11个全局特征构建特征向量。利用特征向量来描述原时间序列,不仅保留了大部分原有的信息,还能加快聚类计算的速度。经过大量的实验验证表明,基于全局特征提取的相似性度量能得到合理的聚类结果,特别是对经济领域的时间序列效果更为明显。例举了2个数据进行实验,并从主观和客观两个角度对聚类结果进行评估。  相似文献   

18.
针对无线传感网中节点故障率高而导致检测精度低以及能耗大的问题,提出了基于时间序列相似度的无线传感网故障检测算法(FDABTS2).该算法利用节点时间序列进行差值和相似度的计算,剔除一定故障类型的节点,并对瞬时读数故障数据进行修正.当节点为可疑节点时,利用空间相关性,与剩余邻居节点协作完成判定.在仿真环境下,与LEFD、NADST以及传统的DFD故障检测算法相比,检测精度分别提高了13%、17%和25%,误报率分别降低了8.4%、21.4%和25.4%,网络能耗分别降低了2.9%、8%和21.3%,即使在瞬时读数节点故障率高达60%时,误报率也能分别降低1.9%、26.2%和38.2%.实验结果表明,该算法在保证高检测精度的情况下,仍能有效降低能耗,延长网络生命周期.  相似文献   

19.
交通流时间序列模式相似性度量法   总被引:1,自引:0,他引:1  
针对交通流时间序列具有高维、高噪声的特性,设计了基于趋势变动、拟合优度和最小距离和百分比原则的联机分割算法用于时间序列维约简。对分割后的时间序列进行5元组分段线性表示,并据此定义五种常见的时间序列形状相似性距离。使用分层聚类算法分析它们在不同的交通流状态辨识中的效果,以此确定交通流时间序列的模式相似性度量方法。以上海南北高架东侧间部分路段固定线圈检测数据为例进行了实证分析,最终确定模式距离与欧氏距离组合方式为交通时序模式相似性度量的最佳方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号