期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

臧艺超邱菡周天阳朱俊虎《计算机工程与应用》2017,53(24):64-68

时间序列相似性度量在挖掘时间序列模式,提取时间序列关联关系上发挥着重要作用。分析了当前主流的时间序列相似性度量算法,分别指出了各度量算法在度量时序数据相似性时存在的缺陷,并提出了基于数学形态学的时间序列相似性度量算法。通过将归一化的时间序列二值图像化表示,再引入了图像处理领域中的膨胀、腐蚀操作对时序数据进行形态变换分析,提高相似时序数据部分的抗噪性,同时又不降低时序数据非相似部分间的差异度,实现时序数据相似性度量分类精度的提高。在八种时间序列测试数据集合上进行分类实验,实验结果表明提出的基于数学形态学的时间序列相似性度量算法在时间序列分类精度上得到有效改善,相比于DTW相似性度量算法,分类精度平均水平提升了8.74%,最高提升20%。相似文献

2.

不同粒度时间序列相似性度量

邵校莎莎郝文宁靳大卫王莹《计算机应用》2011,31(12):3285-3287

现有的时间序列的相似性度量大多基于欧氏距离,并不适用于不同粒度时间序列的相似性匹配,无法直接对其相似性进行有效的度量,为此,提出一种基于对应差值比样本的相似性度量,用于不同粒度时间序列的相似性匹配.首先对不同时间粒度的时序数据进行阐述,并定义了对应差值比样本与相似度计算方法;接着提出基于它们的相似性匹配算法;最后实验证... 相似文献

3.

时间序列相似性度量在水文数据挖掘中的应用研究

吴德叶传标《现代计算机》2008,(11)

相似性度量方法是时间序列相似性研究的重要课题,同时也是水文时间序列相似性挖掘的关键问题之一.充分分析目前相似性度量的研究成果,结合水文时间序列相似性挖掘模型,通过实验探索适合水文数据特点的相似性度量方法. 相似文献

4.

时间序列分段线性表示及相似性算法研究

杨治明王晓蓉游明英彭军《微计算机信息》2007,23(21):204-206

随着计算机软、硬件的进步,人们利用信息技术产生和搜集数据的能力大幅度提高.作为数据挖掘的重要研究课题之一,时间序列的挖掘与预测近几年发展迅速.本文时时间序列的分段线性化表示进行了研究,采用新的分段线性化表示方法建立了序列相似性度量准则,弥补了以往度量准则对时间轴上伸缩的变化敏感的问题.新的表示方法和相似性度量准则使时间序列数据更容易应用传统的数据挖掘方法. 相似文献

5.

时间序列序列模式的相似性研究 总被引：1，自引：1，他引：0

林殉李志蜀周勇《计算机科学》2011,38(9):245-247

时间序列序列模式相似性的度量是从时间序列中获取时序关联规则的重要环节。一般情况下,距离度量法只能度量相同长度序列模式的相似性。借用动态时间弯曲距离的思想,这种基于非线性弯曲技术的算法可以获得很高的识别、匹配精度。在定义元模式相似性的基础上,定义了序列模式的动态时间弯曲距离,最后用两个不同时间序列进行仿真实验,可以得到不同长度的序列的相似度。相似文献

6.

多元时间序列相似性搜索研究综述

李正欣张凤鸣张晓丰陈继成李超《控制与决策》2017,32(4):577-583

多元时间序列相似模式挖掘是数据挖掘领域的研究热点,它主要包括特征表示、相似模式度量和相似性搜索3个方面.目前,大部分研究成果主要集中在特征表示和相似模式度量,相似性搜索则成为制约问题突破的关键环节.为此,主要针对多元时间序列的相似性搜索进行综述,归纳了主要的相似模式度量方法,对比了不同相似模式度量下的序列搜索方法,并分析了不同方法的优缺点,以期为进一步研究多元时间序列相似性搜索提供帮助. 相似文献

7.

基于趋势的时间序列相似性度量和聚类研究

肖瑞刘国华《计算机应用研究》2014,31(9)

由于时间序列的长度很大,并且不确定时间序列在每个采样点的取值具有不确定性,导致时间序列在相似性匹配和聚类挖掘中时间复杂度很高,为了解决该问题,提出了基于趋势的时间序列相似性度量方法和聚类方法.其中基于趋势的相似性度量方法根据时间序列的整体变化趋势,将时间序列映射为短的趋势符号序列,并利用各趋势的一阶连接性指数和塔尼莫特系数完成相似性度量;基于趋势的聚类方法通过定义趋势高度,并对趋势符号序列迭代进行区间划分和趋势判断,并以此构建趋势树,最后将趋势树根节点中趋势符号相同的序列聚集为一类.实验结果表明:a)五种趋势符号的一阶连接性指数可唯一地表示一条时间序列;b)基于趋势的相似性度量方法在多项式时间内可有效完成时间序列的相似性匹配;c)基于趋势的聚类方法将序列的相似性度量和聚类过程集中在一起,聚类效果显著. 相似文献

8.

基于时间序列演变分析的有效相似性定义和聚类 总被引：1，自引：0，他引：1

下载免费PDF全文

周原冰左新强顾杰赵春晖《计算机工程与应用》2008,44(10):138-141

时间序列广泛存在于商业应用中,比如电力负荷序列、网络日志等。挖掘时间序列数据对决策分析非常重要,特别地,决定时间序列的相似性在各种实际问题中起关键的作用,比如分析各个区域的电力需求特征。以前的相似性度量方法从未使用过演变这种特性去度量时间序列的相似性,基于演变分析提出了有效的时间序列相似性度量方法（SEA）,该方法通过量化演变趋势构建了有效的相似性定义,并且提出了基于该方法的聚类策略。通过在实际数据集上和其它方法的实验比较,证明了提出方法的有效性,因此也证明了时间序列演变分析对相似性度量的重要意义。相似文献

9.

水文时间序列相似性挖掘系统

杨敏王志坚尹燕敏《计算机系统应用》2001,10(9):46-47

时间序列分析正成为数据挖掘研究的热点,本文讨论了时间序列相似性研究的现状和典型方法,介绍了水文时间序列相似性系统的设计与实现,详细分析了系统采用的相似性度量方法。相似文献

10.

交通流时间序列模式相似性度量法 总被引：1，自引：0，他引：1

弓晋丽彭贤武《计算机工程与应用》2015,51(6):103-107

针对交通流时间序列具有高维、高噪声的特性,设计了基于趋势变动、拟合优度和最小距离和百分比原则的联机分割算法用于时间序列维约简。对分割后的时间序列进行5元组分段线性表示,并据此定义五种常见的时间序列形状相似性距离。使用分层聚类算法分析它们在不同的交通流状态辨识中的效果,以此确定交通流时间序列的模式相似性度量方法。以上海南北高架东侧间部分路段固定线圈检测数据为例进行了实证分析,最终确定模式距离与欧氏距离组合方式为交通时序模式相似性度量的最佳方法。相似文献

11.

Piecewise cloud approximation for time series mining

Hailin Li Chonghui Guo 《Knowledge》2011,24(4):492-500

Many researchers focus on dimensionality reduction techniques for the efficient data mining in large time series database. Meanwhile, corresponding distance measures are provided for describing the relationships between two different time series in reduced space. In this paper, we propose a novel approach which we call piecewise cloud approximation (PWCA) to reduce the dimensionality of time series. This representation not only allows dimensionality reduction but also gives a new way to measure the similarity between time series well. Cloud, a qualitative and quantitative transformation model, is used to describe the features of subsequences of time series. Furthermore, a new way to measure the similarity between two cloud models is defined by an overlapping area of their own expectation curves. We demonstrate the performance of the proposed representation and similarity measure used in time series mining tasks, including clustering, classification and similarity search. The results of experiments indicate that PWCA is an effective representation for time series mining. 相似文献

12.

时间序列的层次分段及相似性度量

张海涛李志华孙雅张华伟《计算机工程与应用》2015,51(10):147-151

时间序列的相似性度量是时间序列数据挖掘的研究基础,为数据挖掘任务的效率和准确度提供可靠的保障。提出一种时间序列的层次分段及相似性度量方法,方法首先识别时间序列中的极值点,依据极值点的特征对时间序列进行分层次分段,并以此为基础,通过定义新的距离公式来度量时间序列间的相似性。使用新提出的相似性度量方法对时间序列进行聚类计算,实验结果表明,该方法能够有效地度量时间序列间的相似性,聚类效果明显,具有较好的实用性和良好的应用前景。相似文献

13.

Time series representation and similarity based on local autopatterns 总被引：1，自引：0，他引：1

Mustafa Gokce Baydogan George Runger 《Data mining and knowledge discovery》2016,30(2):476-509

Time series data mining has received much greater interest along with the increase in temporal data sets from different domains such as medicine, finance, multimedia, etc. Representations are important to reduce dimensionality and generate useful similarity measures. High-level representations such as Fourier transforms, wavelets, piecewise polynomial models, etc., were considered previously. Recently, autoregressive kernels were introduced to reflect the similarity of the time series. We introduce a novel approach to model the dependency structure in time series that generalizes the concept of autoregression to local autopatterns. Our approach generates a pattern-based representation along with a similarity measure called learned pattern similarity (LPS). A tree-based ensemble-learning strategy that is fast and insensitive to parameter settings is the basis for the approach. Then, a robust similarity measure based on the learned patterns is presented. This unsupervised approach to represent and measure the similarity between time series generally applies to a number of data mining tasks (e.g., clustering, anomaly detection, classification). Furthermore, an embedded learning of the representation avoids pre-defined features and an extraction step which is common in some feature-based approaches. The method generalizes in a straightforward manner to multivariate time series. The effectiveness of LPS is evaluated on time series classification problems from various domains. We compare LPS to eleven well-known similarity measures. Our experimental results show that LPS provides fast and competitive results on benchmark datasets from several domains. Furthermore, LPS provides a research direction and template approach that breaks from the linear dependency models to potentially foster other promising nonlinear approaches. 相似文献

14.

基于离均差的时间序列相似性度量

曹洋洋林意 《计算机与现代化》2017,(5):76

时间序列的相似性度量是数据挖掘领域研究的一个热点,高维多元时间序列数据一般含有大量的噪声不利于相似性的比较。针对现有的时间序列度量方法存在的问题,在改进的时间序列自底向上融合算法的基础上,提出一种新的基于离均差的时间序列相似性度量的夹角余弦算法(Angle Cosine Metric Similarity,ACMS)。ACMS算法将时间序列等价为一个多维度的向量,充分考虑2个向量的方向和大小特征,增强振幅变化的鲁棒性,减少人为干扰,对数据挖掘中的聚类和预测具有帮助作用。相似文献

15.

基于时间序列相似性聚类的应用研究综述 总被引：4，自引：1，他引：3

陈湘涛李明亮陈玉娟《计算机工程与设计》2010,31(3)

在综合分析近年来时间序列数据挖掘相关文献的基础上从时间序列分割、相似性度量、时间序列聚类等方面对时间序列数据挖掘进行了综述,简要分析了基于时间序列相似性聚类的研究现状,对比较流行的算法进行了比较分析,对当前一些未解决的问题进行了简要介绍,并在此基础上对未来的发展趋势进行了展望,为研究者了解最新的基于时间序列相似性聚类研究动态、新技术及发展趋势提供了参考. 相似文献

16.

时间序列数据挖掘中的动态时间弯曲研究综述 总被引：1，自引：1，他引：0

李海林梁叶王少春《控制与决策》2018,33(8):1345-1353

动态时间弯曲是一种重要的相似性度量方法,对时间序列数据挖掘的性能起着至为关键的作用,对其进行全面和深入的探索具有十分重要的理论意义和实际应用价值.首先简述动态时间弯曲算法的基本步骤,并分析其优点和存在的不足;然后,从动态时间弯曲度量效率的改进研究、度量效果的提升措施以及其在各个行业的应用研究等进行相关综述;最后,给出动态时间弯曲的进一步研究方向.通过对动态时间弯曲方法相关综述及分析,能为相似性度量、聚类和分类等时间序列数据挖掘技术提供必要的文献资料和理论基础. 相似文献

17.

Rotation-invariant similarity in time series using bag-of-patterns representation

Jessica Lin Rohan Khade Yuan Li 《Journal of Intelligent Information Systems》2012,39(2):287-315

For more than a decade, time series similarity search has been given a great deal of attention by data mining researchers. As a result, many time series representations and distance measures have been proposed. However, most existing work on time series similarity search relies on shape-based similarity matching. While some of the existing approaches work well for short time series data, they typically fail to produce satisfactory results when the sequence is long. For long sequences, it is more appropriate to consider the similarity based on the higher-level structures. In this work, we present a histogram-based representation for time series data, similar to the ??bag of words?? approach that is widely accepted by the text mining and information retrieval communities. We performed extensive experiments and show that our approach outperforms the leading existing methods in clustering, classification, and anomaly detection on dozens of real datasets. We further demonstrate that the representation allows rotation-invariant matching in shape datasets. 相似文献

18.

基于孪生神经网络的时间序列相似性度量

姜逸凡叶青《计算机应用》2019,39(4):1041-1045

在时间序列分类等数据挖掘工作中，不同数据集基于类别的相似性表现有明显不同，因此一个合理有效的相似性度量对数据挖掘非常关键。传统的欧氏距离、余弦距离和动态时间弯曲等方法仅针对数据自身进行相似度公式计算，忽略了不同数据集所包含的知识标注对于相似性度量的影响。为了解决这一问题，提出基于孪生神经网络（SNN）的时间序列相似性度量学习方法。该方法从样例标签的监督信息中学习数据之间的邻域关系，建立时间序列之间的高效距离度量。在UCR提供的时间序列数据集上进行的相似性度量和验证性分类实验的结果表明，与ED/DTW-1NN相比SNN在分类质量总体上有明显的提升。虽然基于动态时间弯曲（DTW）的1近邻（1NN）分类方法在部分数据上表现优于基于SNN的1NN分类方法，但在分类过程的相似度计算复杂度和速度上SNN优于DTW。可见所提方法能明显提高分类数据集相似性的度量效率，在高维、复杂的时间序列的数据分类上有不错的表现。相似文献