共查询到20条相似文献,搜索用时 62 毫秒
1.
在高端制造企业的运维业务中,配件需求随机发生,且伴随有大量的零需求阶段,同时,对应的配件需求数据量小,且呈现出间歇性和块状分布的特点,导致现有时间序列预测方法难以有效预测配件需求走势。为解决该问题,提出了一种间歇性时间序列的可预测性评估及联合预测方法。首先,提出了一种新的间歇相似度指标,通过统计两条序列中“0”元素出现的频次和位置,并结合最大信息系数和平均需求间隔等度量指标,有效评估了序列的趋势信息和波动规律,并实现了对间歇性序列可预测性的量化;其次,基于该指标,构建了一个间歇相似度层次聚类方法来自适应地筛选相似性高、可预测性强的序列,剔除极度稀疏、无法预测的序列;此外,探索利用序列间的结构化信息,并构建多输出支持向量回归(M-SVR)模型,从而实现小样本下的间歇性序列联合预测;最后,分别在两个公开数据集(UCI礼品零售数据集和华为电脑配件数据集)和某大型制造企业实际配件售后数据集上进行实验。实验结果表明,相比多个典型的时间序列预测方法,所提方法可有效挖掘各类间歇性序列的可预测性,提高小样本间歇性序列的预测精度,从而为制造企业配件需求预测提供了一种新的解决方案。 相似文献
2.
当今互联网所提供的功能和服务越来越多,Web内容也越来越丰富,移动应用越来越流行。然而,复杂的Web服务应用对用户提出了更高的要求,给用户浏览带来了很多问题,很多时候用户会感到无所适从。文中提出基于用户浏览序列模式的用户行为提取与分析方法。该方法可以分为浏览模式分析和用户聚类两部分。在浏览模式分析时,首先根据用户行为数据得到浏览序列,然后运用序列模式挖掘PrefixSpan算法获取用户习惯的浏览模式,最后把分析获取的用户浏览模式应用到Web浏览中,为不同的用户需求提供个性化的服务。在用户聚类时,运用层次聚类方法按照浏览模式的相似性对用户进行聚类,以分析用户的不同属性(如年龄、职业、学历等)对用户浏览模式的影响。实验结果表明,文中采用的PrefixSpan算法和层次聚类方法在用户浏览模式分析和研究方面具有很好的可行性和有效性。 相似文献
3.
从多元时间序列观测数据中学习多个变量之间的因果关系是许多专业领域中的重要基本问题。现有的多元时间序列因果关系发现方法通常从每个个体的观测数据中学习个体因果关系,没有考虑部分个体之间可能存在相同的因果关系,导致样本利用不足。提出一种面向多元时间序列的群体因果关系发现算法。该算法分为2个阶段:第一阶段基于因果关系对个体之间的相似性进行度量,并把多个个体划分成多个群体,且无须指定群体的个数;第二阶段基于变分推断方法充分利用每个群体内的所有个体数据,从而学习群体因果关系。实验结果表明,该算法在多组不同参数生成的仿真数据上均具有较好的表现,与对比算法相比,AUC评分提升了5%~20%。在真实数据集中,该算法能够较好地区分具有不同因果关系的群体,并且能够学习到不同群体之间不同的因果关系,表明算法不仅具有因果关系发现能力,而且还具有多元时间序列聚类能力。 相似文献
4.
多元时间序列包含丰富的变量,且变量间存在着相关性,相互影响,可能会降低某一变量的预测精度.为此,本文提出了一种基于RNN和CNN的混合模型.模型利用互信息法进行特征选择,通过融合CNN的抽象特征提取以及GRU的时序信息提取来预测未来7个单位时刻的数据.实验表明,模型的预测效果优于LSTM等模型.此外,为了检验所构建的模型的泛用性,在PM2.5数据集和SML2010数据集上进行了对比测试,同样证明了模型的优越性. 相似文献
5.
6.
7.
8.
在航天器遥测数据预测领域,基于时间序列的预测方法有着广阔的应用前景;时间序列有一明显的特性就是记忆性,记忆性是指时间数列中的任一观测值的表现皆受到过去观测值影响;它的基本思想是根据观测数据的特点为数据建立尽可能合理的统计模型,利用模型的统计特性解释数据的统计规律,以期达到预报的目的;提出了采用模式识别和参数估计的方法,结合航天器遥测动态数据,建立关于航天器遥测数据的时序预测模型,对航天器遥测数据趋势进行检测和预报。 相似文献
9.
组合ARMA与SVR模型的时间序列预测 总被引:2,自引:0,他引:2
经典的ARMA模型常用于平稳时间序列的预测,而对于自然界绝大部分的非平稳序列一般采用确定性时序分析和随机时序分析.确定性时序分析对随机性信息浪费严重,而随机时序分析经过差分平稳序列后又回归到ARMA模型.本文利用在充分ARMA模型拟合后的残差序列进行支持向量回归(SVR)拟合,进而对原序列进行组合预测,比起单一模型的拟合及预测,该组合有效地提高了预测精度. 相似文献
10.
基于二阶马尔可夫模型的模糊时间序列预测 总被引:1,自引:0,他引:1
针对当前模糊时间序列模型存在的缺乏有效论域划分方法和模糊关系前件多为一阶的现状,提出了基于二阶马尔可夫模型的模糊时间序列预测方法。应用模糊C均值聚类方法,获得序列中元素的隶属度;引入二阶马尔可夫模型中的转移概率矩阵表示模糊关系,更新了传统的模糊关系表示和运算;预测待求元素在各个模糊聚类的隶属度,并利用重心法去模糊化。将该模型运用到移动3G网络的性能预测中,与传统模糊时间序列预测方法相比,其准确性有了较大提高。 相似文献
11.
Abstract interpretation is a technique for the static detection of dynamic properties of programs. It is semantics based, that is, it computes approximative properties of the semantics of programs. On this basis, it supports correctness proofs of analyses. It replaces commonly used ad hoc techniques by systematic, provable ones, and it allows for the automatic generation of analyzers from specifications by existing tools. In this work, abstract interpretation is applied to the problem of predicting the cache behavior of programs. Abstract semantics of machine programs are defined which determine the contents of caches. For interprocedural analysis, existing methods are examined and a new approach that is especially tailored for the cache analysis is presented. This allows for a static classification of the cache behavior of memory references of programs. The calculated information can be used to improve worst case execution time estimations. It is possible to analyze instruction, data, and combined instruction/data caches for common (re)placement and write strategies. Experimental results are presented that demonstrate the applicability of the analyses. 相似文献
12.
13.
14.
Data Set A is a Pattern Matching Problem 总被引:1,自引:0,他引:1
Several data sets have been proposed for benchmarking in time series prediction. A popular one is Data Set A from the Santa Fe Competition. This data set was the subject of analysis in many papers. In this note, it is shown that predicting the continuation of Data Set A is nothing else than a pattern matching problem. Looking at studies of this data set, it is remarkable that most of the very good forecasts of Data Set A used upsampled training data. We explain why upsampling is crucial for this data set. Finally, it is demonstrated that simple pattern matching performs as good as sophisticated prediction methods on Data Set A. 相似文献
15.
主成分分析与神经网络的结合在多变量序列预测中的应用 总被引:1,自引:0,他引:1
目前预测方法的研究主要集中在单变量时间序列上,本文建立起一种针对多元变量非线性时间序列建模和预测的方法框架.首先,同时考虑序列状态间的线性相关性和非线性相关性,建立初始延迟窗以包含充分的预测信息;然后,利用主成分分析(PCA)方法寻找不同变量在数据空间中的最大方差方向,扩展PCA应用于提取多个变量的综合信息,重构多元变量输入状态相空间;最后,利用神经网络逼近不同变量之间以及当前状态和将来状态之间的函数映射关系,实现多元变量预测.对Ro¨ssler混沌方程和大连降雨、气温序列的预测仿真说明了本文方法的有效性,为多元变量时间序列分析提供了一条新的途径. 相似文献
16.
17.
时间序列聚类分析是数据挖掘研究的一个重要内容。已有的聚类算法大多采用k均值对低维数据进行聚类,不能对高维多变量时间序列(MTS)数据进行有效聚类。提出一种高效的多变量时间序列聚类算法PCA-CLUSTER,首先利用主成分分析对MTS数据降维;选取MTS数据的主成分序列进行K近邻聚类分析。理论分析和实验结果表明算法可以有效解决MTS数据聚类问题。 相似文献
18.
古人云“以史为鉴”,说的是吸取历史的经验教训,对未来的情况做出预判或者改变。生活中,亦是存在相似的利用历史数据对未来变化趋势进行预测分析的时间序列问题。本文就时间序列一类的问题进行研究,探讨如何更好地根据历史统计数据,对未来的变化趋势进行预测分析。本文基于神经网络,以气象观测历史数据作为研究的对象,建立了气温变化时序预测模型。本模型利用大数据相关技术对数据进行特征处理,通过深度神经网络,学习特征数据和标签数据之间复杂的非线性关系,从而实现对气温变化的趋势预测。实验结果表明,相较其他模型,本文的模型能够更好地进行时序预测,同时也证明了神经网络用于气象预测的可行性。 相似文献
19.
Characteristic-Based Clustering for Time Series Data 总被引:1,自引:0,他引:1
With the growing importance of time series clustering research, particularly for similarity searches amongst long time series such as those arising in medicine or finance, it is critical for us to find a way to resolve the outstanding problems that make most clustering methods impractical under certain circumstances. When the time series is very long, some clustering algorithms may fail because the very notation of similarity is dubious in high dimension space; many methods cannot handle missing data when the clustering is based on a distance metric.This paper proposes a method for clustering of time series based on their
structural characteristics. Unlike other alternatives, this method does not cluster point values using a distance metric, rather it clusters based on global features extracted from the time series. The feature measures are obtained from each individual series and can be fed into arbitrary clustering algorithms, including an unsupervised neural network algorithm, self-organizing map, or hierarchal clustering algorithm.Global measures describing the time series are obtained by applying statistical operations that best capture the underlying characteristics: trend, seasonality, periodicity, serial correlation, skewness, kurtosis, chaos, nonlinearity, and self-similarity. Since the method clusters using extracted global measures, it reduces the dimensionality of the time series and is much less sensitive to missing or noisy data. We further provide a search mechanism to find the best selection from the feature set that should be used as the clustering inputs.The proposed technique has been tested using benchmark time series datasets previously reported for time series clustering and a set of time series datasets with known characteristics. The empirical results show that our approach is able to yield meaningful clusters. The resulting clusters are similar to those produced by other methods, but with some promising and interesting variations that can be intuitively explained with knowledge of the global characteristics of the time series. 相似文献