首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在高端制造企业的运维业务中,配件需求随机发生,且伴随有大量的零需求阶段,同时,对应的配件需求数据量小,且呈现出间歇性和块状分布的特点,导致现有时间序列预测方法难以有效预测配件需求走势。为解决该问题,提出了一种间歇性时间序列的可预测性评估及联合预测方法。首先,提出了一种新的间歇相似度指标,通过统计两条序列中“0”元素出现的频次和位置,并结合最大信息系数和平均需求间隔等度量指标,有效评估了序列的趋势信息和波动规律,并实现了对间歇性序列可预测性的量化;其次,基于该指标,构建了一个间歇相似度层次聚类方法来自适应地筛选相似性高、可预测性强的序列,剔除极度稀疏、无法预测的序列;此外,探索利用序列间的结构化信息,并构建多输出支持向量回归(M-SVR)模型,从而实现小样本下的间歇性序列联合预测;最后,分别在两个公开数据集(UCI礼品零售数据集和华为电脑配件数据集)和某大型制造企业实际配件售后数据集上进行实验。实验结果表明,相比多个典型的时间序列预测方法,所提方法可有效挖掘各类间歇性序列的可预测性,提高小样本间歇性序列的预测精度,从而为制造企业配件需求预测提供了一种新的解决方案。  相似文献   

2.
当今互联网所提供的功能和服务越来越多,Web内容也越来越丰富,移动应用越来越流行。然而,复杂的Web服务应用对用户提出了更高的要求,给用户浏览带来了很多问题,很多时候用户会感到无所适从。文中提出基于用户浏览序列模式的用户行为提取与分析方法。该方法可以分为浏览模式分析和用户聚类两部分。在浏览模式分析时,首先根据用户行为数据得到浏览序列,然后运用序列模式挖掘PrefixSpan算法获取用户习惯的浏览模式,最后把分析获取的用户浏览模式应用到Web浏览中,为不同的用户需求提供个性化的服务。在用户聚类时,运用层次聚类方法按照浏览模式的相似性对用户进行聚类,以分析用户的不同属性(如年龄、职业、学历等)对用户浏览模式的影响。实验结果表明,文中采用的PrefixSpan算法和层次聚类方法在用户浏览模式分析和研究方面具有很好的可行性和有效性。  相似文献   

3.
从多元时间序列观测数据中学习多个变量之间的因果关系是许多专业领域中的重要基本问题。现有的多元时间序列因果关系发现方法通常从每个个体的观测数据中学习个体因果关系,没有考虑部分个体之间可能存在相同的因果关系,导致样本利用不足。提出一种面向多元时间序列的群体因果关系发现算法。该算法分为2个阶段:第一阶段基于因果关系对个体之间的相似性进行度量,并把多个个体划分成多个群体,且无须指定群体的个数;第二阶段基于变分推断方法充分利用每个群体内的所有个体数据,从而学习群体因果关系。实验结果表明,该算法在多组不同参数生成的仿真数据上均具有较好的表现,与对比算法相比,AUC评分提升了5%~20%。在真实数据集中,该算法能够较好地区分具有不同因果关系的群体,并且能够学习到不同群体之间不同的因果关系,表明算法不仅具有因果关系发现能力,而且还具有多元时间序列聚类能力。  相似文献   

4.
多元时间序列包含丰富的变量,且变量间存在着相关性,相互影响,可能会降低某一变量的预测精度.为此,本文提出了一种基于RNN和CNN的混合模型.模型利用互信息法进行特征选择,通过融合CNN的抽象特征提取以及GRU的时序信息提取来预测未来7个单位时刻的数据.实验表明,模型的预测效果优于LSTM等模型.此外,为了检验所构建的模型的泛用性,在PM2.5数据集和SML2010数据集上进行了对比测试,同样证明了模型的优越性.  相似文献   

5.
6.
研究了应用数据挖掘技术预测时间序列数据中事件的方法。针对时间序列数据提出了显著特征提取算法,给出了特征间的相似度量标准,并应用特征聚类算法,将时间序列数据转换成相应的特征序列表示。应用频繁模式发现算法和预测模式生成算法在预测时段内发现与目标事件相关的时序特征模式,预测事件的发生。实验结果表明,该文所提出的方法能够有效地预测时间序列数据中的事件。  相似文献   

7.
《计算机工程》2017,(4):8-14
对电网运行产生的时间序列数据展开实时预测研究,提出基于Storm平台和ARIMA模型的预测框架。分析不同类型电网时序数据的特点,预设拟合模型以降低模型构建的盲目性,缩短预测时间,同时设计基于HBase的新型时序数据存储模式加快数据检索速度。通过对海量的时序数据源进行并发预测,比较不同数据样本对预测值的影响并实时分析预测误差。经实例从预测精度、运算速度、占用资源3个角度验证了该框架的有效性与实用性。  相似文献   

8.
在航天器遥测数据预测领域,基于时间序列的预测方法有着广阔的应用前景;时间序列有一明显的特性就是记忆性,记忆性是指时间数列中的任一观测值的表现皆受到过去观测值影响;它的基本思想是根据观测数据的特点为数据建立尽可能合理的统计模型,利用模型的统计特性解释数据的统计规律,以期达到预报的目的;提出了采用模式识别和参数估计的方法,结合航天器遥测动态数据,建立关于航天器遥测数据的时序预测模型,对航天器遥测数据趋势进行检测和预报。  相似文献   

9.
组合ARMA与SVR模型的时间序列预测   总被引:2,自引:0,他引:2  
经典的ARMA模型常用于平稳时间序列的预测,而对于自然界绝大部分的非平稳序列一般采用确定性时序分析和随机时序分析.确定性时序分析对随机性信息浪费严重,而随机时序分析经过差分平稳序列后又回归到ARMA模型.本文利用在充分ARMA模型拟合后的残差序列进行支持向量回归(SVR)拟合,进而对原序列进行组合预测,比起单一模型的拟合及预测,该组合有效地提高了预测精度.  相似文献   

10.
基于二阶马尔可夫模型的模糊时间序列预测   总被引:1,自引:0,他引:1  
针对当前模糊时间序列模型存在的缺乏有效论域划分方法和模糊关系前件多为一阶的现状,提出了基于二阶马尔可夫模型的模糊时间序列预测方法。应用模糊C均值聚类方法,获得序列中元素的隶属度;引入二阶马尔可夫模型中的转移概率矩阵表示模糊关系,更新了传统的模糊关系表示和运算;预测待求元素在各个模糊聚类的隶属度,并利用重心法去模糊化。将该模型运用到移动3G网络的性能预测中,与传统模糊时间序列预测方法相比,其准确性有了较大提高。  相似文献   

11.
Abstract interpretation is a technique for the static detection of dynamic properties of programs. It is semantics based, that is, it computes approximative properties of the semantics of programs. On this basis, it supports correctness proofs of analyses. It replaces commonly used ad hoc techniques by systematic, provable ones, and it allows for the automatic generation of analyzers from specifications by existing tools. In this work, abstract interpretation is applied to the problem of predicting the cache behavior of programs. Abstract semantics of machine programs are defined which determine the contents of caches. For interprocedural analysis, existing methods are examined and a new approach that is especially tailored for the cache analysis is presented. This allows for a static classification of the cache behavior of memory references of programs. The calculated information can be used to improve worst case execution time estimations. It is possible to analyze instruction, data, and combined instruction/data caches for common (re)placement and write strategies. Experimental results are presented that demonstrate the applicability of the analyses.  相似文献   

12.
何源  张文生  葛铭  叶晨洲 《计算机工程》2008,34(10):244-246
在大型火电厂烧煤锅炉的运行过程中,受热面的积灰是降低锅炉运行效率和安全性的一个重要原因。目前,主要采用高压空气或者蒸汽把积灰吹掉。吹灰的困难在于确定应该何时吹灰,该文提出一种基于时序聚类的新方法,从经过预处理的锅炉历史数据中抽取出代表吹灰的模式,建立吹灰模型,用来预测吹灰时间。该方法在应用到一个900 MW的超临界锅炉上时,表现出较好的效果。  相似文献   

13.
随着社会的发展,人们对于数据预测的需求日益增加,模糊时间序列因其能够处理时间序列中含糊不清的数据而备受关注。从提高模型的预测精度角度来看,论域划分作为时间序列数据预测的第一步,作用至关重要。本文提出一种基于FCM的二次论域划分方法。该方法首先根据FCM聚类算法得到的聚类中心对论域进行一次划分,然后根据样本点空间分布的疏密程度不同对论域进行二次细化,实现不等分论域,最后通过对经典样本的预测证明方法的可行性。  相似文献   

14.
Data Set A is a Pattern Matching Problem   总被引:1,自引:0,他引:1  
Several data sets have been proposed for benchmarking in time series prediction. A popular one is Data Set A from the Santa Fe Competition. This data set was the subject of analysis in many papers. In this note, it is shown that predicting the continuation of Data Set A is nothing else than a pattern matching problem. Looking at studies of this data set, it is remarkable that most of the very good forecasts of Data Set A used upsampled training data. We explain why upsampling is crucial for this data set. Finally, it is demonstrated that simple pattern matching performs as good as sophisticated prediction methods on Data Set A.  相似文献   

15.
主成分分析与神经网络的结合在多变量序列预测中的应用   总被引:1,自引:0,他引:1  
目前预测方法的研究主要集中在单变量时间序列上,本文建立起一种针对多元变量非线性时间序列建模和预测的方法框架.首先,同时考虑序列状态间的线性相关性和非线性相关性,建立初始延迟窗以包含充分的预测信息;然后,利用主成分分析(PCA)方法寻找不同变量在数据空间中的最大方差方向,扩展PCA应用于提取多个变量的综合信息,重构多元变量输入状态相空间;最后,利用神经网络逼近不同变量之间以及当前状态和将来状态之间的函数映射关系,实现多元变量预测.对Ro¨ssler混沌方程和大连降雨、气温序列的预测仿真说明了本文方法的有效性,为多元变量时间序列分析提供了一条新的途径.  相似文献   

16.
17.
一个高效的多变量时间序列聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列聚类分析是数据挖掘研究的一个重要内容。已有的聚类算法大多采用k均值对低维数据进行聚类,不能对高维多变量时间序列(MTS)数据进行有效聚类。提出一种高效的多变量时间序列聚类算法PCA-CLUSTER,首先利用主成分分析对MTS数据降维;选取MTS数据的主成分序列进行K近邻聚类分析。理论分析和实验结果表明算法可以有效解决MTS数据聚类问题。  相似文献   

18.
古人云“以史为鉴”,说的是吸取历史的经验教训,对未来的情况做出预判或者改变。生活中,亦是存在相似的利用历史数据对未来变化趋势进行预测分析的时间序列问题。本文就时间序列一类的问题进行研究,探讨如何更好地根据历史统计数据,对未来的变化趋势进行预测分析。本文基于神经网络,以气象观测历史数据作为研究的对象,建立了气温变化时序预测模型。本模型利用大数据相关技术对数据进行特征处理,通过深度神经网络,学习特征数据和标签数据之间复杂的非线性关系,从而实现对气温变化的趋势预测。实验结果表明,相较其他模型,本文的模型能够更好地进行时序预测,同时也证明了神经网络用于气象预测的可行性。  相似文献   

19.
Characteristic-Based Clustering for Time Series Data   总被引:1,自引:0,他引:1  
With the growing importance of time series clustering research, particularly for similarity searches amongst long time series such as those arising in medicine or finance, it is critical for us to find a way to resolve the outstanding problems that make most clustering methods impractical under certain circumstances. When the time series is very long, some clustering algorithms may fail because the very notation of similarity is dubious in high dimension space; many methods cannot handle missing data when the clustering is based on a distance metric.This paper proposes a method for clustering of time series based on their structural characteristics. Unlike other alternatives, this method does not cluster point values using a distance metric, rather it clusters based on global features extracted from the time series. The feature measures are obtained from each individual series and can be fed into arbitrary clustering algorithms, including an unsupervised neural network algorithm, self-organizing map, or hierarchal clustering algorithm.Global measures describing the time series are obtained by applying statistical operations that best capture the underlying characteristics: trend, seasonality, periodicity, serial correlation, skewness, kurtosis, chaos, nonlinearity, and self-similarity. Since the method clusters using extracted global measures, it reduces the dimensionality of the time series and is much less sensitive to missing or noisy data. We further provide a search mechanism to find the best selection from the feature set that should be used as the clustering inputs.The proposed technique has been tested using benchmark time series datasets previously reported for time series clustering and a set of time series datasets with known characteristics. The empirical results show that our approach is able to yield meaningful clusters. The resulting clusters are similar to those produced by other methods, but with some promising and interesting variations that can be intuitively explained with knowledge of the global characteristics of the time series.  相似文献   

20.
基于模体演化的时序链路预测方法   总被引:3,自引:0,他引:3  
时序链路预测是动态网络分析的重要组成部分,具有极大的理论和应用价值. 传统的时序链路预测方法往往直接对边的演化规律进行分析,忽略了网络中其他微观结构的演化对链路形成的影响. 基于此分析,本文引入非负张量分解和时间序列分析对网络模体的演化规律进行研究,进而提出一种基于模体演化的链路预测方法. 在三个真实数据集上的实验结果表明,该方法能有效提高链路预测精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号