共查询到16条相似文献,搜索用时 656 毫秒
1.
鉴于传统方法不能直接有效地对多元时间序列数据进行聚类分析,提出一种基于分量属性近邻传播的多元时间序列数据聚类方法.通过动态时间弯曲方法度量多元时间序列数据之间的总体距离,利用近邻传播聚类算法分别对数据之间的总体距离矩阵和分量近似距离矩阵进行聚类分析,综合考虑这两种视角下序列数据之间的关联关系,使用近邻传播方法对反映原始多元时间序列数据的综合关系矩阵实现较高质量的聚类.数值实验结果表明,与传统聚类方法相比,所提出方法不仅能够有效地反映总体数据特征之间的关系,而且通过重要分量属性序列之间的关联关系分析能够提高原始时间序列数据的聚类效果. 相似文献
2.
符号化表示技术,可以有效降低时间序列的维度,是实现海量时间序列数据挖掘的基础.聚类结果的精度是运用聚类方法对多元时间序列进行符号化表示的关键.运用共同马氏距离虽然可以实现多元时间序列的符号化表示,但忽略了不同类样本数量对聚类结果的影响,从而降低了符号化表示的有效性.针对上述问题,提出一种改进共同马氏距离的多元时间序列符号化表示方法,通过改进共同协方差矩阵的计算方法,优化了聚类结果,从而提高了符号化表示的有效性.仿真结果表明,改进后的方法可以更加有效地对多元时间序列进行符号化表示. 相似文献
3.
针对传统的Gath-Geva(G-G)模糊分段方法需要人为设置参数,对高维时间序列分段效率低的问题,提出一种基于核主元分析(KPCA)和G-G聚类的多元时间序列模糊分段方法.首先,该算法利用KPCA方法对多元时间序列进行特征提取,去除冗余及无关变量的影响;然后,通过近邻传播算法(AP)得到分段数目的上界;最后,将时间信息考虑在内,基于所提出的MDBI有效值指标以及G-G模糊聚类在低维多元时间序列上实现多元时间序列的最佳模糊分段.实验结果表明,所提出算法可以快速有效地检测出时间序列的某种突然和渐近变化的趋势,在准确性和运行效率方面均得到了提升. 相似文献
4.
5.
6.
面向热点话题时间序列的有效聚类算法研究 总被引:3,自引:0,他引:3
聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压缩,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始矩阵中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果.文中分别采用国内外3个数据集作为测试样本,进行了大量的实验.实验结果表明WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果.WKSC算法可很好的应用于大量高维热点话题的模式分析. 相似文献
7.
基于EMD与K-means算法的时间序列聚类 总被引:1,自引:0,他引:1
有效实现时间序列聚类的重要前提是序列的维数得到约简,序列中包含的噪声能够被滤除.文中提出一种能够对时间序列进行有效预处理的方法.该方法先通过经验模态分解实现时间序列趋势的提取,再利用自底向上算法对趋势序列进行分段,最后转换成由{-1,0,1}构成的齐序列.为了证明该方法既能实现降维,也可实现数据序列中噪声的滤除,文中利用K-means算法对经过上述方法预处理后的序列进行聚类.实验结果表明,与直接对原序列进行聚类相比,对预处理后的数据序列进行聚类,空间复杂度较低、准确性较高. 相似文献
8.
提出了一种基于DTW的符号化时间序列聚类算法,对降维后得到的不等长符号时间序列进行聚类。该算法首先对时间序列进行降维处理,提取时间序列的关键点,并对其进行符号化;其次利用DTW方法进行相似度计算;最后利用Normal矩阵和FCM方法进行聚类分析。实验结果表明,将DTW方法应用在关键点提取之后的符号化时间序列上,聚类结果的准确率有较好大提高。 相似文献
9.
10.
11.
12.
针对复杂系统多变量序列预测研究中数据样本过多、信息冗余等问题,从学习样本选择和聚类中心优化两方面对径向基函数(RBF)网络进行改进.基于复杂系统多变量时间序列,首先采用一个线性相关函数和一个非线性相关函数分别计算多变量状态间的线性相关性和非线性相关性,确定一个包含系统有效信息的小数据集;然后基于小数据集,采用K均值聚类方法确定RBF网络的隐层聚类中心,并引入局部搜索过程,优化聚类中心结果;输入其它训练样本,确定网络权值.仿真结果表明,与常规RBF网络学习方法比较,在隐层节点数目相同情况下,改进的方法有效地确定了网络的聚类中心,达到更好的预测精度. 相似文献
13.
Policker S. Geva A.B. 《IEEE transactions on systems, man, and cybernetics. Part B, Cybernetics》2000,30(2):339-343
The object of this paper is to present a model and a set of algorithms for estimating the parameters of a nonstationary time series generated by a continuous change in regime. We apply fuzzy clustering methods to the task of estimating the continuous drift in the time series distribution and interpret the resulting temporal membership matrix as weights in a time varying, mixture probability distribution function (PDF). We analyze the stopping conditions of the algorithm to infer a novel cluster validity criterion for fuzzy clustering algorithms of temporal patterns. The algorithm performance is demonstrated with three different types of signals. 相似文献
14.
针对Nyström方法在谱聚类应用中存在聚类效果不稳定、样本代表性较弱的问题,提出基于加权集成Nyström采样的谱聚类算法.首先利用统计杠杆分数区别数据间的重要程度,对数据进行加权.然后基于权重采用加权K-means中心点采样,得到多组采样点.再引入集成框架,利用集群并行运行Nyström方法构建近似核矩阵.最后利用岭回归方法组合各个近似核矩阵,产生比标准Nyström方法更准确的低秩近似.在UCI数据集上的测试实验表明,文中算法取得较理想的聚类结果. 相似文献
15.
针对时间序列的数据挖掘将时间序列数据转换为离散的符号序列, 提出了一种基于滑动窗口及局部特征的时间序列符号化方法。该方法采用了滑动窗口的方法将时间序列分割, 每个分段采用多个斜率表示, 最后采用K-均值聚类算法对斜率表示的分段进行聚类, 实现时间序列的符号化。实验证明了该方法的有效性与准确性。 相似文献
16.
多元混沌时间序列的因子回声状态网络预测模型 总被引:1,自引:0,他引:1
针对采用回声状态网络预测多元混沌时间序列时存在的病态解问题, 本文建立了因子回声状态网络模型, 通过因子分析(Factor analysis, FA)方法提取高维储备池状态矩阵的公因子, 去除冗余和噪声成分. 利用降维后的因子变量与期望输出之间的线性回归关系, 求解网络未知参数. 基于Lorenz序列和大连月平均气温--降雨量的仿真实验验证了本文所提模型的有效性. 相似文献