共查询到17条相似文献,搜索用时 265 毫秒
1.
对当前聚类算法进行研究的基础上,提出了有效地实现多元时间序列聚类的方法.用离散哈达玛变换对多元数据进行降维,求出多元变量相关系数矩阵的特征值作为权值.采用带权值的矩阵相似性度量方法,利用改进的K-means算法对多元时间序列进行聚类分析.实验结果表明,该方法能够有效地实现多元时间序列聚类,把具有相似趋势变化的多元时间序列对象划分到同一类中. 相似文献
2.
仿射传播算法是一种快速有效的聚类方法,但其聚类结果的不稳定性影响了聚类性能。对此,提出基于近邻的仿射传播算法(AP-NN),通过仿射传播算法产生初始簇,并从中选择代表簇对非代表簇的样本进行近邻聚类。在时间序列数据集上的实验结果表明,AP-NN模型算法能够产生较好的聚类结果,适用于聚类分析。 相似文献
3.
4.
对于时间序列聚类任务而言,一个有效的距离度量至关重要.为了提高时间序列聚类的性能,考虑借助度量学习方法,从数据中学习一种适用于时序聚类的距离度量.然而,现有的度量学习未注意到时序的特性,且时间序列数据存在成对约束等辅助信息不易获取的问题.提出一种辅助信息自动生成的时间序列距离度量学习(distancemetric learning based on side information autogeneration for time series,简称SIADML)方法.该方法利用动态时间弯曲(dynamic time warping,简称DTW)距离在捕捉时序特性上的优势,自动生成成对约束信息,使习得的度量尽可能地保持时序之间固有的近邻关系.在一系列时间序列标准数据集上的实验结果表明,采用该方法得到的度量能够有效改善时间序列聚类的性能. 相似文献
5.
符号化表示技术,可以有效降低时间序列的维度,是实现海量时间序列数据挖掘的基础.聚类结果的精度是运用聚类方法对多元时间序列进行符号化表示的关键.运用共同马氏距离虽然可以实现多元时间序列的符号化表示,但忽略了不同类样本数量对聚类结果的影响,从而降低了符号化表示的有效性.针对上述问题,提出一种改进共同马氏距离的多元时间序列符号化表示方法,通过改进共同协方差矩阵的计算方法,优化了聚类结果,从而提高了符号化表示的有效性.仿真结果表明,改进后的方法可以更加有效地对多元时间序列进行符号化表示. 相似文献
6.
7.
时间序列事件聚类是研究事件分类及挖掘分析的基础。现有聚类方法多直接针对具有时间属性且结构复杂的持续事件聚类,未考虑聚类对象的转化,聚类准确性低且效率差。针对这些问题,提出一种面向时间序列事件的动态矩阵聚类方法RDMC。首先,构建事件近邻评价体系,根据评价值优劣衡量事件的代表性,通过近邻评分的后向差分计算策略构建RDS候选集;其次,提出基于组合优化的RDS选取方法,从候选集上快速得到RDS最优解;最后,动态构建RDS与数据集的距离矩阵,提出基于K-means的矩阵聚类方法,实现时间序列事件所属类别的有效划分。实验表明,相比现有方法,所提方法在聚类准确率、聚类可靠性、聚类效率等方面具有明显优势。 相似文献
8.
9.
时间序列聚类分析是数据挖掘研究的一个重要内容。已有的聚类算法大多采用k均值对低维数据进行聚类,不能对高维多变量时间序列(MTS)数据进行有效聚类。提出一种高效的多变量时间序列聚类算法PCA-CLUSTER,首先利用主成分分析对MTS数据降维;选取MTS数据的主成分序列进行K近邻聚类分析。理论分析和实验结果表明算法可以有效解决MTS数据聚类问题。 相似文献
10.
11.
针对传统的Gath-Geva(G-G)模糊分段方法需要人为设置参数,对高维时间序列分段效率低的问题,提出一种基于核主元分析(KPCA)和G-G聚类的多元时间序列模糊分段方法.首先,该算法利用KPCA方法对多元时间序列进行特征提取,去除冗余及无关变量的影响;然后,通过近邻传播算法(AP)得到分段数目的上界;最后,将时间信息考虑在内,基于所提出的MDBI有效值指标以及G-G模糊聚类在低维多元时间序列上实现多元时间序列的最佳模糊分段.实验结果表明,所提出算法可以快速有效地检测出时间序列的某种突然和渐近变化的趋势,在准确性和运行效率方面均得到了提升. 相似文献
12.
针对高维特性对多元时间序列数据挖掘过程和结果的影响,以及传统主成分分析方法在多元时间序列数据特征表示上的局限性,提出一种基于变量相关性的多元时间序列数据特征表示方法。通过协方差矩阵描述每个多元时间序列的分布特征和变量相关关系,利用主成分分析方法对综合协方差矩阵进行主元分析,进而实现多元时间序列的数据降维和特征表示。实验结果表明,所提出的方法不仅能提高多元时间序列数据挖掘的质量,还可以对不等长多元时间序列进行快速有效的挖掘。 相似文献
13.
基于模糊连接度的近邻传播聚类图像分割方法 总被引:1,自引:0,他引:1
针对现有近邻传播聚类图像分割方法分割精度低的问题,提出一种基于模糊连接度的邻近传播聚类(FCAP)图像分割算法。针对传统模糊连接度算法不能得出任意点对间模糊连接度的不足,结合最大生成树提出了全模糊连接度算法。FCAP算法先使用Normalized Cut超像素技术进行超像素分割,这些超像素可以看作数据点以及它们之间的模糊连接度;然后使用所提出的全模糊连接度算法计算超像素间的模糊连接度,根据模糊连接度和空间信息计算超像素的相似度;最后使用近邻传播(AP)聚类算法完成分割。实验结果表明,FCAP算法明显优于超像素处理后直接使用AP聚类算法进行分割的方法,并且优于无监督图像分割方法。 相似文献
14.
15.
针对传统模糊聚类分析法在信息系统的决策分析中无法有效解决各因素之间的相关性干扰,以及不同特征属性对聚类目标存在重要性差异等问题,本文提出一种融合层次分析法、Mahalanobis距离法及专家群决策法的改进模糊聚类分析法。在特征属性的重要性处理环节,层次分析法用于判断不同特征属性的相对重要性差异;引入Mahalanobis距离法进行相似矩阵的构建,能解决变量之间的相关性干扰问题;专家群决策法用于确定最佳阈值λ,能最大程度地降低主观因素对评价结论的不利影响。在SRM中的应用实验结果表明,改进的模糊聚类分析法在客观性和准确性上更能满足信息系统决策分析的需要。 相似文献
16.
针对传统谱聚类算法中亲合矩阵构造不准确和聚类结果不稳定的问题,提出一种基于邻里关系传播与模式合并的谱聚类算法。根据邻里关系传播原则更新子集内样本的相似度,设计局部最大相似值更新方法更新子集间样本的相似度,使用模式合并技术对子集个数较多的集合加以合并得出粗类,再对粗类间样本相似度进行二次更新,构造出亲合矩阵并将其用于谱聚类运算。实验结果表明,二次更新后,同类中样本的相似度被相对性放大,而不同类中样本的相似度则相对性缩小。与近邻传播的谱聚类算法相比,使用该算法能够得到更准确、稳定的聚类结果。 相似文献
17.
谱聚类将数据聚类问题转化成图划分问题,通过寻找最优的子图,对数据点进行聚类。谱聚类的关键是构造合适的相似矩阵,将数据集的内在结构真实地描述出来。针对传统的谱聚类算法采用高斯核函数来构造相似矩阵时对尺度参数的选择很敏感,而且在聚类阶段需要随机确定初始的聚类中心,聚类性能也不稳定等问题,本文提出了基于消息传递的谱聚类算法。该算法采用密度自适应的相似性度量方法,可以更好地描述数据点之间的关系,然后利用近邻传播(Affinity propagation,AP)聚类中“消息传递”机制获得高质量的聚类中心,提高了谱聚类算法的性能。实验表明,新算法可以有效地处理多尺度数据集的聚类问题,其聚类性能非常稳定,聚类质量也优于传统的谱聚类算法和k-means算法。 相似文献