首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
时间序列相似模式的分层匹配   总被引:1,自引:1,他引:0  
首先将时间序列经EMD分解成细节部分和趋势部分,对低频趋势部分的序列数据进行线性分段近似表示,完成对序列数据的压缩,并将其变换成一种0-1串的形式,以适应趋势序列的快速匹配;然后通过对趋势序列模式聚类,达到对序列的粗匹配;最后对粗匹配的序列进行距离计算,从而获取细匹配的模式.实验结果表明该算法是有效的.  相似文献   

2.
时间序列数据挖掘是时态数据挖掘的一个重要方面,针对金融时间序列非稳定、非线性的特点,使用EMD方法进行序列趋势的提取,得到了原始时间序列的长期趋势。在此基础上提出了子序列分层匹配算法,首先进行时间序列趋势的粗匹配,在结果集中进一步进行细节匹配,与传统方法相比,提高了相似性匹配的效率,减少了结果集的冗余。  相似文献   

3.
对现有最大序列模式挖掘算法候选序列模式过多以及可扩展性差的缺点,提出了一种基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先为所有频繁1序列构建位置信息表;然后利用纵向、横向结合搜索位置信息表的序列扩展匹配方法找到潜在最大序列模式;在进行序列匹配扩展的同时,把每个找到的潜在最大序列模式存储在改进的前缀树PStree(prefix sequential pattern tree)中,树中每个结点链接到索引Hash表,Hash表中保存了结点的位置信息,对于那些重复的序列可以直接从Hash表中找到其位置信息;最后通过对前缀树PStree进行剪枝,得到由最大序列模式组成的前缀树MPStree(maximal sequential pattern tree).实验结果表明算法CSMS具有较好的时间效率和扩展性.  相似文献   

4.
研究仿真数据优化匹配传输效率问题,随着分布交互式仿真规模的扩大,如何高效地对仿真数据进行分发和过滤成为一个重要的问题.针对分布交互式仿真领域数据类型固定和属性个数跨度较大的特点,在分析和研究已有事件匹配算法的基础上,提出了模式覆盖集的概念,并设计了一种采用模式覆盖技术的仿真数据匹配算法.改进算法综合考虑了谓词之间的相互关系和订阅条件所属模式之间的覆盖关系,从减少无关的谓词匹配和高效组织订阅条件两方面加速了仿真数据的匹配过程.实验结果表明与谓词计数算法相比,改进算法能较大地提高匹配性能.  相似文献   

5.
孟玉飞  武优西  王珍  李艳 《计算机应用》2023,(12):3740-3746
针对现有的对比序列模式挖掘方法主要针对字符序列数据集且难以应用于时间序列数据集的问题,提出一种对比保序模式挖掘(COPM)算法。首先,在候选模式生成阶段,采用模式融合策略减少候选模式数;其次在模式支持度计算阶段,利用子模式的匹配结果计算超模式的支持度;最后,设计了动态最小支持度阈值的剪枝策略,以进一步有效地剪枝候选模式。实验结果表明,在6个真实的时间序列数据集上,在内存消耗方面,COPM算法至少比COPM-o(COPM-original)算法降低52.1%,比COPM-e(COPM-enumeration)算法低36.8%,比COPM-p(COPM-prune)算法降低63.6%;同时在运行时间方面,COPM算法至少比COPM-o算法降低30.3%,比COPM-e算法降低8.8%,比COPM-p算法降低41.2%。因此,在算法性能方面,COPM算法优于COPM-o、COPM-e和COPM-p算法。实验结果验证了COPM算法可以有效挖掘对比保序模式,发现不同类别的时间序列数据集间的差异。  相似文献   

6.
压缩频繁序列模式集是针对频繁序列模式的全集太大这个问题的一种解决方法.为了得到高质量的压缩效果,先对频繁序列模式聚簇,再从每个簇中挑选出有代表性的序列模式,使这些有代表性的序列模式的数目尽可能地少.一个贪婪算法和一个基于候选集的快速算法是压缩频繁序列模式集的有效算法.有代表性的序列模式集合是频繁序列模式的一种子集,实验结果表明它能取得很好的压缩效果.  相似文献   

7.
基于Shapelet剪枝和覆盖的时间序列分类算法   总被引:2,自引:0,他引:2  
原继东  王志海  韩萌 《软件学报》2015,26(9):2311-2325
时间序列shapelets是时间序列中能够最大限度地表示一个类别的子序列.解决时间序列分类问题的有效途径之一是通过shapelets转换技术,将shapelets的发现与分类器的构建相分离,其主要优点是优化了shapelets的选择过程,并能够灵活应用不同的分类策略.但该方法也存在不足:一是在shapelets转换时,用于产生最好分类结果的shapelets数量是很难确定的;二是被选择的shapelets之间往往存在着较大的相似性.针对这两个问题,首先提出了一种简单有效的shapelet剪枝技术,用于过滤掉相似的shapelets;其次,提出了一种基于shapelets覆盖的方法来确定用于数据转换的shapelets的数量.通过在多个数据集上的测试实验,表明了所提出的算法具有更高的分类准确率.  相似文献   

8.
提出了一种全新的服务发现方法.其核心思想是通过从以往服务组合序列中发现高频率出现的组合序列集, 然后利用该序列集进行服务推荐.给出了服务推荐系统框架;对序列模式算法进行了改进,以适应连续序列挖掘的需求, 并描述了服务推荐的匹配算法;最后通过在一个原型系统的性能测试证明服务推荐方法是可行和有效的.  相似文献   

9.
基于交叉覆盖算法的时间序列模式匹配   总被引:7,自引:0,他引:7  
为了有效进行时间序列的匹配,提出了基于交叉覆盖算法的模式匹配方法。首先对时间序列进行预处理,使它们分布在n+1维空间中某个中心在原点的球面上,再通过学习构造分类器,实现序列的准确匹配。主要讨论完全匹配查询,即把两两相似的时间序列分别归类,所以利用交叉覆盖算法准确分类的功能可以完成所探讨的问题。  相似文献   

10.
提出了一种新的正面人脸检测算法。该方法利用经验模式分解和匹配追踪算法来提取人脸特征,训练Bayes分类器来进行分类判决。在FERET人脸库中与特征脸(Eigenfaces)方法进行了比较,实验结果表明,该算法的计算效率和检测精度均优于特征脸方法。  相似文献   

11.
传统时序预测方法其预测过程无法在相同数据集上推出共享模式, 而机器学习方法无法较好地处理非线性和大规模数据集, 并且需要手动设计特征工程. 深度学习方法弥补了传统预测方法需要高计算高人力的弊端, 用自动学习特征工程代替了手动设计特征工程. 但仅使用深度学习的预测方法所作结构假设较少, 通常需要较高的计算资源以及大量的数据来学习得到准确的模型. 针对上述问题, 本文提出通过采用融合t检验的EMD经验模态将序列分为高频分量和低频分量, 对高频分量使用传统STL序列分解方法进一步对数据做处理, 对高频、低频分量分别进行Prophet预测. 实验结果表明, 相较于传统的LSTM以及Prophet预测模型, 经过STL序列分解后的周期数据能够提升模型的整体预测精确度而融合EMD经验模态的Prophet模型则大大提升了训练效率.  相似文献   

12.
动态时间弯曲距离能度量不等长的时间序列、且具有较高的匹配精度,因此广泛应用在时间序列模式匹配中。但其计算复杂度较高,制约了在大规模数据集上的应用。为了实现时间序列模式度量结果和计算复杂度的平衡,提出一种基于特征点界标过滤的时间序列模式匹配方法。首先,提出一种特征点界标过滤的特征提取方法,保留时间序列主要特征,压缩时间维度;然后,利用动态时间弯曲距离对特征序列进行相似性度量;最后,在应用数据集上对所提方法进行有效性验证。实验结果表明,所提方法在保证高精度的前提下,能有效降低计算复杂度。  相似文献   

13.
基于EMD和LS-SVM的非平稳振动信号趋势预测   总被引:5,自引:0,他引:5  
镇动信号的趋势预测是设备状态监测与故障诊断中的一个重要内容。随着运行设备的非线性、非平稳特点越来越明显,传统的数学建摸预报方法已不能满足设备的复杂化和现代化要求。提出了一种基于经验模式分解EMD(Empirical Mode Decomposition)和最小二乘支持向量机LS-SVM(Least Square Support Vector Machine)的新模型。首先,运用 EMD 将趋势时间序列自适应地分解成一系列不同尺度的本征模式分量IMF(intrinsic mode function);其次,对每个本征模式分量,采用合适的核函数和超参数构造不同的LS-SVM 进行预测;最后对各分量的预测值进行拟合得到最终的预测值。仿真实验表明,此方法与单一的LS-SVM预测法相比,具有较高的精度和较强的推广能力。  相似文献   

14.
复杂系统数据序列集未来行为的预测是一个难点,利用数据挖掘实现预测是有潜力的技术途径.针对包含多元时间序列和非时间序列的实时演进数据集,整合序列分割、聚类、模式在线匹配等处理流程,提出了一种主题发现与联合决策相结合的预测方法.在整个方法构建中,将拟构造的主题发现式预测和联合决策预测融合进前期的序列分割与聚类中,采用多时间粒度、多跨度对序列进行对应分层与分割,聚合形成各层的标准模式集.再以标准模式集,依照预测策略,反向搜索具有高稳定性延展行为的复合模式作为主题模式集,从而实现基于在线模式匹配的行为预测.最后,采用分布式并行计算的架构实现整个处理算法.理论推导和实验数据分析证明,相比传统的时间序列预测方法准确度得到提高.  相似文献   

15.
时间序列的相似性度量是时间序列分析的基础工作之一,是进行相似匹配的关键。针对欧几里德距离描述分段趋势的不足和各种模式距离对应分段之间距离值的离散化问题,提出一种基于形态相似距离的时间序列相似性度量方法,标准数据集上完成的识别和聚类实验表明了该方法的可行性和有效性。  相似文献   

16.
基于神经网络的多变量时间序列预测及其在股市中的应用   总被引:10,自引:0,他引:10  
首先分别由开盘价、最低价、最高价和收盘价序列经小波变换得到在大尺度上的各自逼近序列,并由这些逼近序列进行相空间重构,得到各自重构相空间内的点,即矢量列.然后将这4个矢量列组合成一个维数更高的矢量列,作为神经网络的输入,对其进行训练.最后用训练好的网络对2000年初的牛市行情中的上证指数波动趋势进行预测,结果令人满意.  相似文献   

17.
基于互关联后继树的时间序列相似性查询   总被引:4,自引:0,他引:4  
时间序列的相似性查询是分析时间序列变化规律的一种重要方法,对于时间序列的分类、预测以及知识发现都具有重要的现实意义。提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法。其主要思想是:首先依据序列变化的重要点将序列逐步分段,抽取各子段的变化特征,通过分类方法将其转变成符号序列,在此基础上,引入一种称为互关联后继树的全文索引技术,从而实现序列的快速相似性查询,其时间复杂度降到了O(L),此外,该算法还保证在建立索引后查询结果不会有任何的错误丢失。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号