首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
基于弧度距离的时间序列相似度量   总被引:2,自引:0,他引:2  
时间序列的近似表示和相似度量是时间序列数据挖掘的重要任务之一,是进行相似匹配的关键。该文针对现有的各种基于分段线性表示(Piecewise Linear Representation,PLR)相似度量方法存在的序列长度依赖和多分辨率条件下的潜在识别误差等缺点,提出了一种序列分段线性弧度表示和基于弧度距离的相似度量方法,实现了序列的快速在线分割和相似度计算。该方法简洁直观,利用分段弧度对分段趋势进行细粒度划分来保留序列主要形态特征,有效地提高了度量结果的准确性和多分辨率条件下的稳定性。该方法具有序列分割算法独立性特点,可用于时间序列的相似查询、模式匹配、分类和聚类。  相似文献   

2.
基于形态的时间序列相似性度量研究   总被引:8,自引:0,他引:8  
时间序列重新描述和相似性度量是时间序列数据挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要。该文提出了一种新的基于形态的时间序列符号描述,并给出相应的距离公式,以度量时间序列的相似性。该方法直观简洁,对数据的平移、伸缩不敏感,能够反映序列趋势变化的程度、去除噪声的影响,满足时间多分辨率要求。仿真结果表明,该方法具有较好的聚类性能,可以在不同分辨率下有效度量时间序列的形态相似性。  相似文献   

3.
针对常规形状相似性度量方法在噪声干扰、部分信息遮挡和缺失情况下鲁棒性和准确性不足的问题,提出了一种基于主曲率增强距离变换的形状相似性度量方法.通过距离变换扩展形状轮廓的作用范围,提升相似性度量结果的鲁棒性;基于主曲率增强距离图,提升信息量丰富轮廓在变换图中的响应,提升度量结果的准确性.仿真对比实验验证了方法在噪声干扰以及部分轮廓遮挡或缺失情况下的鲁棒性和准确性,道路矢量与GPS信号和光学遥感图像的应用试验表明方法在实际应用中的有效性.与传统的形状相似性度量方法相比,基于主曲率增强距离变换的方法适用于非刚性目标形状相似性度量,而且鲁棒性和准确度较高.  相似文献   

4.
序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义。序列相似性算法包括基于序列比对的方法及非比对方法两种。基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异。因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量。使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合。通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性。  相似文献   

5.
时间序列的相似性度量是衡量两个序列相似性的依据.动态时间弯曲距离计算方法具有较强的健壮性且可以度量不同长度的时间序列间的相似性,但其十分耗时.采用波前式推进方法并行计算动态时间弯曲距离并以流水线并行方式传送局部子结果,提出一个在机群系统上实现的度量两个时间序列相似性的并行算法.PC机群系统上的实验结果表明,该并行算法高效,获得了良好的加速和可扩展性.  相似文献   

6.
面向数据挖掘的时间序列符号化方法研究   总被引:21,自引:1,他引:20  
针对时间序列的数据挖掘首先需要将时间序列(Time Series)数据转换为离散的符号序列(Symbol Sequences),本文提出了一个简单高效的时间我符号化方法,该方法的特点:一是利用线性化分段表示法所独有的形态分割与表达能力实现了时间序列的分段与表示:二是利用神经网络模糊聚类算法实现了时间序列的在线聚类。提出以矢量间开矿相似性度量作为聚类依据。并利用该方法实现了对金融领域时间序列数据的符  相似文献   

7.
在Web行为挖掘中,序列模式聚类是一个很重要的课题,其首要问题就是web序列模式间的相似性度量.以往的多数方法都仅仅针对序列本身进行度量,而忽略了系统中资源本身所存在的关联关系以及用户对资源访问的时间因素.针对该问题,提出了一种基于考虑资源相似性的web访问序列模式的相似度量方法,并且考虑了用户访问资源的时间因素.经过检验,证明能够有效真实地反映实际情况.  相似文献   

8.
针对目前时间序列模式发现中使用的时间序列相似性度量易受尺度(scale)和平移的影响,不适应基于形状的时间序列模式发现,本文提出了一种重标和平移不变的时间序列相似性度量:Sh 度量,给出度量的性质及其证明。同时提出了基于Sh度量的时间序列形状模式发现算法,并对算法的有限次迭代终止性和时间复杂性进行了证明。论文最后通过对人工数据和太阳黑子数据的实验证明了本文提出的Sh度量及基于形状的时间序列模式发现算法的有效性。  相似文献   

9.
纹理图像检索的不同相似性度量方法的比较研究   总被引:1,自引:0,他引:1  
图像特征和相似性度量方法的选取是基于内容图像检索的一个关键环节。针对该问题,提出一种基于整数小波包分解的纹理特征检索方法。通过连接小波包分解后各尺度内和尺度闯不同频带的小波系数,提取标准方差和均值信息描述纹理。此外,对8种相似性度量方法进行了分析和比较。通过对纹理库的检索实验表明,与传统的距离测度相比,Canberra和Bray—Curtis距离测度能有效地提高图像的检索性能。  相似文献   

10.
基于小波分解的AR-SVR一类非平稳时间序列预测   总被引:4,自引:0,他引:4  
曾凡仔  裘正定 《信号处理》2004,20(2):108-111
本文提出了一种基于小波分解的均值具有趋向性的非平稳时间序列预测方法。方法首先利用具有平移不变性的小波分解,分离非平稳时间序列中的长期趋势和高频信息(短期行为),然后对高频信息构建自回归AR模型,而对于趋势则利用支撑向量回归(SVR)进行拟合,最后将各模型的预测结果进行叠加,从而得到原始序列的预测值。这样保证了充分拟合长期趋势的同时,避免了短期行为造成的过拟合。最后的实验结果表明本文提出的这类非平稳时间序列预测方法是有效的。  相似文献   

11.
针对不同扩展目标产生的量测密度差别较大时的量测集划分问题,为扩展目标概率假设密度(PHD)滤波器提出了一种基于共享最近邻(SNN)相似度的量测集划分算法。量测间的SNN相似度可体现量测在量测空间局部分布情况,考虑了量测周围的量测信息,因此提出的SNN相似度划分法能够较好地划分量测密度差别较大的量测集,进而提高了扩展目标的跟踪性能,且基于提出的划分算法的PHD滤波器计算量也所减少。  相似文献   

12.
An effective analysis of clinical trials data involves analyzing different types of data such as heterogeneous and high dimensional time series data. The current time series analysis methods generally assume that the series at hand have sufficient length to apply statistical techniques to them. Other ideal case assumptions are that data are collected in equal length intervals, and while comparing time series, the lengths are usually expected to be equal to each other. However, these assumptions are not valid for many real data sets, especially for the clinical trials data sets. An addition, the data sources are different from each other, the data are heterogeneous, and the sensitivity of the experiments varies by the source. Approaches for mining time series data need to be revisited, keeping the wide range of requirements in mind. In this paper, we propose a novel approach for information mining that involves two major steps: applying a data mining algorithm over homogeneous subsets of data, and identifying common or distinct patterns over the information gathered in the first step. Our approach is implemented specifically for heterogeneous and high dimensional time series clinical trials data. Using this framework, we propose a new way of utilizing frequent itemset mining, as well as clustering and declustering techniques with novel distance metrics for measuring similarity between time series data. By clustering the data, we find groups of analytes (substances in blood) that are most strongly correlated. Most of these relationships already known are verified by the clinical panels, and, in addition, we identify novel groups that need further biomedical analysis. A slight modification to our algorithm results an effective declustering of high dimensional time series data, which is then used for "feature selection." Using industry-sponsored clinical trials data sets, we are able to identify a small set of analytes that effectively models the state of normal health.  相似文献   

13.
14.
随着磁场模拟技术的发展,多种磁源能够对目标磁场进行精细化的模拟,传统的磁场判定方法难以对其相似情况进行度量.针对此问题,提出了一种基于离散Fréchet距离的磁场相似性度量特征值.根据磁场曲线的特点,首先改进了Fréchet方法中离散点间的距离评价指标,并提出了能够度量横坐标相似情况且消除目标速度不同的影响的参数,然后得到磁场相似性度量特征值,最后通过实例验证了其可行性.相对于传统方法,该特征值能够对更加相近的磁场曲线的相似情况进行评价.  相似文献   

15.
We propose hierarchical clustering and filtering methods for the analysis of spatio-temporal multidimensional time series, where both methods are based on a new pseudo distance. The pseudo distance is determined between orthogonal matrices, which are derived by eigenvalue decomposition of the variance-covariance matrix of the time series. Because the grouping algorithm is also important in clustering, a modified Ward method grouping criterion is used here. The filtering derives temporal similarity information between two time series, providing information that cannot be evaluated by the clustering. If the time series to be clustered and filtered cannot be obtained directly, different time series reflecting the original time series are used instead. There exists a transform between the time series, and hence, scaling distortion occurs. We also propose a scaling normalization method. As an application example, we present an analysis of a multichannel magnetoencephalography (MEG) and/or electroencephalography (EEG) time series. Each of the MEG and EEG generations is a transform from the same electrophysiological brain activity. We applied these methods to sound localization-related MEG time series and evaluated their effectiveness. These methods may be useful for discovering similarity among many multidimensional time series without a priori information and/or hypotheses.  相似文献   

16.
一种新的基于对应像素距离度量的图像相关匹配方法   总被引:7,自引:2,他引:5  
传统的图像相关匹配方法中,由于实时图和参考图之间存在着灰度差异和一定程度的几何形变以及对目标的局部遮挡,使得利用求取对应像素灰度差累加和来进行相似性度量算法的性能很容易受到影响。文中从另一角度提出了一种新的图像相关匹配算法。该方法改变了原先匹配算法中求取模块图像和目标图像的像素灰度差的和的方法,而改为求取两幅图像之间相接近的点的个数,从而使匹配算法的稳定性大大提高,因为 局部出现的大片噪声点将不会影响匹配的结果,而这样的情况在传统的相关算法中将会显著影响匹配结果。实验结果表明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号