首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
基于极值点特征的时间序列相似性查询方法*   总被引:4,自引:2,他引:2  
为了提高时间序列子序列匹配的准确度和效率,提出了基于极值点特征的时间序列相似性查询方法。首先识别出时间序列中的极值特征点,根据极值点使用多层次极值划分法对长序列进行划分;然后对划分得到的多层次子序列集使用改进的动态时间弯曲方法与查询序列进行相似性匹配;最后找到与查询序列最相似的子序列。实验表明,此方法在保证准确度的情况下大大提高了相似性搜索过程的效率。  相似文献   

2.
序列数据相似性查询技术研究综述   总被引:2,自引:0,他引:2  
序列数据在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种提取有用信息的重要手段.近年来,随着各种科学计算的发展和序列数据的大量产生,序列相似性查询已经成为数据分析领域一个研究热点.其涉及到的几个重要问题有面向各种应用领域的相似性度量及其相互之间的关系;随机序列数据中距离分布的统计信息及其对分析查询算法性能的作用;在大规模数据中,各种高效回答相似性查询的关键技术及各自的优缺点比较.总结了序列数据的分类和特点,给出了几种序列数据相似性度量和随机序列之间距离分布的统计信息,并进一步分析了这些度量之间的关系.接着给出了几种序列相似性查询的类型,以及序列相似性查询要解决的核心问题.在此基础上,针对各种序列相似性查询关键技术进行分类和评价.最后,讨论了关于序列数据相似性查询研究所面临的挑战,并归结了未来的研究方向.  相似文献   

3.
传统的基于相关反馈的时间序列相似性搜索是将正反馈和负反馈融合在一起创建新查询向量,这样并没有充分利用负反馈序列的价值,而且容易对初始查询向量进行过多的更改。本文提出一种基于反馈的时间序列相似搜索方法,将反馈的正相关和负相关序列分开处理,最终的相似序列不但要与正相关序列相似,还要尽量与负相关序列不相似。在UCR数据集上的实验结果表明,本文提出的相似搜索方法与传统的基于反馈的相似搜索方法相比,在某些数据集上可以提高查询的准确率以及查全率。  相似文献   

4.
利用反馈的时序模式挖掘算法研究   总被引:2,自引:0,他引:2  
针对时序数据相似性挖掘方法进行研究,提出一种利用反馈的时序数据相似性挖掘算法,由用户赋予各初始范围查询得到的相似序列相应的权值,通过反馈与给定序列叠加产生新的查询序列,再次进行范围查询,获得相似序列,将该算法用于某钢铁企业的电力负荷时序数据,计算结果表明了算法的有效性。  相似文献   

5.
多元时间序列相似模式挖掘是数据挖掘领域的研究热点,它主要包括特征表示、相似模式度量和相似性搜索3个方面.目前,大部分研究成果主要集中在特征表示和相似模式度量,相似性搜索则成为制约问题突破的关键环节.为此,主要针对多元时间序列的相似性搜索进行综述,归纳了主要的相似模式度量方法,对比了不同相似模式度量下的序列搜索方法,并分析了不同方法的优缺点,以期为进一步研究多元时间序列相似性搜索提供帮助.  相似文献   

6.
电力电子装置故障波形相似性度量的小波矩阵变换法   总被引:1,自引:0,他引:1  
提出一种基于小波矩阵变换的时序序列相似度量方法,并对该方法应用于电力电子装置故障波形相似性度量进行了抗噪性、灵敏度及相似值准确性分析.方法首先采用小波变换将时序序列压缩到小波子空间,再由K-L变换(Karhunen-Loveve transformation)提取样本时序序列的特征向量和正交基,然后将分析时序序列通过内积变换映射到正交基中得到分析特征向量,最后计算两个特征向量之间的欧式距离以判定时序序列的相似度.以电力电子装置故障波形的相似度量为例,实验表明该方法特征向量维数低,抗噪性好于直接小波法30倍,灵敏度是直接小波法1/3,相似值准确性好于小波奇异值法.该方法对于大规模时序序列的相似匹配和检索具有潜在的应用价值.  相似文献   

7.
基于小波变换的时间序列相似模式匹配   总被引:21,自引:1,他引:21  
提出了一种新的时序相似模式匹配方法,它采用小波分析的方法实现时间序列数据的降维,采用小波序列表示原序列,将小波序列组织为多维索引结构R-tree存储,在该索引结构基础上,基于一种表示相似性的距离函数,定义了范围查询和最近邻查询算法,实验结果证明这种方法性能优于传统的基于傅立叶变换的相似模式匹配方法。  相似文献   

8.
有效管理生物数据并提供高效的查询方法是生物信息处理的重要研究内容.BioSeg是一个新的生物序列数据模型.查询优化研究是生物数据库管理系统开发的重要内容之一.研究当前生物数据索引技术,针对BioSeg数据模型的特点和生物序列相似性查询需求设计了一种新的生物序列数据索引BioIndex,并设计相应的查询算法.首先,使用MEME(Multiple EM for Moeif Elicitation)算法挖掘生物序列集中的序列模式作为索引建立索引序列库;之后,在索引序列库中查找与查询序列最相似的索引序列,将其对应的序列集作为候选集;再在候选集中查找与查询序列最相似的序列.在真实生物序列数据集上的实验表明使用新的生物序列数据索引BioIndex的序列查询算法提高了序列查询的效率.  相似文献   

9.
飞行数据是一种典型的多元时间序列数据,基于奇异值分解提取飞行数据序列的特征,通过奇异值距离过滤获得相似模式查询的候选集,依据线性空间中的坐标变换原理构造多元时间序列的相似性度量模型,从而实现候选集上的精确匹配并获得最终的结果集。给出了相似子序列的冲突消解策略,深入分析了查询的完备性问题,指出该方法可能导致误判或成为误判的根源,提出融入先验规则来减少误判并提高查询效率的方法。在真实飞行数据上的实验结果验证了方法的有效性。  相似文献   

10.
相似性连接查询技术研究进展   总被引:1,自引:0,他引:1  
相似性连接查询,即查找相似的数据对象对,具有广泛的应用领域,例如相似网页检测、实体解析、数据清洗和相似图像检索等。相似性连接查询是当前大数据处理领域的热点问题之一。讨论了相似性连接查询面临的挑战;根据不同的标准对现有的相似性连接查询进行了分类;总结并比较了现有的字符串、集合、向量和图相似性连接算法;探讨了今后的研究重点和发展趋势。  相似文献   

11.
近年来,各种类型的媒体数据,如音频、文本、图像和视频,在互联网上呈现爆发式增长,不同类型的数据通常用于描述同一事件或主题。跨模态检索提供了一些有效的方法,可以为任何模态的给定查询搜索不同模态的语义相关结果,使用户能够获得有关事件/主题的更多信息,从而达到以一种模态数据检索另外一种模态数据的效果。随着数据检索需求以及各种新技术的发展,单一模态检索难以满足用户需求,研究者提出许多跨模态检索的技术来解决这个问题。梳理近期跨模态检索领域研究者的研究成果,简要分析传统的跨模态检索方法,着重介绍近五年研究者提出跨模态检索方法,并对其性能表现进行对比;总结现阶段跨模态检索研究过程中面临的问题,并对后续发展做出展望。  相似文献   

12.
13.
高明  黄哲学 《集成技术》2012,1(3):47-54
随着Deep Web数量和规模的快速增长,通过对其发起查询请求以得到存储在后台数据库中的相关信息,日渐成为用户获取信息的主要方式。为了方便用户有效地利用Deep Web中的信息,越来越多的研究者致力于这一领域的研究,重点之一是Deep Web后台数据库的数据集成。由于Deep Web后台数据库存储的主要是文本信息,使得从文本处理角度出发,针对Deep Web中存储的内容进行查询与检索的研究具有十分广阔的应用前景。本文对Deep Web的研究现状进行了较为详细的分析,同时对研究的发展方向进行了展望。  相似文献   

14.
索引机制是数据库和多媒体领域的重要研究课题,很多在大规模数据集里进行相似性检索的应用都需要有效的高维索引结构来加速查询过程。本文总结了多维索引结构的特点、分类及查询方式,分析了影响索引结构性能的主要因素及其性能评价准则,最后介绍了索引结构的最新发展,并结合多维索引结构目前存在的问题,说明了今后研究的方向。  相似文献   

15.
现在MAS中的许多具体应用问题也可以发结为未知环境的搜索。比如WWW上的信息检索,数据发掘等,当存在信息缺失的情况下,如何设计MAS系统使之更为有效地搜索是目前MAS研究的一个重要课题,本文在不同的实验环境下针对3种不同的搜索策略进行了对比实验,得出了一些对MAS设计有普遍参考意义的结论。  相似文献   

16.
路通 《计算机科学》2012,39(4):14-22,27
对三维CAD模型检索研究现状进行了深入和系统的综述。CAD模型检索可划分为两个层次:基于视觉相似性的三维CAD模型检索、面向语义与功能描述的三维CAD模型检索。分别分析了两种检索层次下CAD模型的检索方法。在此基础上总结了三维CAD模型检索评测基准库、评测方法等。最后展望了现有研究中的难点及进一步的研究方向。  相似文献   

17.
面向Internet的个性化智能信息检索   总被引:72,自引:0,他引:72  
文中提出了一个面向Internet的个性化智能信息检索系统,该系统的研究内容属目前智能信息检索领域的重要研究课题。系统采用分布式智能体Agent技术、相关反馈学习算法和基于多用户个性化模式的层次智能信息滤波算法,并采用多模块之间尖线交互机制和个性化检索与集中游览相结合的检索方式等方法,有效地解决了现有系统在交互方式、自适应用户兴趣和信息源的变化、高效并行检索等方面的不足,该系统普通适用于Inter  相似文献   

18.
19.
钱江波  胡伟  陈华辉  董一鸿 《控制与决策》2019,34(12):2567-2575
基于哈希的近邻查找技术在图像检索、文本匹配、数据挖掘等信息检索领域均有广泛应用.该技术将原始数据通过哈希函数压缩成低维的二进制编码,然后在海明距离下排序检索,具有快速高效且维度不敏感的优势.但是,目前学术界针对流数据的实时在线哈希学习方法的研究很少,而且基本没有讨论哈希函数的更新频率和稳定性问题.针对这一问题,通过增加置信区间来减少更换哈希函数的频率,并构造在线学习的目标函数,使得算法尽可能保持稳定,且快速收敛.为了验证所提出算法的效率和有效性,在公开数据集上与同类的OSH、OKH在线哈希算法进行比较,比较结果表明,所提出的算法在平均准确率和训练时间上有一定优势.  相似文献   

20.
随着互联网上XML文档的日益增多,如何对其内容进行有效的检索查询已经成为亟待解决的问题。本文的主要目的在于针对XML在信息检索中的应用作一深入的探讨,讨论XML检索与传统信息检索的不同和目前一些通用的XML存储处理的方法,对其中用到的关键技术、可行性和性能都作了比较分析。在此基础上还提出一种新的检索模型和系统框架,结合当前的全文搜索和数据库技术,具有一定的实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号