共查询到20条相似文献,搜索用时 406 毫秒
1.
2.
序列数据相似性查询技术研究综述 总被引:2,自引:0,他引:2
序列数据在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种提取有用信息的重要手段.近年来,随着各种科学计算的发展和序列数据的大量产生,序列相似性查询已经成为数据分析领域一个研究热点.其涉及到的几个重要问题有面向各种应用领域的相似性度量及其相互之间的关系;随机序列数据中距离分布的统计信息及其对分析查询算法性能的作用;在大规模数据中,各种高效回答相似性查询的关键技术及各自的优缺点比较.总结了序列数据的分类和特点,给出了几种序列数据相似性度量和随机序列之间距离分布的统计信息,并进一步分析了这些度量之间的关系.接着给出了几种序列相似性查询的类型,以及序列相似性查询要解决的核心问题.在此基础上,针对各种序列相似性查询关键技术进行分类和评价.最后,讨论了关于序列数据相似性查询研究所面临的挑战,并归结了未来的研究方向. 相似文献
3.
4.
5.
6.
电力电子装置故障波形相似性度量的小波矩阵变换法 总被引:1,自引:0,他引:1
提出一种基于小波矩阵变换的时序序列相似度量方法,并对该方法应用于电力电子装置故障波形相似性度量进行了抗噪性、灵敏度及相似值准确性分析.方法首先采用小波变换将时序序列压缩到小波子空间,再由K-L变换(Karhunen-Loveve transformation)提取样本时序序列的特征向量和正交基,然后将分析时序序列通过内积变换映射到正交基中得到分析特征向量,最后计算两个特征向量之间的欧式距离以判定时序序列的相似度.以电力电子装置故障波形的相似度量为例,实验表明该方法特征向量维数低,抗噪性好于直接小波法30倍,灵敏度是直接小波法1/3,相似值准确性好于小波奇异值法.该方法对于大规模时序序列的相似匹配和检索具有潜在的应用价值. 相似文献
7.
基于小波变换的时间序列相似模式匹配 总被引:21,自引:1,他引:21
提出了一种新的时序相似模式匹配方法,它采用小波分析的方法实现时间序列数据的降维,采用小波序列表示原序列,将小波序列组织为多维索引结构R-tree存储,在该索引结构基础上,基于一种表示相似性的距离函数,定义了范围查询和最近邻查询算法,实验结果证明这种方法性能优于传统的基于傅立叶变换的相似模式匹配方法。 相似文献
8.
有效管理生物数据并提供高效的查询方法是生物信息处理的重要研究内容.BioSeg是一个新的生物序列数据模型.查询优化研究是生物数据库管理系统开发的重要内容之一.研究当前生物数据索引技术,针对BioSeg数据模型的特点和生物序列相似性查询需求设计了一种新的生物序列数据索引BioIndex,并设计相应的查询算法.首先,使用MEME(Multiple EM for Moeif Elicitation)算法挖掘生物序列集中的序列模式作为索引建立索引序列库;之后,在索引序列库中查找与查询序列最相似的索引序列,将其对应的序列集作为候选集;再在候选集中查找与查询序列最相似的序列.在真实生物序列数据集上的实验表明使用新的生物序列数据索引BioIndex的序列查询算法提高了序列查询的效率. 相似文献
9.
飞行数据是一种典型的多元时间序列数据,基于奇异值分解提取飞行数据序列的特征,通过奇异值距离过滤获得相似模式查询的候选集,依据线性空间中的坐标变换原理构造多元时间序列的相似性度量模型,从而实现候选集上的精确匹配并获得最终的结果集。给出了相似子序列的冲突消解策略,深入分析了查询的完备性问题,指出该方法可能导致误判或成为误判的根源,提出融入先验规则来减少误判并提高查询效率的方法。在真实飞行数据上的实验结果验证了方法的有效性。 相似文献
10.
相似性连接查询技术研究进展 总被引:1,自引:0,他引:1
相似性连接查询,即查找相似的数据对象对,具有广泛的应用领域,例如相似网页检测、实体解析、数据清洗和相似图像检索等。相似性连接查询是当前大数据处理领域的热点问题之一。讨论了相似性连接查询面临的挑战;根据不同的标准对现有的相似性连接查询进行了分类;总结并比较了现有的字符串、集合、向量和图相似性连接算法;探讨了今后的研究重点和发展趋势。 相似文献
11.
近年来,各种类型的媒体数据,如音频、文本、图像和视频,在互联网上呈现爆发式增长,不同类型的数据通常用于描述同一事件或主题。跨模态检索提供了一些有效的方法,可以为任何模态的给定查询搜索不同模态的语义相关结果,使用户能够获得有关事件/主题的更多信息,从而达到以一种模态数据检索另外一种模态数据的效果。随着数据检索需求以及各种新技术的发展,单一模态检索难以满足用户需求,研究者提出许多跨模态检索的技术来解决这个问题。梳理近期跨模态检索领域研究者的研究成果,简要分析传统的跨模态检索方法,着重介绍近五年研究者提出跨模态检索方法,并对其性能表现进行对比;总结现阶段跨模态检索研究过程中面临的问题,并对后续发展做出展望。 相似文献
12.
13.
随着Deep Web数量和规模的快速增长,通过对其发起查询请求以得到存储在后台数据库中的相关信息,日渐成为用户获取信息的主要方式。为了方便用户有效地利用Deep Web中的信息,越来越多的研究者致力于这一领域的研究,重点之一是Deep Web后台数据库的数据集成。由于Deep Web后台数据库存储的主要是文本信息,使得从文本处理角度出发,针对Deep Web中存储的内容进行查询与检索的研究具有十分广阔的应用前景。本文对Deep Web的研究现状进行了较为详细的分析,同时对研究的发展方向进行了展望。 相似文献
14.
15.
现在MAS中的许多具体应用问题也可以发结为未知环境的搜索。比如WWW上的信息检索,数据发掘等,当存在信息缺失的情况下,如何设计MAS系统使之更为有效地搜索是目前MAS研究的一个重要课题,本文在不同的实验环境下针对3种不同的搜索策略进行了对比实验,得出了一些对MAS设计有普遍参考意义的结论。 相似文献
16.
对三维CAD模型检索研究现状进行了深入和系统的综述。CAD模型检索可划分为两个层次:基于视觉相似性的三维CAD模型检索、面向语义与功能描述的三维CAD模型检索。分别分析了两种检索层次下CAD模型的检索方法。在此基础上总结了三维CAD模型检索评测基准库、评测方法等。最后展望了现有研究中的难点及进一步的研究方向。 相似文献
17.
面向Internet的个性化智能信息检索 总被引:72,自引:0,他引:72
文中提出了一个面向Internet的个性化智能信息检索系统,该系统的研究内容属目前智能信息检索领域的重要研究课题。系统采用分布式智能体Agent技术、相关反馈学习算法和基于多用户个性化模式的层次智能信息滤波算法,并采用多模块之间尖线交互机制和个性化检索与集中游览相结合的检索方式等方法,有效地解决了现有系统在交互方式、自适应用户兴趣和信息源的变化、高效并行检索等方面的不足,该系统普通适用于Inter 相似文献
18.
19.
基于哈希的近邻查找技术在图像检索、文本匹配、数据挖掘等信息检索领域均有广泛应用.该技术将原始数据通过哈希函数压缩成低维的二进制编码,然后在海明距离下排序检索,具有快速高效且维度不敏感的优势.但是,目前学术界针对流数据的实时在线哈希学习方法的研究很少,而且基本没有讨论哈希函数的更新频率和稳定性问题.针对这一问题,通过增加置信区间来减少更换哈希函数的频率,并构造在线学习的目标函数,使得算法尽可能保持稳定,且快速收敛.为了验证所提出算法的效率和有效性,在公开数据集上与同类的OSH、OKH在线哈希算法进行比较,比较结果表明,所提出的算法在平均准确率和训练时间上有一定优势. 相似文献
20.
随着互联网上XML文档的日益增多,如何对其内容进行有效的检索查询已经成为亟待解决的问题。本文的主要目的在于针对XML在信息检索中的应用作一深入的探讨,讨论XML检索与传统信息检索的不同和目前一些通用的XML存储处理的方法,对其中用到的关键技术、可行性和性能都作了比较分析。在此基础上还提出一种新的检索模型和系统框架,结合当前的全文搜索和数据库技术,具有一定的实用性。 相似文献