首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
空间近似关键字查询包含一个空间条件和一组关键字相似性条件,这种查询在空间数据库中返回同时满足以下条件的对象:1)对象的位置信息满足查询中的空间条件;2)对于查询中的任何一个关键字,对象中至少包含一个关键字与其相似度大于给定阈值.随着当前数据的爆炸性增长,空间数据库无法完整地存放在内存中,因此空间数据库需要支持空间近似关键字查询的外存索引.目前,还没有在外存中支持精确的空间近似关键字查询的索引结构.设计了一种新型的外存索引RB树,在外存中支持精确的空间近似关键字查询.RB树支持的空间近似关键字查询包括多种空间条件,如范围查询、NN查询,同时支持多种关键字相似性度量,包括编辑距离、规范化编辑距离等.通过真实数据中的性能测试验证了RB树的效率.  相似文献   

2.
面向集合的空间关键字查询处理是数据库领域近年来的热点研究课题.针对已有查询的不足,定义一种新的描述集合质量的Cost函数,提出一种新的面向集合的空间关键字查询方法,并证明基于该Cost函数的查询问题是NP完全问题.对于给定的对象数据集D={o1,o2,…,on},q为包含位置信息和关键字集合的查询点,查询返回的是在对象数据集D中,既满足查询点q的全部关键字,又能成为q的近邻且较紧凑的对象集合.为处理该查询,利用最小圆覆盖包含全部关键字的对象集合,并采用有效的裁剪策略分别实现了该查询的近似查询算法和精确查询算法.最后通过实验验证了所提算法的有效性.  相似文献   

3.
基于历史信息提升关键字查询效率   总被引:2,自引:0,他引:2  
关系数据库上的关键字查询使用户不必了解SQL语法或者数据库模式即可方便进行检索,并利用关系表的连接来保证查询的完整性.但是目前已有的关键字查询技术对于每个用户发起的查询皆从底层数据开始处理,而忽略了历史查询信息的使用.历史信息不仅包含了历史查询结果,而且反映了关键字之间的相关性,在查询过程中使用历史信息会提升查询效率.此篇论文正是针对此问题提出了新的解决方案:首先利用划分算法将用户输入的关键字划分为历史关键字和新关键字的组合;利用历史信息展开关键字查询,得到以子图形式存在的查询结果;基于与关键字的相关度对结果子图进行排序.最后,基于DBLP数据集,实验在执行时间和查准率方面证明了算法的有效性和高效性.  相似文献   

4.
目前,现有的大多数关键字查询方法都是计算XML包含关键字元素的最紧致片段,这类方法大都忽略了XML文档中嵌入的结构关系,而XML结构化查询能够准确捕捉用户查询的信息,具有较高的准确率.将结构化查询方法与关键字信息检索相结合,通过分析关键字与XML文档的结构关系判断用户查询的需求,将面向对象的思想和松弛查询的方法引入到关键字查询方法中,提出一个新的XML关键字近似查询框架(Rtop-k).实验结果表明,所提近似查询方法能够较为准确地捕捉用户的查询意图,具有较高的查全率和查准率.  相似文献   

5.
目前RDF数据上关键字查询转换为结构化语句的算法主要支持对于一般图元素的查询,而无法转换为包含聚合操作的结构化语句。关键字存在大量候选解释,且可能同时匹配聚合操作或图元素,这导致查询中聚合意图的理解非常困难。对此,提出将关键字查询自动转换为可能包含聚合操作的SPARQL语句的算法。算法对SPARQL所支持的聚合操作进行分类,获得关键字与聚合类别的匹配字典,进行关键字映射,计算关键字可能指示聚合意图的概率,确定候选查询解释,并利用模式图获得查询意图,设计意图分数计算方法和查询转换算法,得到对应的查询语句。LUBM和DBLP数据集上的实验验证了算法的有效性和准确性。  相似文献   

6.
李婷  程海涛 《计算机科学》2017,44(9):216-221, 226
在精确XML文档上的关键字查询方法的研究大多是基于LCA语义或者其变种语义(SLCA,ELCA等)开展的,将包含所有关键字的最紧致XML子树片段作为查询结果返回。但是这些基于LCA语义产生的查询结果中通常包含了大量的冗余信息,现实世界中存在着大量的不确定和模糊信息,因而如何从模糊XML文档中搜索到高质量的关键字查询结果是一个需要研究的问题。针对模糊XML文档上的关键字近似查询方法进行研究,通过引入最小连接树(MCT)的概念,提出在模糊XML文档上关键字查询的所有GDMCTs问题,并给出解决这一问题的基于栈的算法All fuzzy GDMCTs,该算法可以得到满足用户指定的子树大小阈值和可能性阈值条件的所有GDMCTs结果。实验表明,该算法在模糊XML文档上能够得到较高质量的关键字查询结果。  相似文献   

7.
路网中空间关键字连续范围查询算法研究   总被引:1,自引:1,他引:0  
空间关键字查询相对传统的位置相关查询而言更能满足实际查询处理的需要。着重探讨路网中结合距离和关键字相似度两个因素的空间关键字查询处理问题,提出解决路网中空间关键字连续范围查询(CRSKQ)的有效方法。提出了一个综合考虑了路网上的道路、对象和路网的连通性的路网模型以支持CRSKQ查询的处理。为了实现连续监控,所提出的算法包括两个阶段,即初始结果获取和查询结果连续监控。初始结果监控阶段,通过路网扩展和关键字匹配寻找满足要求的结果对象;在连续监控阶段,充分利用前面时刻的查询结果来减小连续监控的代价。模拟实验表明,所提出的算法是有效的。  相似文献   

8.
现有的XML关键字查询算法,通常只考虑节点间的结构信息,以包含关键字匹配节点的子树作为查询的结果,而节点间的语义相关性一直没有被充分利用。这也是导致现有查询算法的结果中普遍含有大量语义无关的冗余信息的主要原因。在该文中,我们首先对查询关键字的环境语义及节点间的语义相关性进行了定义,在此基础上,提出了一种新的关键字查询算法,寻找语义相关单元作为关键字查询的结果。这样获得的查询结果,一方面不含语义无关的冗余信息,另一方面也与用户的查询意图更加匹配。实验表明,该文提出的算法在查询效率和精确性上都有较大改进。  相似文献   

9.
李威  高锦涛  高腾 《计算机系统应用》2012,21(9):156-161,140
随着信息检索技术和数据库理论的发展,如何通过信息检索技术在关系数据库中获取有用信息,并使普通用户也可以完成在关系数据库中的关键字查询,成为近期研究人员研究的热点.基于关键字的关系数据库查询系统无需用户了解数据库模式和结构化查询语言,用户只需输入几个关键字就可以得到查询结果.基于关系数据库的原型E-R图,根据意义的不同对实体进行分组.查询时根据关键字所属关系表,确定查询的实体集合,划定查询范围,提高查询效率.提出了新的算法来提高系统的查准率.最后,通过实验对E-RKS系统效能进行验证.  相似文献   

10.
由于数据空间自身的特点使得数据空间中的关键字查询与Web上和关系数据库上的关键字查询有着很大的差别,已有的关键字查询技术不能完全满足和适用数据空间环境.关键字查询的简略性和无结构性所带来的模糊语义,无法准确地理解用户的查询意图使得查询结果不能很好地满足用户需求等.本文提出一种数据空间中的语义关键字实体查询机制keymanticES,着重介绍了关键字查询意图消歧的方法从而较好地解决了关键字查询的语义模糊问题,提高了关键字查询的准确率.实验结果表明所提出方法的有效性和正确性.  相似文献   

11.
詹彬  谷琼 《计算机时代》2011,(11):46-47,50
针对非计算机专业学生在学习Access数据库查询过程中遇到的困难,采用对比的方法分析查询的基本概念,提出了选择查询、参数查询、交叉表查询、操作查询和SQL查询在教学过程中需要注意的问题,对初学者正确理解和使用查询有一定的指导意义。  相似文献   

12.
网内查询处理需要让网络中各个节点共同承担查询任务,其基本问题是如何采取合适的策略将各个查询映射到网络节点上,以使得网络传输数据量和网络延迟达到最小.基于在查询间共享数据流的思想,提出了基于查询包含和查询合并的数据流共享策略,并建立了相应的收益模型,最后通过实验分析对比了两种策略的运行效果.  相似文献   

13.
以实现分布式查询的正确性、透明性及优化性为目标,针对粮食储备管理系统的分布式查询处理需求,系统地研究分布式查询处理器的总体设计、线程控制、消息通信、分布式查询优化等问题以及实现技术, 弥补了SQL Server数据库中分布式查询功能的不足.  相似文献   

14.
现有方法没有有效利用查询文本特征、点击行为和session信息来挖掘用户的搜索意图,获取的查询特征对于多意图查询在不同意图下的区分度不足,对于多意图查询的相关查询聚类效果不佳。针对以上问题,该文提出了基于查询图信息的GPLSI模型,并利用该模型学习所得的查询特征进行查询聚类。基于查询图信息的GPLSI模型利用查询的词语、点击和session共现现象,从查询的文本特征、点击行为和session信息等多个方面来模拟查询意图的产生和表现,学习查询在不同搜索意图上的概率分布。最后,实验结果验证了基于查询图信息的PLSI模型用于查询相似度计算和多意图查询聚类中的有效性。  相似文献   

15.
查询是数据库系统的主要负载,其效率决定了数据库性能的好坏。一个查询存在多种执行计划,当前,查询优化器只能按照数据库系统的配置参数,静态地为查询选择一个较优的执行计划。并行查询间存在复杂多变的资源争用,很难通过配置参数准确反映,而且同一执行计划在不同情景下的效率并不一致。并行查询下执行计划的选择需考虑查询间的相互影响——查询交互。基于此,提出了一种在并行查询下度量查询受查询交互影响大小的标准QIs。针对并行查询下查询执行计划的选择,还提出了一种动态地为查询选择执行计划的方法TRating,该方法通过比较查询组合中按不同执行计划执行的查询受查询交互影响的大小,选择受查询交互影响较小的执行计划作为该查询的较优执行计划。实验结果表明,TRating方法为查询选择较优执行计划的准确率达61%,相比查询优化器提高了25%;而且在为查询选择次优执行计划时,其准确率也高达69%。  相似文献   

16.
用户在使用现有的搜索引擎时,常因为无法构造清晰准确的查询词而导致检索效果不佳,传统的查询推荐方法没有充分考虑用户行为的关联性,导致了查询推荐的结果不准确.本文提出了一个新的查询推荐模型,即基于点击模型和网络嵌入的查询推荐模型.该模型首先通过点击链式模型嵌入用户的历史检视行为和点击行为,并通过注意力机制衡量查询和返回文档的相关性;然后利用属性异构网络来获取复杂异质网络结构中的潜在语义信息;最后通过多头注意力捕获多个空间的复杂信息,并利用多任务学习来做评分预测.在搜狗实验室提供的公开查询日志上的实验结果表明,我们的模型在查询建议的鉴别式任务和生成式任务中均优于基线模型.  相似文献   

17.
支持快速查询的数据库加密方法研究   总被引:5,自引:0,他引:5  
为了解决数据库中加密字符串数据的查询问题。提出了为待加密的字段建立辅助索引字段的两阶段查询方法。索引字段的内容由原始数据的划分值和特征值两部分组成,它可以用来支持字符串数据的精确匹配查询和模糊匹配查询。查询加密数据时,首先利用索引字段对加密数据进行一次粗糙查询,然后在解密的数据上再进行一次精确查询。实验表明,其性能较传统的先解密后查询方法有较大的提高。  相似文献   

18.
随着基因测序技术和人类基因组计划的发展,从大量的生物数据中寻找相似的序列就越来越成为当前研究的热点问题.本文提出了一种聚类的多解析度字符串索引结构,用于解决生物序列的相似性查询问题.首先,以较小容量的MBR(最小绑定矩形)构造基因序列的多解析度字符串索引结构,然后通过对MBR的聚类以夏保序技术的应用,减小索引中MBR的平均体积,从而增加了查询向量到索引的空间距离,提高了索引的过滤能力.还给出了一种新的后处理方法,通过大量的减少编辑距离的计算,提高索引的性能.文中给出了该索引结构并详细介绍了索引的相关算法.实验表明,该索引结构是一种有效的处理生物数据的相似性查询的索引结构.  相似文献   

19.
精准医疗是一种强烈依赖病人基因组分析结果的医疗模式,而子串检索是执行基因组分析的重要方法。近年来,基因数据的数据量急剧增长,其存储代价和处理复杂度已远超医疗方可承受的范围。于是, 利用云服务提供商廉价的存储设备和强大的计算能力,将基因数据托管至云服务提供商成为切实可行的解决方案。考虑到云服务提供商并不完全可信,在 数据上传至云端之前执行数据加密是保证数据安全性和隐私性的有效方法。然而,如何基于加密数据执行序列检索成为亟待解决的问题。针对这一问题,对基因数据处理和密文检索领域进行调研,提出 采用q-gram技术对序列数据的定长窗口创建前缀签名的方案,并在执行查询时在每个窗口中完成前缀查询的解决方案。在子序列查询过程中,云端并不能获取用户数据明文。最后通过实验验证了所提方案具有较好的性能和存储开销,例如当窗口大小为100且q取6时,对100000长序列串执行构建索引耗时15.06 s。与GPSE相比,所提方法的性能更优。  相似文献   

20.
本文详细讨论了重写模块的设计思想与实现技术,并讨论了利用执行引擎特点引入的一组基于等价谓调的简单语句直写规则.测试结果表明,增加重写模块的查询优化器能显著提高系统的查询效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号