首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
面向集合的空间关键字查询处理是数据库领域近年来的热点研究课题.针对已有查询的不足,定义一种新的描述集合质量的Cost函数,提出一种新的面向集合的空间关键字查询方法,并证明基于该Cost函数的查询问题是NP完全问题.对于给定的对象数据集D={o1,o2,…,on},q为包含位置信息和关键字集合的查询点,查询返回的是在对象数据集D中,既满足查询点q的全部关键字,又能成为q的近邻且较紧凑的对象集合.为处理该查询,利用最小圆覆盖包含全部关键字的对象集合,并采用有效的裁剪策略分别实现了该查询的近似查询算法和精确查询算法.最后通过实验验证了所提算法的有效性.  相似文献   

2.
不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理.针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法.在该查询语义下采用动态规划方法求取x-tuple内每个元组排在前k位的概率和,对其进行聚集后做概率阈值top-k查询,并利用观察法、最大上限值等剪枝方法进行优化.实验结果表明,该算法平均扫描全体数据集中60%的数据即可返回正确结果集,证明其查询处理效率较高.  相似文献   

3.
无线传感器网络中top-k连接查询处理   总被引:2,自引:0,他引:2  
无线传感器网络是物联网核心组成部分之一,数据查询处理是无线传感器网络中很重要的一个研究领域.连接查询能在不同的位置监视相似的网络环境,top-k连接查询能进一步得出组合得分最大(或最小)的k个相似网络环境.top-k连接查询根据得分函数计算匹配结果的组合得分,并报告组合得分结果最大(或最小)的k个匹配节点对.文中提出了基本top-k连接算法BTJQ.该算法首先按照得分属性值从大到小对所有元组排序,然后依次取出元组,产生连接结果.对每个连接结果按照得分函数计算组合得分,如果满足停止条件,则停止取元组,并输出连接结果.在BTJQ基础上,作者提出了集中式top-k连接算法CTJQ和优化的集中式top-k连接算法OCTJQ.针对特定应用场景,作者进一步提出了分布式top-k连接算法DTJQ.最后,在真实数据集上验证了各算法.实验结果表明,文中算法好于经典连接算法SENS-Join.  相似文献   

4.
基于历史信息提升关键字查询效率   总被引:2,自引:0,他引:2  
关系数据库上的关键字查询使用户不必了解SQL语法或者数据库模式即可方便进行检索,并利用关系表的连接来保证查询的完整性.但是目前已有的关键字查询技术对于每个用户发起的查询皆从底层数据开始处理,而忽略了历史查询信息的使用.历史信息不仅包含了历史查询结果,而且反映了关键字之间的相关性,在查询过程中使用历史信息会提升查询效率.此篇论文正是针对此问题提出了新的解决方案:首先利用划分算法将用户输入的关键字划分为历史关键字和新关键字的组合;利用历史信息展开关键字查询,得到以子图形式存在的查询结果;基于与关键字的相关度对结果子图进行排序.最后,基于DBLP数据集,实验在执行时间和查准率方面证明了算法的有效性和高效性.  相似文献   

5.
韩京宇  杨健 《计算机应用》2014,34(12):3475-3480
针对目前基于倒排表的图关键字索引不能有效处理多个关键字查询,也不能对关键字拼写容错的问题,提出一种位图和局部敏感哈希(BLH)相结合的双层索引来支持图的多关键字查询:上层构建位图,依据关键字组合的n-gram映射到子图类簇,每个类簇存储相似的子图;下层在每个类簇上构建局部敏感哈希索引,根据关键字组合的n-gram定位到包含关键字组合的子图。该方法可显著减少图上关键字查询的I/O,查询时间缩减80%;并且,基于n-gram构建索引,可以避免索引对拼写错误敏感,在关键字容错的前提下返回用户期望的结果。实际数据集上的实验结果表明BLH索引的有效性,可以支持万维网、社会网络的高效查询。  相似文献   

6.
用户使用关键字查询时可能不能准确地表达他们的意图,即使用户正确地表达了查询意图,查询引擎也可能不能准确地返回查询结果.针对这一问题,重点研究了在XML关键字查询中如何进行有效的查询改写并生成有意义的结果.提出4种查询改写操作和查询改写代价的概念,给出了动态规划的方法计算查询改写代价.为了找出最优的查询改写,给出了基于栈的查询改写和结果生成算法,并提出了基于划分的优化算法.最后通过丰富的实验对提出的方法进行了验证.  相似文献   

7.
不确定数据的查询处理是数据库领域近年来的热点研究课题.提出一种不确定数据上的范围受限的最近邻查询.给定不确定数据集D={o1,o2,…,on},范围约束R是一个简单多边形,q为一固定的查询点,范围受限的最近邻查询返回的是在数据集D中,既满足范围约束R,又能成为查询点q的最近邻的对象集合.为处理该查询,提出了范围受限的最近邻核心集的概念和范围受限的最近邻核心集的查找算法.并提出一种计算范围受限的最近邻候选集的优化方法,降低了查询代价.最后通过实验验证了该算法的有效性.  相似文献   

8.
王剑波 《计算机工程》2011,37(17):49-51
针对关系表达式难以进行无限制一到多数据转换的问题,通过关系代数的扩展表达一到多数据转换,采用递归查询和表函数实现无限制一到多数据转换,在每个输入元组上产生一个或者多个输出元组。递归查询通过创建初始结果,递归获取结果集,并返回最终结果集;表函数声明变量集合,使用过程体和游标循环访问表,迭代输出元组。实验分析不同参数影响因素下有限制和无限制转换的不同方法,结果表明扩展方法能够改善系统性能。  相似文献   

9.
随着时代的飞速发展,人们对智能生活的追求不断提高,空间查询也被人们愈来愈重视。移动空间关键字查询,作为一种主要的连续空间查询类型,受到了广泛的研究。在最新的顶尖会议文刊中,提出了一种新的查询类型,称为移动集合空间关键字查询(MCSKQ)。这种类型的查询不断报告一组对象,这些对象在查询移动时共同覆盖查询关键字。同时,返回的对象也必须靠近查询对象并且彼此靠近。计算精确的结果集是一个NP-hard的问题。为了降低查询处理的成本,本文提出了基于安全区域技术的算法,在查询对象移动时,保持精确的结果集。在其基础上,本文基于MCKSQ的思想提出新的优化策略,以降低查询处理成本的方法。  相似文献   

10.
目前RDF数据上关键字查询转换为结构化语句的算法主要支持对于一般图元素的查询,而无法转换为包含聚合操作的结构化语句。关键字存在大量候选解释,且可能同时匹配聚合操作或图元素,这导致查询中聚合意图的理解非常困难。对此,提出将关键字查询自动转换为可能包含聚合操作的SPARQL语句的算法。算法对SPARQL所支持的聚合操作进行分类,获得关键字与聚合类别的匹配字典,进行关键字映射,计算关键字可能指示聚合意图的概率,确定候选查询解释,并利用模式图获得查询意图,设计意图分数计算方法和查询转换算法,得到对应的查询语句。LUBM和DBLP数据集上的实验验证了算法的有效性和准确性。  相似文献   

11.
跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词向量模型实现汉文查询词到蒙古文查询词的映射,其次提出串联式查询扩展、串联式查询扩展过滤、交叉验证筛选过滤三种查询扩展方法对候选蒙古文查询词进行筛选和排序,最后选取上下文相关的蒙古文查询词。实验结果表明: 在蒙汉跨语言信息检索任务中引入交叉验证筛选方法对信息检索结果有很大的提升。  相似文献   

12.
Nowadays, with the widespread use of the internet, users meet their information needs with the help of search engines. Users tend to retrieve the most relevant results by entering short phrases in the search engines. Customizing the retrieved results helps attain this goal. In this study, research works in the fields of query suggestion, particularly query auto-completion have been studied with special attention to customization. First, the sophisticated customizing features were classified into four dimensions: time, location, context, and demographic features. Then, related works were investigated regarding algorithm, dataset and evaluation measures. Regarding the literature, we found that the research works employing context or time as sophisticated features for customization are more than those using location or demographic features. While the location dimension has been recently taken into consideration, using other dimensions has a long background. Moreover, in the related works, the AOL dataset and Mean Reciprocal Rank (MRR) are known as the most frequent dataset and evaluation measure, respectively.  相似文献   

13.
14.
Data incompleteness is one of the most important data quality problems in enterprise information systems. Most existing data imputing techniques just deduce approximate values for the incomplete attributes by means of some specific data quality rules or some mathematical methods. Unfortunately, approximation may be far away from the truth. Furthermore, when observed data is inadequate, they will not work well. The World Wide Web (WWW) has become the most important and the most widely used information source. Several current works have proven that using Web data can augment the quality of databases. In this paper, we propose a Web-based relational data imputing framework, which tries to automatically retrieve real values from the WWW for the incomplete attributes. In the paper, we try to take full advantage of relations among different kinds of objects based on the idea that the same kind of things must have the same kind of relations with their relatives in a specific world. Our proposed techniques consist of two automatic query formulation algorithms and one graph-based candidates extraction model. Several evaluations are proposed on two high-quality real datasets and one poor-quality real dataset to prove the effectiveness of our approaches.  相似文献   

15.
用ASP实现WEB数据库智能查询   总被引:13,自引:0,他引:13  
在网站信息处理工作中,经常要从大量的数据中快速而又准确地检索出需要的一些信息,如学生成绩管理、商品订单管理,这些都离不开数据查询。由于不同的用户,查询的要求不同,因此对于不同的用户、不同计算机水平给出不同的查询方式。本文就如何利用ASP技术实现智能向导式查询作了一些探讨。  相似文献   

16.
基于XML的半结构数据查询语言研究   总被引:1,自引:0,他引:1  
半结构数据管理的核心问题之一是数据的有效查询问题。文章重点分析、比较了两种基于XML的半结构查询语言,即XQL和XML-QL。在此基础上总结出了XML查询语言的基本需求,并对目前的XML查询语言提出了四点扩充建议。  相似文献   

17.
在LBS连续查询的应用场景下,攻击者易利用查询时间序列、区域位置、移动趋势等背景知识发起有效的攻击,以获取用户的真实位置或轨迹,进而可推断出用户生活习惯等各类隐私信息。针对此,提出了一种基于轨迹聚类的连续查询隐私保护方法。该方法基于邻近用户的信息共享与协作,设计了一种匿名区域构造机制,用户在查询过程中,首先通过被共享缓存获取所需服务结果,如未命中,再向LBS服务器发起查询请求。同时,提出了一种邻近用户位置更新算法,提高用户的协作效率并保证缓存的有效性,对于由命中缓存完成的查询,采用提出的基于密度聚类的兴趣区提取算法,生成高混淆度的假查询扰乱整体查询序列顺序,以此增强轨迹隐私的保护效果。实验结果表明,该方法降低了连续查询中的时间代价,提高了位置混淆程度。  相似文献   

18.
目前,人们已经为面向对象数据库系统(OODBS)提出并实现了一些查询语言。由于缺少评价框架,很难对这些语言进行评价和比较。本文介绍一种比较全面的评价框架 ,它对已有的查询语言进行了评价,结果表明这些查询语言都没有达到所有标准,这个评价框架对于改进现有的查询语言和支持新的查询语言的设计都是有益的。  相似文献   

19.
一个可视知识查询语言CAOBS/VKQL   总被引:1,自引:0,他引:1  
介绍的CAOBS/VKQL是一个可视知识查询语言,它以灵活,直观,方便的图形操纵方式提供给用户访问、查询知识库的强大能力。该语文的查询模型以RIKOM知识模型为基础,用户通过构造查询图来表达查询要求。  相似文献   

20.
为帮助用户在丰富的网络资源中快速、准确地查询到所需要的信息,提出一种基于遗传算法的查询优化方法.其基本思想是首先根据词项与所有查询词的共现程度在相关文档集合中选取扩展词对初始查询进行扩展,然后利用遗传算法为扩展后的查询选择优化的权重.实验结果表明,新方法具有更高的查全率和查准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号