首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
黎玲利  王宏志  高宏  李建中 《软件学报》2012,23(6):1561-1577
利用关键字可以在模式未知的情况下对XML数据进行查询.在当前的XML数据流上的关键字查询处理中,打分函数往往不能都满足各种用户不同的需求.提出了一种基于skyline的XML数据流上的Top-K关键字查询.对于这种查询,不需要考虑影响结果与查询相关性的复杂因素,只需利用skyline挑选与查询最相关的结果.提出了两种XML数据流上的有效的基于skyline的Top-K关键查询处理算法,包括对单查询和多查询的处理算法.通过扩展实验对两种算法的有效性和可扩展性进行了验证.经过实验验证,所提出的查询处理算法的效率几乎不受关键字个数、查询结果数量、查询数量等参数的影响,运行时间和文档大小大致呈线性关系.  相似文献   

2.
XML数据流上的关键字查询   总被引:3,自引:1,他引:3  
XML数据流上的XPath & XQuery查询处理是目前研究者关注的热点问题,但由于XPath & XQuery查询语言相对复杂,在不知道模式信息的前提下,用户很难通过已有的查询接口得到自己感兴趣的数据片断,因此如何在数据流模型上根据XML数据的特点为用户提供最友好的查询接口就成为一个亟待解决的问题.针对这个问题,创新地提出了在XML数据流上做关键字查询的问题,给出了最小相关连通子树(SRCT)的概念用于处理返回的结果,并设计了一种新的基于栈的Lookup算法,可以有效解决在XML数据流上进行关键字查询的问题,最后通过实验从不同角度对Lookup算法的各项性能指标进行了验证.  相似文献   

3.
本文将当前数据库领域的2个研究热点-XML文档和数据流处理一的最新研究结合起来,提出了XML文档流关键字查询的问题。基于最小连通子树的概念。设计了相应的数据结构和基于栈的查询算法,可以有效解决XML文档流上进行关键字查询的问题。具体方法是把XML数据流表示成3类SAX事件:BEGIN(tag)、END(tag)和TEXT0。对每类事件的处理算法进行了详细,并进行了正确性证明。从理论上分析了算法的复杂度,并在XMark和treebank.xml两个数据集上对所提方法进行了广泛的实验。结果验证了本文工作的有效性。  相似文献   

4.
由于数据空间自身的特点使得数据空间中的关键字查询与Web上和关系数据库上的关键字查询有着很大的差别,已有的关键字查询技术不能完全满足和适用数据空间环境.关键字查询的简略性和无结构性所带来的模糊语义,无法准确地理解用户的查询意图使得查询结果不能很好地满足用户需求等.本文提出一种数据空间中的语义关键字实体查询机制keymanticES,着重介绍了关键字查询意图消歧的方法从而较好地解决了关键字查询的语义模糊问题,提高了关键字查询的准确率.实验结果表明所提出方法的有效性和正确性.  相似文献   

5.
基于历史信息提升关键字查询效率   总被引:2,自引:0,他引:2  
关系数据库上的关键字查询使用户不必了解SQL语法或者数据库模式即可方便进行检索,并利用关系表的连接来保证查询的完整性.但是目前已有的关键字查询技术对于每个用户发起的查询皆从底层数据开始处理,而忽略了历史查询信息的使用.历史信息不仅包含了历史查询结果,而且反映了关键字之间的相关性,在查询过程中使用历史信息会提升查询效率.此篇论文正是针对此问题提出了新的解决方案:首先利用划分算法将用户输入的关键字划分为历史关键字和新关键字的组合;利用历史信息展开关键字查询,得到以子图形式存在的查询结果;基于与关键字的相关度对结果子图进行排序.最后,基于DBLP数据集,实验在执行时间和查准率方面证明了算法的有效性和高效性.  相似文献   

6.
基于Spark Streaming计算框架的分布式Top-K关键字查询是统计流数据中所有关键字的热点研究问题。多数研究通过限定存储空间来实现Top-K关键字查询,并假设关键字集合已知。针对这个问题,提出一种可应用于关键字集合未知情况的分布式Top-K关键字查询算法,根据监测到的关键字动态地调整存储空间,通过更新策略的优化提升其精度。实验结果表明,该算法的性能在关键字集合未知的情况下比现有算法更优。  相似文献   

7.
林霞  蔡声镇  吴允平  卢宇  关健  吴燕  陈锦凯 《计算机工程》2011,37(5):282-284,287
提出一种基于特征关键字的多协议数据流转换方法,分析基于特征关键字的数据帧格式描述方法,通过将通信协议数据帧格式的描述与数据流的解析转换代码相分离,实现与协议无关的数据流解析和转换。该方法用稳定的程序处理不稳定的数据流,避免不同通信协议之间的数据流转换均要编写专用解析转换程序的缺陷,具有较好的灵活性和普适性。  相似文献   

8.
郑诗敏  秦小麟  刘亮  周倩 《计算机科学》2017,44(3):10-15, 35
基于Spark Streaming计算框架下的分布式突发关键字查询是监测流数据中关键字突发时间的热点研究问题。多数研究方法存储统计所有的关键字,并未考虑热点关键字。在数据呈爆炸式增长的背景下,获取热点关键字的突发时间更具有价值。针对这个问题,提出一种分布式突发关键字查询算法,该算法采用动态的更新策略,通过设置检查点的方法提取热点关键字,并在线性的时间内查询突发的时间范围。实验结果表明,该算法的性能比现有算法更优。  相似文献   

9.
面向集合的空间关键字查询处理是数据库领域近年来的热点研究课题.针对已有查询的不足,定义一种新的描述集合质量的Cost函数,提出一种新的面向集合的空间关键字查询方法,并证明基于该Cost函数的查询问题是NP完全问题.对于给定的对象数据集D={o1,o2,…,on},q为包含位置信息和关键字集合的查询点,查询返回的是在对象数据集D中,既满足查询点q的全部关键字,又能成为q的近邻且较紧凑的对象集合.为处理该查询,利用最小圆覆盖包含全部关键字的对象集合,并采用有效的裁剪策略分别实现了该查询的近似查询算法和精确查询算法.最后通过实验验证了所提算法的有效性.  相似文献   

10.
一种基于HBase的高效空间关键字查询策略   总被引:2,自引:0,他引:2  
随着移动定位技术的发展以及智能手机的普及,互联网中空间文本对象的数量正在急速增长,如何在规模庞大且动态增长的空间文本对象中进行高效的空间关键字查询成为了许多空间关键字查询应用所关心的问题.现有的方法通常利用基于R树和倒排索引的混合索引结构来处理空间关键字查询,然而,面对数量巨大而且不断增长的空间文本对象,这些方法往往难以为空间关键字查询的高效性和扩展性提供支持.对此,提出一种基于HBase的空间文本数据索引结构SK-HBase.SK-HBase以HBase作为数据存储,通过有效的数据分配策略对空间文本对象的空间信息和文本信息同时进行索引.在SK-HBase的基础上,本文提出了两种空间关键字查询算法,以保证不同空间范围下的空间关键字查询的高效性和可扩展性.实验证明,我们的方法能够在海量数据下进行高效的空间关键字查询并具有良好的可扩展性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号