首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
为高效地实现XML多分支路径查询,提出了基于索引的XML多分支路径查询算法depthjoin.首先对XML文档进行编码并创建索引,然后对查询树进行查询匹配.采用栈存储多分支路径中的单路径,对多分支结点采用索引信息判定其子结点是否具有共同的祖先结点或父结点.与现有的XML分支查询算法相比,算法depthjoin充分利用索引,不需要进行单路径的连接操作,实验表明其查询效率比现有的查询算法高.  相似文献   

2.
随着主存技术的发展,系统级分布式主存多媒体数据库存储规模不断扩大,查询越来越复杂,分布式并行索引以其高性能而逐渐成为解决此类复杂查询问题的有效手段.文章提出一种新的适合于分布式并行索引的树结构--DPHI-Tree.该索引树以B树为基础,利用PCA降维技术,将树的各层节点采用不同的维度表示,提高了缓存空间的利用率,降低了CPU负载.另外,采用标识根到节点路径的二进制编码来对节点索引,在查询数据量急剧增加时,PHI-Tree对基于树的数据随机访问具有良好性能.  相似文献   

3.
为对城域视觉监控系统产生的海量多媒体数据进行高效索引和检索,提出基于M-Chord的分布式交互检索和负载均衡算法.对象以颜色柱状图、Gabor纹理描述和轨迹系数空间特征组成的特征向量描述,由M-Chord算法进行分布式索引分发和检索.提出基于线性和非线性支持向量机的分布式相关反馈算法,将支持向量机模型建立的度量空间与M-Chord索引所处的度量空间结合,利用分片中心点减少了对节点和对象的访问.实验表明提出的算法可以准确反映用户的查询语义,仅需要检索分布式监控网络中的少部分节点即可达到与顺序扫描接近的查准率,同时较好实现了分布式监控网络中的负载均衡.  相似文献   

4.
针对现有的近似查询模型对查询精度的可控性较差,后续处理效率较低的问题,提出基于两级过滤的查询模型.通过采用不同粒度的SAX表示方法提取时间序列的字符型特征向量,可以将高维的时间序列映射到低维的特征空间;将不同粒度的特征向量以向量近似文件(VA-File)的结构进行存储,有效引入了倒排索引.在查询过程中,设计了启发式的查询过滤算法,根据粗粒度特征向量查询细粒度特征向量,实现第一级过滤;针对VA-File设计了高效的边界剪枝算法,实现第二级过滤.模型基于多粒度的SAX特征向量进行构建,可以对查询精度进行有效控制;在第二级过滤中采用的边界剪枝算法可以有效地提高后续处理的执行效率.实验结果表明,提出的查询模型具有较高的性能,对时间序列长度、kNN查询规模及数据集规模具有稳定的扩展性.  相似文献   

5.
随着电力信息化的发展,电力数据来源广泛,具备体量大、类型多的特点,其中设备监测数据以及业务数据大多是浮点型、字符型数据,具有一定的时序性和结构化的特点。在数据检索时可能是对不同类型数据的联合查询,同时在大规模数据检索时存在查询效率不高,检索结果无法满足跨范围匹配的问题,对此本文设计并实现了一种基于B+树和倒排索引的分布式混合索引结构,引入层次化很合索引的思想,将数据集中的数据属性和属性值划分开来,并实现索引的并行化,提高了数据的索引构建时间和检索速度。  相似文献   

6.
为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weightedfinite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题.首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率.实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升.  相似文献   

7.
为了解决传统分布式搜索引擎存在的搜索性能问题,从索引结构、查询算法方面改进了传统模型.提出了一种非集中的高并行化搜索模型,该模型按照文档主题对索引分类,对较长的倒排记录表采用位图结构,利用多线程技术对索引节点实现并行搜索算法(multi max score heap,MMSH).实验结果表明:改进模型中的索引分类方法与倒排表结构的位图策略,能够增强Merge层查询的针对性,降低Merge层节点的CPU和内存开销;在倒排表不能完全存入内存情况下,MMSH算法能够实现高度并行化查询,其查询效率高于经典的term-at-a-time算法,缩短了平均查找时间,提高了系统吞吐量.索引分类、位图结构以及并行查询算法能够避免查询的盲目性,改善了分布式搜索引擎的性能.  相似文献   

8.
目的应用网格索引结构实现TNN查询算法,提高查询效率.方法将首次查询到的TNN路径长设为探测距离,利用它缩小有效查询区域,随着查询的进行,不断更新探测距离,直至终止条件到达查询结束.结果实验表明,在同等条件下,利用网格索引比利用R-tree索引结构进行查询的效率至少高一倍,而且随着目标点个数的增加,优势更加明显.结论运用网格索引并选择合适的网格粒度实现TNN查询优于运用R-tree索引实现的算法.  相似文献   

9.
目的设计基于网格索引的Top-k偏好查询算法,提高Top-k偏好查询问题的解决效率.方法利用网格索引,采用概念划分的方法,实现基于范围查询和NN查询两种方式的Top-k偏好查询算法.结果通过真实数据集测试结果表明算法能够结合网格索引的优点,与基于R树索引的传统算法相比,在k值不断增加的情况下,查询效率提高了50%,能适应多种空间特征数据对象集合.结论网格索引可以有效处理Top-k偏好查询.  相似文献   

10.
用于RFID中间件的内存数据库结构研究   总被引:3,自引:0,他引:3  
内存数据库(MMDB)是射频标签(RFID)中间件能够实现实时过滤、分组、计数等操作的关键.针对大规模RFID应用中通用的以T树为索引结构的MMDB不能得到很好的效率的问题,在详细分析RFID应用的数据特性的基础上,总结出RFID应用的数据及其操作特征,提出一种全新的算法,并改进了MMDB的索引结构.算法与MMDB的索引结构相结合,使得内存数据库在支持所有符合EPC Global标准的接口操作的基础上,将需要保存的数据量减少到最低,能保证每个标签只有一条记录.在RFID应用所特有的大量范围查询上,查询的时间复杂度降低到了O(n).  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号