首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
针对Top-k dominating查询算法需要较高的时空消耗来构建属性组合索引,并且在相同属性值较多情况下的查询结果准确率低等问题,提出一种通过B+-trees和概率分布模型相结合的子空间支配查询算法--Ranking-k算法.首先,采用B+-trees为待查找数据各属性构建有序列表;然后,采取轮询调度算法读取skyline准则涉及到的有序列表,生成候选元组并获得k组终结元组;其次,根据生成的候选元组和终结元组,采用概率分布模型计算终结元组支配分数.迭代上述过程优化查询结果,直到满足条件为止.实验结果表明:Ranking-k与基本扫描算法(BSA)相比,查询效率提高了94.43%;与差分算法(DA)相比,查询效率提高了7.63%;与早剪枝Top-k支配(TDEP)算法、BSA和DA相比,查询结果更接近理论值.  相似文献   

2.
索引结构对有效保存和查询移动对象的运动轨迹是至关重要的.根据交通网络中移动对象的轨迹特点,讨论了目前具有代表性的几种索引结构,重点分析了MON-Tree索引结构,将它与3D-Rtree进行了性能比较.在此基础上,提出并实现了一种基于MON-Tree的网络中移动对象轨迹数据库原型.  相似文献   

3.
在障碍环境下的空间应用中,用户通常只对视域范围内可视的数据对象感兴趣。为解决障碍环境中视域范围内的反向最近邻查询问题,将视域可视性引入到反向K最近邻查询中,提出一种可视反向视域K最近邻查询算法。给定某空间数据集P、障碍集O和查询点q,可视反向视域K最近邻查询检索P中数据点,并将q作为可视视域K最近邻。应用查询点进行障碍过滤,得到障碍过滤算法,利用数据对象的视域进行剪枝,使用查询点与数据对象的关系剪枝,形成有效的障碍剪枝规则,并根据剪枝规则得到视域可视性判断算法。在此基础上,分别基于R*-树和VFR-树提出可视反向视域K最近邻查询算法R*-V2-RKNN和VFR-V2-RKNN,并分别通过对R*-树和VFR-树进行一次遍历得到查询结果。在真实数据集和模拟数据集上的实验结果表明,VFR-V2-RKNN算法的查询性能明显优于R*-V2-RKNN算法。  相似文献   

4.
IMOFN是一种支持固定网络中频繁更新的移动对象混合索引模型,它由一棵描述固定道路网络的2D R*-Tree、一组对时间进行索引的1D R*-Tree和一个存储移动对象实时数据的Hash数组组成.IMOFN既管理了移动对象实时位置,支持位置的频繁更新;又保存了历史轨迹,提供了范围查询、拓扑查询以及轨迹查询等多种有效的实时和历史查询功能.通过实验与FNR-Tree和MON-Tree进行性能比较,证实了IMOFN模型高效的查询能力.  相似文献   

5.
谭征  刘惊雷  余航 《计算机应用》2017,37(11):3107-3114
针对在数据库的个性化查询中条件约束(或上下文约束)没有被充分考虑的问题,首先提出了条件约束模型i+≻i-|X,它表示在上下文X的约束下,相对于i-,用户更偏好i+。在此模型的基础上,采用最大团(MaxClique)关联规则算法挖掘获得用户偏好;随后又提出了条件偏好挖掘(CPM)算法,该算法结合上下文用于挖掘偏好规则,从而得出用户的偏好。实验结果表明,基于CPM算法的偏好挖掘模型具有较强的偏好表达能力,将CPM算法与基于Apriori的算法以及CONTENUM算法进行了实验对比,实验的主要参数为最小支持度、最小可信度、数据规模等,实验结果进一步表明所提出的CPM算法可明显提高用户偏好规则的产生效率。  相似文献   

6.
网络受限移动对象过去、现在及将来位置的索引   总被引:1,自引:0,他引:1  
丁治明  李肖南  余波 《软件学报》2009,20(12):3193-3204
提出了一种适合于网络受限移动对象数据库的动态轨迹R树索引结构(network-constrained moving objects dynamic trajectory R-Tree,简称NDTR-Tree).NDTR-Tree不仅能够索引移动对象的整个历史轨迹,而且能够动态地索引和维护移动对象的当前及将来位置.为了比较相关索引结构及算法的性能,进行了详细的实验.实验结果表明,与现有的基于道路网络的移动对象索引方法如MON-Tree和FNR-Tree等相比,NDTR-Tree有效地提高了对网络受限移动对象动态全轨迹的查询处理性能.  相似文献   

7.
为了解决高维数据相似性连接查询中存在的维度灾难和计算代价高等问题,基于p-稳态分布,将高维数据映射到低维空间。根据卡方分布的性质,证明了如果低维空间的距离大于,则原始空间距离大于ε的概率具有一定的下界,从而可以在低维空间以较低的计算代价进行有效过滤。在此基础上,提出了基于卡方分布的高维数据相似性连接查询算法。为了进一步提高查询效率,提出了基于双重过滤的高维数据相似性连接查询算法。利用真实数据集进行了实验,实验结果表明所提方法具有较好的性能。基于卡方分布的相似性连接查询算法召回率可以达到90%以上。基于双重过滤的相似性连接查询算法可以进一步提高性能,但是会损失一定的召回率。对时间性能要求比较高、对召回率要求不太严格的查询任务可以采用基于双重过滤的相似性连接查询算法;反之,可以采用基于卡方分布的相似性连接查询算法。  相似文献   

8.
针对网络空间中有范围约束、不确定对象的最近邻查询问题,提出范围受限的网络空间模糊对象最近邻查询概念,并根据查询顺序的不同,给出NN-R查询算法和R-NN查询算法。两种算法均采用网络位置信息与连接信息分别存储的方式,使用聚类文件进行组织,减少I/O操作。NN-R算法在近邻查询过程中利用查询对象与受限范围的α-距离作为约束,缩小搜索范围。R-NN算法将受限范围内查询对象的欧氏近邻作为候选对象,利用欧氏距离的下界性与易求性降低时间复杂度。两种算法时间复杂度分别为O((log_(m1)|E|+(|V~*|m3+1)log_(m2)|V|+|E|+|V|log|V|+n(lgn+1))和O(log_(m4)n+(k+1)log_(m1)|E|+|E|+|V|log|V|)。实验结果表明,在各自适用条件下,两种算法均有较好的性能。  相似文献   

9.
在实际生活中,可以很容易地获得大量系统数据样本,却只能获得很小一部分的准确标签。为了获得更好的分类学习模型,引入半监督学习的处理方式,对基于未标注数据强化集成多样性(UDEED)算法进行改进,提出了UDEED+——一种基于权值多样性的半监督分类算法。UDEED+主要的思路是在基学习器对未标注数据的预测分歧的基础上提出权值多样性损失,通过引入基学习器权值的余弦相似度来表示基学习器之间的分歧,并且从损失函数的不同角度充分扩展模型的多样性,使用未标注数据在模型训练过程中鼓励集成学习器的多样性的表示,以此达到提升分类学习模型性能和泛化性的目的。在8个UCI公开数据集上,与UDEED算法、S4VM(Safe Semi-Supervised Support Vector Machine)和SSWL(Semi-Supervised Weak-Label)半监督算法进行了对比,相较于UDEED算法,UDEED+在正确率和F1分数上分别提升了1.4个百分点和1.1个百分点;相较于S4VM,UDEED+在正确率和F1分数上分别提升了1.3个百分点和3.1个百分点;相较于SSWL,UDEED+在正确率和F1分数上分别提升了0.7个百分点和1.5个百分点。实验结果表明,权值多样性的提升可以改善UDEED+算法的分类性能,验证了其对所提算法UDEED+的分类性能提升的正向效果。  相似文献   

10.
单纯形搜索在遗传算法中的融合研究   总被引:2,自引:1,他引:1  
构造了单纯形混合遗传算法SM-HGA+。分析单纯形搜索算法,提出了单纯形交叉算子和K步随机单纯形搜索算子,并将单纯形搜索算法和这两个算子分别融入到最优微群体μPBt)、最差微群体μPWt)和普通群体PCt),形成SM-HGA+。最优微群体中的单纯搜索算法提高算法的精度;最差微群体中的单纯形交叉算子加速最差个体向优秀个体进化;普通群体中K步随机单纯性搜索提高全局搜索速度,同时在普通群体采用大交叉概率的标准遗传算法,提高全局搜索能力。遗传算法测试函数验证算法SM-HGA+的正确性、效率。  相似文献   

11.
针对传统B+-Tree自顶向下访问模式的缺点,提出了支持频繁访问的FAB+-Tree(Frequent Access B+-Tree)。在B+-Tree的基础上增加了Hash辅助索引,使得访问B+-Tree时直接定位到叶结点,并利用基于内存的直接访问表及位矢量列表提高更新性能。同时基于共享Cache多核处理器,提出了基于流水线的FAB+-Tree多线程访问模块,并优化了该模块的共享Cache访问性能。在实验中,基于开源数据库INGRES实现了FAB+-Tree和多线程访问模块,实验结果表明B+-Tree的访问性能得到显著提高。  相似文献   

12.
由新型非易失存储介质构成的持久性内存(persistent memory,PM)具有扩展性强、按字节访问与静态能耗低等特性,为未来主存与辅存融合提供了强大的契机.然而由于LLC(last level cache)具有易失性且与主存交互粒度通常为64B,而PM的原子持久化操作粒度为8B.因此,数据从LLC更新到PM的过程中,若发生故障,则可能破坏更新操作的失败原子性,进而影响原始数据的完整性.为了保证更新操作的失败原子性,目前研究主要采用显式调用持久化指令与内存屏障指令,将数据有序地持久化到PM上,但该操作会造成显著的开销,在索引更新中尤为明显.在对索引进行更新时,往往会涉及到索引结构的变化,该变化需要大量的有序持久化开销.研究旨在减少基于PM的B+树在更新过程中为保证失败原子性而引入的持久化开销.通过分析B+树节点利用率、不同更新模式下持久化开销以及更新操作之间的关系,提出了一种基于节点内数据真实分布的数据单向移动算法.通过原地删除的方式,减少删除带来的持久化开销.利用删除操作在节点内留下的空位,减少后续插入操作造成的数据移动,进而减少数据持久化开销.基于上述算法,对B+树的重均衡操作进行优化.最后通过实验证明,相较于最新基于PM的B+树,提出的单向移动B+树能够显著提高单一负载与混合负载性能.  相似文献   

13.
多维向量动态索引结构研究   总被引:4,自引:0,他引:4  
多维向量的索引技术是多媒体数据库系统中的关键技术之一.集中研究基于向量空间模型的动态索引结构,以解决在图像数据库系统中按内容快速检索图像的对象问题.在分析研究R-Tree和R*-Tree的基础上,提出了ER-Tree动态索引结构.该索引树用超球体划分多维向量空间,以有利于计算最近邻;吸取R*-Tree树的重插技术,以增强索引树对数据集整体特征的表达能力,从而提高检索效率;通过引入插入安全点和删除安全点概念,有效地提高建树的效率.同时,给出了基于该结构的特征向量插入算法.实验结果表明,所提出的索引结构建树的  相似文献   

14.
张洲  金培权  谢希科 《软件学报》2021,32(4):1129-1150
索引是数据库系统中用于提升数据存取性能的主要技术之一.在大数据时代,随着数据量的不断增长,传统索引(如B+树)的问题日益突出:(1)空间代价过高.例如,B+树索引需要借助O(n)规模的额外空间来索引原始的数据,这对于大数据环境而言是难以容忍的.(2)每次查询需要多次的间接搜索.例如,B+树中的每次查询都需要访问从树根到叶节点路径上的所有节点,这使得B+树的查找性能受限于数据规模.自2018年来,人工智能与数据库领域的结合催生了“学习索引”这一新的研究方向.学习索引利用机器学习技术学习数据分布和查询负载特征,并用基于数据分布拟合函数的直接式查找代替传统的间接式索引查找,从而降低索引的空间代价并提升查询性能.首先对学习索引技术的现有工作进行了系统梳理和分类;然后,介绍了各种学习索引技术的研究动机与关键技术,对比分析了各种索引结构的优劣;最后,对学习索引的未来研究方向进行了展望.  相似文献   

15.
一种改进的增量挖掘算法   总被引:1,自引:1,他引:0       下载免费PDF全文
李春喜  赵雷 《计算机工程》2010,36(24):42-44
Pre-FUFP算法基于次频繁项的概念有效处理了频繁模式树的更新,但当有次频繁项变成频繁项时,需要判定原数据库中哪些事务包含该数据项。为此,通过引入次频繁项对应原事务标识符的索引确定需要处理原数据库的事务,减少这一过程所消耗的时间,并用基于压缩FP-tree和矩阵技术代替原始FP-growth挖掘出频繁模式。实验证明该算法在时间效率上较Pre-FUFP有大幅度提高。  相似文献   

16.
基于DPB^+-Tree的索引复制策略研究   总被引:1,自引:0,他引:1  
索引复制是分布并行数据库提供并行性和提高可用性的一个重要手段。本文提出一种适合于索引复制的树结构——DPB^+-Tree,在此基础上研究了相关的索引复制策略,其中副本复制原则考虑了更新/检索比、节点机负载和可靠性需求;索引副本建立允许一个新的副本学习先前的副本;而索引副本更新基于搜索更新机制来完成。对DPB^+-Tree索引复制策略的仿真实验结果表明,副本对查询的响应性能和负载均衡度有明显改善。  相似文献   

17.
高效的结构化联接方法是XML查询的关键。本文提出一种新颖的结构化联接方法,使用了包含段结构化XML文档树,并且使用了B^ -Tree索引技术支持该新方法,从而在基于栈的结构化联接过程中得以忽略若干时空耗费,提高处理效率。  相似文献   

18.
丁国芳  汤庸  章云 《计算机工程》2006,32(19):17-19
在系统中引入时态数据类型,使得在关系数据库系统中能对时态数据信息进行方便有效的管理。该文给出了一个基于时态数据类型的时态索引方法:MAP21*3B+-Tree方法,通过对时态数据的各个域分别建立索引,实现双时态数据库的各种时态查询。  相似文献   

19.
改进型缓存敏感B+树的研究   总被引:1,自引:0,他引:1  
王晨  陈刚  董金祥 《计算机测量与控制》2006,14(11):1531-1534,1550
在内存数据库中,处理器缓存的失配次数对系统的性能有重要的影响;缓存敏感的索引能减少在做查询操作时产生的缓存失配次数,从而提高系统的性能;传统的设计思路将结点大小等于缓存块大小,认为这样就能使得缓存失配次数减少;但是这样的设计忽略了TLB失配对系统性能的影响;我们提出了一种缓存敏感索引——改进型缓存敏感B+树(简称MCSB+树),它同时兼顾了缓存失配和TLB失配对系统性能的影响。比传统的缓存敏感索引能提供更好的操作性能。  相似文献   

20.
Multi-objective layout optimization methods for the conceptual design of robot cellular manufacturing systems are proposed in this paper. Robot cellular manufacturing systems utilize one or more flexible robots which can carry out a large number of operations, and can conduct flexible assemble processes. The layout design stage of such manufacturing systems is especially important since fundamental performances of the manufacturing system under consideration are determined at this stage. Layout area, operation time and manipulability of robot are the three important criteria when it comes to designing manufacturing system. The use of nature inspired algorithms are not extensively explored to optimize robot workcell layouts. The contribution in this paper is the use of five nature-inspired algorithms, viz. genetic algorithm (GA), differential evolution (DE), artificial bee colony (ABC), charge search system (CSS) and particle swarm optimization (PSO) algorithms and to optimize the three design criteria simultaneously. Non-dominated sorting genetic algorithm-II is used to handle multiple objectives and to obtain pareto solutions for the problems considered. The performance of sequence pair and B*-Tree layout representation schemes are also evaluated. It is found that sequence pair scheme performs better than B*-Tree representation and it is used in the algorithms. Numerical examples are provided to illustrate the effectiveness and usefulness of the proposed methods. It is observed that PSO performs better over the other algorithms in terms of solution quality.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号