首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 390 毫秒
1.
XML文档树编码用来标识节点在文档树中的位置,XML文档查询算法通常通过编码来判断节点的祖先后代和兄弟关系,编码的好坏对查询效率影响很大.目前提出的编码主要分为两大类:区间编码和前缀编码,最近提出的扩展的前缀编码-Extended Dewey,由于通过单个节点的编码能够得到节点对应的路径,所以它支持有效的查询,但不支持动态插入.提出了一种新的XML文档树编码-IFED,它由Extended Dewey编码改进而来,既支持高效地查询,又支持动态插入.  相似文献   

2.
目前现有的前缀编码、区间编码等编码方案均不能很好地支持XML文档的更新计算。为此,提出一种新的前缀编码方案TDE。将实数映射为二维元组,利用任意2个实数间存在无限个实数的特点,对XML文档进行插入节点操作而无需对其他节点进行二次编码,并采用压缩存储减小编码的存储空间。实验结果表明,该方案能有效支持XML文档的更新计算。  相似文献   

3.
基于扩展Dewey编码的XML文档更新计算   总被引:1,自引:0,他引:1  
针对在进行XML文档插入、删除等更新时因需要频繁调整相应的子树编码而导致更新低效问题.分析了低效的原因,提出了一种扩展的Dewey编码方案.该编码方案对Dewey编码的连续性进行扩展,使兄弟节点之间的编码不再连续,为插入新节点准备冗余空间.在此基础上,设计了支持该扩展编码方案的XML文档节点插入算法和分裂算法.实验结果表明,提出的扩展Dewey编码方案有效地实现了XML文档的更新计算.  相似文献   

4.
摘  要:在XML查询中,为了快速判断节点之间祖先后裔关系和双亲孩子关系,提出了一些编码方案,然而,当对顺序敏感的有序XML文档进行插入更新操作的时候,现有的编码方案必须重新对存在的节点进行编码或者重新计算节点编码的值,导致了很高的更新代价。在路径编码方法的基础上,提出了一种新的编码方案BSEPS(Binary String Encoding based on Path Scheme),该方案支持在不重新编码或者重新计算的情况下完成顺序敏感的插入更新操作。实验结果表明,BSEPS编码能有效处理顺序敏感查询和叶节点/子树更新。  相似文献   

5.
为解决XML数据更新时变更相应的子树编码导致的低效更新问题,以及插入结点过多而预留的编码空间不足造成的溢出问题,分析相关编码低效的原因,提出了一种支持XML文档更新的编码方案.采用该编码,XML文档树中现有结点的编码不受插入或删除操作的影响,避免了二次编码,降低了空间成本,采用编码对应表替代了原Dewey编码中各层之间的“.”分隔符,缩短了编码长度,并给出了基于该编码的XPath查询轴的判别方法,可快速判断结点间的结构关系.理论分析和实验结果表明了该编码方案的准确性和有效性.  相似文献   

6.
XML文档是半结构化数据,对其进行频繁路径挖掘可以分为两步:XML文档序列化和序列挖掘阶段. 现有的序列化方式将XML文档表示为Xpath路径集合,其中有大量的节点冗余;序列挖掘阶段采用的类Apriori算法需要多次扫描数据库并产生大量的候选集,采用的PrefixSpan算法会产生大量的投影数据库,占用较大的内存. 针对以往XML频繁路径挖掘算法存在的不足,本文提出一种高效的挖掘算法——基于序列前缀技术的XML频繁路径挖掘算法(PXFP,Prefix-based XML Frequent Path Mining Algorithm). PXFP算法以广度优先方式遍历XML文档树并将每个节点表示为“节点:父节点”的形式,这种序列化的方式减少了节点冗余. 在序列挖掘阶段借鉴PrefixSpan 算法中前缀的概念,但不产生投影数据库,仅得到直接后缀(即前缀的子节点),通过记录频繁子路径的位置信息逐渐扩大频繁模式的长度,位置信息的引入减少了对数据库的扫描. 实验结果表明,PXFP算法取得了比PrefixSpan算法更高的时间和空间效率.  相似文献   

7.
Native XML数据库快速查询的实现,可以采用基于XML文档编码的结构连接算法。而结构连接算法的实现需要对XML文档进行编码,以便于快速判断XML文档树结点之间的祖先后裔关系。在对现有编码机制进行综述的前提下,提出一种新的XML文档编码机制——前缀整除编码(PDIV)机制。该机制编码形式简单,只需要一个正整数即可充分表示结点在XML文档树中的位置信息;可以实现祖先后裔关系的快速查询;支持XML文档的更新操作;编码长度较短,编码长度约为o(ln(n))。  相似文献   

8.
目前大部分前缀编码方案都不能很好的支持XML文档的数据更新.提出的前缀编码方案不仅能高效地支持结构查询,快速准确的判断XML文档结构树中任意两个结点之间的父子、先后代以及兄弟关系,而且对插入的结点采用新的编码规则,避免了更新操作带来的编码调整问题,能有效支持XML文档更新.  相似文献   

9.
覃遵跃  蔡国民  张彬连  汤庸 《计算机科学》2015,42(2):157-160,181
对有序XML文档树进行编码,不需要访问XML原始文件就能够实现对XML数据的管理,提高了XML管理系统的效率。针对查询提出的编码方案具有很高的查询性能,但更新效率很低。为提高更新性能而设计的方案存在查询效率低或者编码空间大等问题。为了在提高更新XML文档效率的同时不对查询性能和编码空间产生负面影响,提出了一种新的编码方法VEMBP(Vector Encoding Method Based of Prime),该方法利用向量表示有序XML节点之间的顺序关系,采用素数表示有序XML文档节点之间的结构信息;并设计了一种算法来实现在没有牺牲查询性能的前提下完全避免更新过程中的二次编码和重新计算,降低了更新代价,同时编码空间也得到了控制。实验结果显示,VEMBP具有较好的查询和更新性能。  相似文献   

10.
覃遵跃  黄云  蔡国民  梁平元 《计算机应用》2012,32(12):3540-3543
对有序XML文档进行编码,可以不用访问XML数据文件就能够实现对XML数据的处理。目前提出的编码方案在支持查询XML数据方面取得了较好的效果,针对已有编码方案在插入更新过程中存在查询性能或者更新性能偏低等问题,提出了一种新的支持插入更新的编码方案——EDL,EDL对前缀编码进行了扩展,利用数值表达节点的初始顺序关系,利用二进制字符串(BS)来支持更新计算。EDL在未降低查询性能的前提下,完全避免了插入更新后对其他节点进行重新编码,高效实现了XML文档的插入更新计算。实验结果表明EDL优于同类型的支持更新的编码方案。  相似文献   

11.
In order to facilitate the XML query processing, several labeling schemes have been proposed to directly determine the structural relationships between two arbitrary XML nodes without accessing the original XML documents. However, the existing XML labeling schemes have to re-label the pre-existing nodes or re-calculate the label values when a new node is inserted into the XML document during an update process. In this paper, we devise a novel encoding scheme based on the fractional number to encode the labels of the XML nodes. Moreover, we propose a mapping method to convert our proposed fractional number based encoding scheme to bit string based encoding scheme with the intention to minimize the label size and save the storage space. By applying our proposed bit string encoding scheme to the range-based labeling scheme and the prefix labeling scheme, the process of re-labeling the pre-existing nodes can be avoided when nodes are inserted as leaf nodes and sibling nodes without affecting the order of XML nodes. In addition, we propose an algorithm to control the increment of label size when new nodes are inserted frequently at a fix place of an XML tree. Experimental results show that our proposed bit string encoding scheme provides efficient support to the process of XML updating without sacrificing the query performance when it is applied to the range-based labeling schemes.  相似文献   

12.
在深入分析现有XML编码方案基础上,提出了一种新的编码方案—PSB,该方案能够快速准确地判断出XML文档结构树中任意两个结点之间的父子、祖先-后代以及兄弟关系。由于采用素数和序列编码,可有效支持XML文档更新,降低XML文档的二次编码率。实验表明PSB是一种高效的动态编码方法。  相似文献   

13.
为有效实现XML文档查询,减少查询时结构连接的扫描代价,分析了基于归并思想的结构连接算法查询效率低的原因,充分利用XML数据的结构特点,提出了能够直接判断结点间结构关系的扩展Dewey编码,基于该编码的改进的Stack-Tree-Desc结构连接算法.应用扩展的Dewey编码,缩短了编码长度,降低了空间成本.改进的Stack-Tree-Desc算法引入二分查找快速跳过不需要参与连接的结点,减少了AList和DList列表中被扫描的结点数量,提高了查询效率.理论分析和实验结果表明了该编码方案以及结构连接算法的准确性和有效性.  相似文献   

14.
冯少荣  陈天烁 《计算机工程》2012,38(13):64-66,78
基于向量的动态可扩展标记语言(XML)编码方法计算简单,但不能对已删编码进行重用,严重影响XML更新效率。为此,利用Stern-Brocot树对中间向量计算进行改进,提出一种求解最短位长中间向量的多项式时间算法,对批量分配进行优化,从而提高向量编码的更新性能。实验结果证明改进的编码方法能较好地重用已删编码,适用于XML的频繁更新。  相似文献   

15.
一种新的XML文档更新计算   总被引:1,自引:1,他引:0       下载免费PDF全文
当对XML文档进行插入操作时面临调整编码问题,目前提出的很多编码方案不能同时很好地支持XPath查询和XML文档更新。在分析现有编码方案的基础上,提出了基于完全树的编码方案,该编码方案采用序号冗余和虚拟节点两种冗余方式,不仅支持XPath的查询,而且能有效降低因插入节点需要对XML文档进行二次编码率。实验结果表明,完全树以及相应编码有效提高了XML文档插入节点的效率。  相似文献   

16.
一种有效的XQuery更新操作   总被引:1,自引:0,他引:1  
XQuery是XML查询语言的推荐标准。正如其它数据查询语言一样,XQuery也有自己的更新操作,XQuery更新操作就是用插入、替换、删除等操作对XML文档树进行修改,本文依照W3C组织7月草案[1]对XQuery更新操作提出了一些新的想法。诸如:对上述操作进行完善,使之更易读写,还设想了一个update操作符用来进行集中式更新操作,可以提高执行效率。当然这些都符合草案关于XQuery更新操作的规范[2]。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号