首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
基于 MapReduce 的 XML 查询逐渐成为研究热点,如何提高 XML 文档查询的效率是关键问题之一.在保障查询结果正确和 XML 数据分块一致的前提下,采用 XPath 投影的方法对 XML 数据分块预处理,使得 XML 分块中仅包含与查询有关的数据.实验表明,该方法有效缩小了数据分块的规模、缩短了 XML 数据服务的查询处理时间.  相似文献   

2.
基于相容关系的XML索引机制   总被引:3,自引:0,他引:3  
徐海渊  吴泉源  王怀民  贾焰 《电子学报》2003,31(8):1155-1159
随着XML逐渐成为Internet数据表示与数据交换的标准,存储与查询XML数据变得日益重要.由于传统方法无法适应XML数据新的需求,使得XML索引成为一个挑战性的课题.到目前为止,已经出现了不少针对XML数据的索引方法.然而,在处理基于相对路径的查询上,缺少有效的解决办法.本文提出了一种基于相容关系的索引模式,结合XML文档拓扑结构的自身特点,能够有效地处理基于相对路径的查询.这种模式的主要特点包括:(1)利用XML数据的拓扑结构而不是XML文档的模式(DTD或XML Schema)来进行相对路径到绝对路径的转换;(2)对拓扑结构进行基于相容关系的数字方式编码,能够快速确定对应结点的依赖关系.实验证明这种方法在处理基于规则路径表示(尤其是相对路径)的XML查询时具有更高的效率.  相似文献   

3.
一种优化的XML文档模型映射方案   总被引:1,自引:1,他引:0  
在借鉴XRel方法的基础上加入边模型映射思想,提出了一种新的XML文档存储方案.与使用区间编码不同,该方案采用先序编号与路径串结合对文档树中的节点进行编码,然后按照文档中节点类型将XML文档树型结构分解为节点,分别存储到对应的关系中.实验结果表明,该方案在存储、查询性能方面要优于XRel方法,同时有效地支持XML文档更新.  相似文献   

4.
罗丹  刘先锋 《信息技术》2009,33(8):24-26,31
通过对XML结构聚类现状进行研究分析,提出了一种新的XML文档结构相似度度量方法DBTD(Density-Based of the Tree Distance),并在此基础上提出以基于密度的DBSCAN方法对XML文档进行结构聚类.实验表明:该方法能够对XML文档进行结构聚类,且其聚类结果充分展现了该方法的有效性.  相似文献   

5.
基于Key的XML连续查询算法   总被引:1,自引:1,他引:0  
徐海渊  吴泉源  贾焰 《电子学报》2003,31(2):284-286
普遍认为,XML将会取代Html成为数据表示和数据交换的主流标准,由于在线信息变化频繁,XML文档变化检测成为Internet查询系统、搜索引擎以及连续查询系统的关键技术.先前的研究多着眼于有序模式的XML文档,而无需模式的通用比较已经被证明是NP问题,目前针对无需模式的最好算法复杂度为多项式时间.本文提出了基于Key的变化检测算法,能够高效地检测无序模式XML文档的变化,算法复杂度为O(nlogn),n为文档结点数.  相似文献   

6.
数据约束是数据库规范化理论的基础,不完全信息引入XML文档后,需要重新定义数据约束.本文基于子树信息等价和子树信息相容的概念给出了XML亚强多值依赖的定义;提出了弱键路径和XML亚强多值依赖弱范式的定义,通过实例分析XML亚强多值依赖引起数据冗余的原因,提出分解不完全XML文档满足XML亚强多值依赖弱范式的定理.研究成果可较好的处理不完全XML文档中存在XML亚强多值依赖引起的数据冗余问题,避免了数据冗余所带来的操作异常.  相似文献   

7.
XML数据查询及优化方法研究   总被引:2,自引:1,他引:1  
文章分析了XML语言特点及XQL数据查询性能,针对大规模XML文档集合查询提出了一种新的XML查询模型。将查询系统分为schema处理和查询处理两个阶段,详细分析了各个阶段的功能。  相似文献   

8.
随着XML文档大量涌现,如何有效地管理和查询XML数据已经成为亟待解决的问题。结合数据库发展的需要,研究了在关系数据库中利用物化视图和查询重写技术存储和查询XML文档。基于视图的查询重写技术是查询优化的一个重要技术,利用缓存的视图结果回答新查询不需要访问源数据库进行查询,能够节省查询处理时间。通过对物化视图、视图缓存、查询重写等技术进行研究,讨论如何利用关系数据库中缓存的物化视图来回答查询的问题,并实现了基于物化视图的XML数据查询系统原型。系统中使用扩展的模式匹配算法实现对多分支路径的模式匹配,解决了重写是否存在的问题,并通过模式匹配算法的匹配结果,来判断是否可以构造补偿表达式。通过构造补偿表达式算法得到重写结果,进而通过数据库中缓存的视图完成查询。  相似文献   

9.
基于部分匹配的XML文本文档向量检索模型   总被引:3,自引:2,他引:1       下载免费PDF全文
吴劲  陈泽琳 《电子学报》2002,30(Z1):2169-2171
本文提出了部分匹配模式的XML文本文档向量检索模型,给出了XML文本文档树以及子文档树的向量表示和查询以及子查询的向量表示,并由此提出了查询中的祖先-后代关系映射到文档中的祖先-后代关系的部分匹配模式的检索方式,给出了基于此匹配处理过程的相似度计算,以判断文档与查询的相关程度.在构造的检索原型系统中的实验表明,该检索模型具有较好的查全率和查准率.  相似文献   

10.
一种基于EMD的文档语义相似性度量   总被引:1,自引:0,他引:1  
针对基于EMD(Earth Mover's Distance)的文档语义相似性算法不满足度量公理因而难以在信息检索与数据挖掘中推广应用的问题,该文提出了一种新的基于EMD的文档语义相似性度量--Mdss EMD(Metric fordocument semantic similarity based EMD).首先在分析EMD及现有改进方法缺陷的基础上,给出了文档宽度、虚拟项的概念;随后通过增加虚拟项来对齐文档矢量的总权值,使所有度量公理得到满足;最后,为提高该度量的适应能力及处理速度,还实现了虚拟项相似距离的弹性设计并对EMD算法进行了简化.该方法把EMD扩展到度量空间中来,很大程度上提高了EMD的索引能力与精度,初步实验表明,Mdss EMD的整体性能优于原EMD及现有其它类似方法.  相似文献   

11.
李新叶  苑津莎 《电子学报》2007,35(11):2220-2225
传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出了一种快速的XML语义检索算法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显示出新算法的有效性.  相似文献   

12.
XML文档操作的高级语言:XSLT   总被引:4,自引:0,他引:4  
随着XML应用的日益广泛.XML的数据检索、查询、转换就成为一个非常重要的应用领城.而XSLT是用于探作XML文档的完整高级语言。本文简要介绍了XML、XSL和XSLT的关系.XSLT的原理、语言特性及其开发工具.使读者能够对XSLT有一个清晰、简洁而相对全面的了解。  相似文献   

13.
In this paper, we extend a previously reported intensity-based nonrigid registration algorithm by using a novel regularization term to constrain the deformation. Global motion is modeled by a rigid transformation while local motion is described by a free-form deformation based on B-splines. An information theoretic measure, normalized mutual information, is used as an intensity-based image similarity measure. Registration is performed by searching for the deformation that minimizes a cost function consisting of a weighted combination of the image similarity measure and a regularization term. The novel regularization term is a local volume-preservation (incompressibility) constraint, which is motivated by the assumption that soft tissue is incompressible for small deformations and short time periods. The incompressibility constraint is implemented by penalizing deviations of the Jacobian determinant of the deformation from unity. We apply the nonrigid registration algorithm with and without the incompressibility constraint to precontrast and post-contrast magnetic resonance (MR) breast images from 17 patients. Without using a constraint, the volume of contrast-enhancing lesions decreases by 1%-78% (mean 26%). Image improvement (motion artifact reduction) obtained using the new constraint is compared with that obtained using a smoothness constraint based on the bending energy of the coordinate grid by blinded visual assessment of maximum intensity projections of subtraction images. For both constraints, volume preservation improves, and motion artifact correction worsens, as the weight of the constraint penalty term increases. For a given volume change of the contrast-enhancing lesions (2% of the original volume), the incompressibility constraint reduces motion artifacts better than or equal to the smoothness constraint in 13 out of 17 cases (better in 9, equal in 4, worse in 4). The preliminary results suggest that incorporation of the incompressibility regularization term improves intensity-based free-form nonrigid registration of contrast-enhanced MR breast images by greatly reducing the problem of shrinkage of contrast-enhancing structures while simultaneously allowing motion artifacts to be substantially reduced.  相似文献   

14.
与普通XML文档相比,概率XML数据中节点的类型不唯一且节点的出现具有相应的概率。提出一种高效的编码策略DeweyTP,该编码策略为每个XML数据节点分配唯一的能够体现节点类型和路径概率的编码,来支持节点类型检测和路径概率提取,因而提升系统性能。最后通过实验从时间和空间两方面验证了DeweyTP编码的高效性。  相似文献   

15.
苏勇  王燕 《信息技术》2011,(5):91-94,100
目前,使用XQuery语言实现的Apriori算法基本都是对单个XML文档进行挖掘,而对于现实中的XML文档,有些情况下相关联的数据是存放在多个文档中的,文档之间没有必然的联系,这时就要将多个文档同时考虑进来进行挖掘。针对如何对多个XML文档进行挖掘的问题,对基于XQuery语言的Apriori算法进行改进,引入了collection函数,使之能够对多个XML文档组成集合的节点进行访问,从而实现对多个XML文档的关联规则挖掘,最后通过实验验证其可行性及有效性,使其效果达到和对单个文档挖掘的相同效果。  相似文献   

16.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高.  相似文献   

17.
原生XML数据库实现了大量XML文档的有效管理和快速查询,但是安全问题不可避免。论文给出了基于原生XML数据库加密系统的实现体系结构,提出了实现时要解决的几个关键问题,并给出了解决办法。  相似文献   

18.
XML在机械CAD系统中的应用   总被引:5,自引:0,他引:5  
分析了Internet上最新的XML技术的特点,通过实例用XML技术对机械CAD产生的各种文档信息进行了描述,并且构造了基于XML文档交换的分布式支持环境的体系结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号