共查询到18条相似文献,搜索用时 93 毫秒
1.
基于 MapReduce 的 XML 查询逐渐成为研究热点,如何提高 XML 文档查询的效率是关键问题之一.在保障查询结果正确和 XML 数据分块一致的前提下,采用 XPath 投影的方法对 XML 数据分块预处理,使得 XML 分块中仅包含与查询有关的数据.实验表明,该方法有效缩小了数据分块的规模、缩短了 XML 数据服务的查询处理时间. 相似文献
2.
基于相容关系的XML索引机制 总被引:3,自引:0,他引:3
随着XML逐渐成为Internet数据表示与数据交换的标准,存储与查询XML数据变得日益重要.由于传统方法无法适应XML数据新的需求,使得XML索引成为一个挑战性的课题.到目前为止,已经出现了不少针对XML数据的索引方法.然而,在处理基于相对路径的查询上,缺少有效的解决办法.本文提出了一种基于相容关系的索引模式,结合XML文档拓扑结构的自身特点,能够有效地处理基于相对路径的查询.这种模式的主要特点包括:(1)利用XML数据的拓扑结构而不是XML文档的模式(DTD或XML Schema)来进行相对路径到绝对路径的转换;(2)对拓扑结构进行基于相容关系的数字方式编码,能够快速确定对应结点的依赖关系.实验证明这种方法在处理基于规则路径表示(尤其是相对路径)的XML查询时具有更高的效率. 相似文献
3.
一种优化的XML文档模型映射方案 总被引:1,自引:1,他引:0
在借鉴XRel方法的基础上加入边模型映射思想,提出了一种新的XML文档存储方案.与使用区间编码不同,该方案采用先序编号与路径串结合对文档树中的节点进行编码,然后按照文档中节点类型将XML文档树型结构分解为节点,分别存储到对应的关系中.实验结果表明,该方案在存储、查询性能方面要优于XRel方法,同时有效地支持XML文档更新. 相似文献
4.
通过对XML结构聚类现状进行研究分析,提出了一种新的XML文档结构相似度度量方法DBTD(Density-Based of the Tree Distance),并在此基础上提出以基于密度的DBSCAN方法对XML文档进行结构聚类.实验表明:该方法能够对XML文档进行结构聚类,且其聚类结果充分展现了该方法的有效性. 相似文献
5.
6.
7.
XML数据查询及优化方法研究 总被引:2,自引:1,他引:1
文章分析了XML语言特点及XQL数据查询性能,针对大规模XML文档集合查询提出了一种新的XML查询模型。将查询系统分为schema处理和查询处理两个阶段,详细分析了各个阶段的功能。 相似文献
8.
随着XML文档大量涌现,如何有效地管理和查询XML数据已经成为亟待解决的问题。结合数据库发展的需要,研究了在关系数据库中利用物化视图和查询重写技术存储和查询XML文档。基于视图的查询重写技术是查询优化的一个重要技术,利用缓存的视图结果回答新查询不需要访问源数据库进行查询,能够节省查询处理时间。通过对物化视图、视图缓存、查询重写等技术进行研究,讨论如何利用关系数据库中缓存的物化视图来回答查询的问题,并实现了基于物化视图的XML数据查询系统原型。系统中使用扩展的模式匹配算法实现对多分支路径的模式匹配,解决了重写是否存在的问题,并通过模式匹配算法的匹配结果,来判断是否可以构造补偿表达式。通过构造补偿表达式算法得到重写结果,进而通过数据库中缓存的视图完成查询。 相似文献
9.
10.
一种基于EMD的文档语义相似性度量 总被引:1,自引:0,他引:1
针对基于EMD(Earth Mover's Distance)的文档语义相似性算法不满足度量公理因而难以在信息检索与数据挖掘中推广应用的问题,该文提出了一种新的基于EMD的文档语义相似性度量--Mdss EMD(Metric fordocument semantic similarity based EMD).首先在分析EMD及现有改进方法缺陷的基础上,给出了文档宽度、虚拟项的概念;随后通过增加虚拟项来对齐文档矢量的总权值,使所有度量公理得到满足;最后,为提高该度量的适应能力及处理速度,还实现了虚拟项相似距离的弹性设计并对EMD算法进行了简化.该方法把EMD扩展到度量空间中来,很大程度上提高了EMD的索引能力与精度,初步实验表明,Mdss EMD的整体性能优于原EMD及现有其它类似方法. 相似文献
11.
12.
XML文档操作的高级语言:XSLT 总被引:4,自引:0,他引:4
随着XML应用的日益广泛.XML的数据检索、查询、转换就成为一个非常重要的应用领城.而XSLT是用于探作XML文档的完整高级语言。本文简要介绍了XML、XSL和XSLT的关系.XSLT的原理、语言特性及其开发工具.使读者能够对XSLT有一个清晰、简洁而相对全面的了解。 相似文献
13.
In this paper, we extend a previously reported intensity-based nonrigid registration algorithm by using a novel regularization term to constrain the deformation. Global motion is modeled by a rigid transformation while local motion is described by a free-form deformation based on B-splines. An information theoretic measure, normalized mutual information, is used as an intensity-based image similarity measure. Registration is performed by searching for the deformation that minimizes a cost function consisting of a weighted combination of the image similarity measure and a regularization term. The novel regularization term is a local volume-preservation (incompressibility) constraint, which is motivated by the assumption that soft tissue is incompressible for small deformations and short time periods. The incompressibility constraint is implemented by penalizing deviations of the Jacobian determinant of the deformation from unity. We apply the nonrigid registration algorithm with and without the incompressibility constraint to precontrast and post-contrast magnetic resonance (MR) breast images from 17 patients. Without using a constraint, the volume of contrast-enhancing lesions decreases by 1%-78% (mean 26%). Image improvement (motion artifact reduction) obtained using the new constraint is compared with that obtained using a smoothness constraint based on the bending energy of the coordinate grid by blinded visual assessment of maximum intensity projections of subtraction images. For both constraints, volume preservation improves, and motion artifact correction worsens, as the weight of the constraint penalty term increases. For a given volume change of the contrast-enhancing lesions (2% of the original volume), the incompressibility constraint reduces motion artifacts better than or equal to the smoothness constraint in 13 out of 17 cases (better in 9, equal in 4, worse in 4). The preliminary results suggest that incorporation of the incompressibility regularization term improves intensity-based free-form nonrigid registration of contrast-enhanced MR breast images by greatly reducing the problem of shrinkage of contrast-enhancing structures while simultaneously allowing motion artifacts to be substantially reduced. 相似文献
14.
15.
目前,使用XQuery语言实现的Apriori算法基本都是对单个XML文档进行挖掘,而对于现实中的XML文档,有些情况下相关联的数据是存放在多个文档中的,文档之间没有必然的联系,这时就要将多个文档同时考虑进来进行挖掘。针对如何对多个XML文档进行挖掘的问题,对基于XQuery语言的Apriori算法进行改进,引入了collection函数,使之能够对多个XML文档组成集合的节点进行访问,从而实现对多个XML文档的关联规则挖掘,最后通过实验验证其可行性及有效性,使其效果达到和对单个文档挖掘的相同效果。 相似文献
16.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高. 相似文献
17.
原生XML数据库实现了大量XML文档的有效管理和快速查询,但是安全问题不可避免。论文给出了基于原生XML数据库加密系统的实现体系结构,提出了实现时要解决的几个关键问题,并给出了解决办法。 相似文献