首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 788 毫秒
1.
根据概率数据的描述形式对概率数据分为基于关系的概率数据模型和基于XML的概率数据模型两类。基于关系的概率数据模型是为每个元组引入概率标记属性表示不确定性,使元组的存储、查询处理变得复杂;基于XML的概率数据模型是在普通XML树中添加表示概率属性结点,能够表示多粒度的概率信息。设计了映射为关系的概率XML数据的与PDTD无关的PXRel和PXParent两种存储模式,并通过实验验证了其有效性。  相似文献   

2.
概率XML文件是概率数据的网络数据交换和表示标准,元素取值及其概率的查询与计算是概率XML文件的重要研究内容.概率XML文件树是一种有效的概率XML文件的数据模型,定义了概率XML文件树的基本路径和扩展路径,提出了根据可能世界原理将概率XML文件树分解为普通子XML树的集合的算法,根据路径分析原理将概率XML文件树分解为子概率XML树的集合的算法和相应的查询与计算结点及结点集合概率的算法,并通过实验进行了比较分析.实验结果表明:这两种方法是有效的;与前一种方法比较,后一种方法适合较大的概率XML文件树、结点及结点集合的概率的查询,计算过程较简单.  相似文献   

3.
一种概率XML数据树的化简算法*   总被引:2,自引:2,他引:0  
针对概率XML数据树分布节点冗余的问题,提出一种化简概率XML数据树的算法。通过分析概率XML数据树中的路径类型,把概率XML数据树划分为稀疏和紧凑两种形式结构,通过消除概率级联、计算绝对路径的相容类集合和等价类集合等过程把前者变换为后者。理论研究和实例分析表明,该化简算法是有效的,能够解决概率XML数据树的化简问题。  相似文献   

4.
消除结构冗余的XML数据库模式规范化设计   总被引:5,自引:2,他引:5  
XML数据库模式规范化设计是给出一个能很好地表示数据间依赖关系并消除了冗余的XML模式或DTD的集合.目前这一领域的研究并没有对XML数据库模式中的数据依赖和冗余进行专门的分析.引人标识符分别表示XML模式中的元素和属性,分析XML数据库模式的结构冗余:局部冗余、传递冗余和不规则;并在此基础上,定义XML数据库模式第3范式(3NF),给出并验证其规范化设计算法.  相似文献   

5.
一个新的概率数据模型   总被引:1,自引:0,他引:1  
为扩展传统关系数据模型,处理概率方面的不确定性数据,以描述动态的世界,建立了一个新型的数据模型——PRM模型。在该模型中引进概率属性,并提出对象属性、静态属性、动态属性、概率属性联合构成元组,形成二维关系表中的一个动态数据理论;为克服当前在概率数据模型研究方面的缺陷,定义了一个新的PRM模型体系及操作,使其具有处理概率数据的能力。  相似文献   

6.
基于轴节点的XML Schema到关系模式的映射   总被引:2,自引:0,他引:2  
任廷艳  余建桥 《计算机应用》2009,29(8):2303-2305
DTD模式不支持复杂元素类型定义,在引入Schema形式化定义的基础上,给出XML上的复杂元素和函数依赖的定义,提出一种基于轴节点的映射算法。该算法根据轴节点和XML函数依赖生成关系表,能保持XML文档的内容和结构信息,保持函数依赖,减少存储冗余,并且证明映射后的关系模式满足3NF。  相似文献   

7.
讨论了关系模式映射为XML的方法,研究了关系模式的反求算法,分析了基于键的嵌套算法和扁平算法,实现了以模型驱动的关系模式映射为XML的算法。实现了将XML模式转换为关系模式的算法。最后就关系模式与XML的转换建立了异构关系数据统一转换的工具。  相似文献   

8.
XML已经广泛地应用于数据描述及数据交换,然而日常数据的大部分依旧存放在关系型数据库里,因此转换关系数据到XML文档的需求日益增长,如何高效生成用户满意的XML模式是其中的关键。NeT&CoT算法2是近年来提出的可根据给定的关系模式生成具有层次特征的XML的自动转换算法,然而它存在效率不高的问题。因此,该文在NeT&CoT算法的基础上提出了简化算法,通过引入四个简化性质,避免了费时的nest操作,提高了转换效率。  相似文献   

9.
不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(MUX)关系.由于更普遍的结点依赖关系在表述和计算上的复杂性,较少有工作讨论.文中讨论概率XML模型PrXML~({exp,ind,mux})中基于SLCA语义的关键字过滤.这种模型中通过EXP结点描述更普遍的结点依赖关系.文中在定义了子树中关键字概率分布表tab及其相关的运算后,分别给出了模型中不同类型结点关键字概率分布表的计算方法,并给出了不需要构造可能世界直接求解SLCA结点概率的算法.文章通过实验评估了算法的特性和性能.  相似文献   

10.
基于键的XML模式到关系模式的规范化转换   总被引:8,自引:0,他引:8  
本文针对XML模式向关系模式转换过程中形成的冗余和不规范,提出一种基于XML键的XML模式到关系模式的规范化转换算法。该算法以键为基础,根据XML函数依赖的一组推理规则,扩充函数依赖的集合,避免XML模式向关系模式转换过程中语义丢失的情况;再利用一组消解规则,消除冗余的函数依赖,使其满足极小函数依赖集;最后以键为中心划分关系属性,得到关系表,并且保证得到的关系模式满足3NF。  相似文献   

11.
Schema matching is the problem of finding relationships among concepts across data sources that are heterogeneous in format and in structure. Starting from the “hidden meaning” associated with schema labels (i.e. class/attribute names), it is possible to discover lexical relationships among the elements of different schemata. In this work, we propose an automatic method aimed at discovering probabilistic lexical relationships in the environment of data integration “on the fly”. Our method is based on a probabilistic lexical annotation technique, which automatically associates one or more meanings with schema elements w.r.t. a thesaurus/lexical resource. However, the accuracy of automatic lexical annotation methods on real-world schemata suffers from the abundance of non-dictionary words such as compound nouns and abbreviations. We address this problem by including a method to perform schema label normalization which increases the number of comparable labels. From the annotated schemata, we derive the probabilistic lexical relationships to be collected in the Probabilistic Common Thesaurus. The method is applied within the MOMIS data integration system but can easily be generalized to other data integration systems.  相似文献   

12.
基于关系模式的向量模型和XML模式树模型,提出了一种关系模式到模块化的XML Schema的模型映射方法BTT,其映射规则保持了关系模式的结构、属性以及约束信息的完整保留,自底向上的映射顺序在没有牺牲转换效率的情况下,完成了模块化的封装与重用,使得对转换后的XML Schema文档的更新操作可以在模块化内部完成,大大提高了维护效率。实验结果表明了与传统的嵌套层次的XML Schema文档相比,BTT方法转换形成的XML Schema在维护效率上有明显优势。  相似文献   

13.
The flexibility of XML data model allows a more natural representation of uncertain data compared with the relational model. Matching twig pattern against XML data is a fundamental problem in querying information from XML documents. For a probabilistic XML document, each twig answer has a probabilistic value because of the uncertainty of data. The twig answers that have small probabilistic value are useless to the users, and usually users only want to get the answers with the k largest probabilistic values. To this end, existing algorithms for ordinary XML documents cannot be directly applicable due to the need for handling probability distributional nodes and efficient calculation of top-k probabilities of answers in probabilistic XML. In this paper, we address the problem of finding twig answers with top-k probabilistic values against probabilistic XML documents directly. We propose a new encoding scheme called PEDewey for probabilistic XML in this paper. Based on this encoding scheme, we then design two algorithms for finding answers of top-k probabilities for twig queries. One is called ProTJFast, to process probabilistic XML data based on element streams in document order, and the other is called PTopKTwig, based on the element streams ordered by the path probability values. Experiments have been conducted to study the performance of these algorithms.  相似文献   

14.
基于OpenURL协议和XML Schema的异构数据库整合方案研究   总被引:2,自引:0,他引:2  
OptnURL框架是一种开放链接环境下提供定位服务的参考链接技术,也是网络资源整合的一种重要手段.基于该框架结构和XMLSchema较强的数据描述能力,该研究方案通过ISO2709模式到XMLSchema文档的映射构成转化平台,实现了以OPAC书目查询系统为中心的异构资源数据整合,并提出了一种新方法来解决数字资源参考链接动态修改的问题.该方案在某图书馆进行纸本数据和部分数字资源镜像数据的整合中得以应用.  相似文献   

15.
Current microarray databases use different terminologies and structures and thereby limit the sharing of data and collating of results between laboratories. Consequently, an effective integrated microarray data model is required. One important process to develop such an integrated database is schema matching. In this paper, we propose an effective schema matching approach called MDSM, to syntactically and semantically map attributes of different microarray schemas. The contribution from this work will be used later to create microarray global schemas. Since microarray data is complex, we use microarray ontology to improve the measuring accuracy of the similarity between attributes. The similarity relations can be represented as weighted bipartite graphs. We determine the best schema matching by computing the optimal matching in a bipartite graph using the Hungarian optimisation method. Experimental results show that our schema matching approach is effective and flexible to use in different kinds of database models such as; database schema, XML schema, and web site map. Finally, a case study on an existing public microarray schema is carried out using the proposed method.  相似文献   

16.
基于XML的异构数据交换模型的研究   总被引:1,自引:0,他引:1  
基于XML的异构数据交换系统通过XML提供通用数据格式,在异构数据源间信息交换的模型中使用XML文档作为中间文件.由于以往的交换系统只提取出了少部分用户自定义完整性约束,因此提出一种新的关系模式和XML模式相互转换的方法.在转换过程中,重新定义了关系模式的通用模型,从而保证了数据的完整性.通过实验证明了该转换方法的可行...  相似文献   

17.
聂玲  刘波 《计算机应用》2010,30(11):2941-2944
根据XML Schema中组件的定义及组件之间的嵌套关系,建立一系列从XML Schema转换成关系模式的结构映射规则和语义映射规则。基于这些规则实现一种转换算法,从Schema中提取出关系模式,并且证明映射得到的关系模式满足4NF。结果表明得到的关系模式不仅包含了XML Schema中所有的结构和内容信息,还能保留大部分语义约束信息,减少存储冗余。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号