共查询到20条相似文献,搜索用时 484 毫秒
1.
XML文档进行高效编码、索引、查询的前提是数据的存储模型.针对XML的典型树状结构,文章提出一种基于三叉链表的XML文档存储模型.在此基础上,讨论了XML数据的查询、更新、插入、删除、结点关系判断等运算的实现,分析了相关算法的效率. 相似文献
2.
3.
一种支持XML的文件系统构建模型 总被引:2,自引:0,他引:2
XML作为数据存储和传输的标准,已经广泛应用于网络和数据库等数据处理系统中.针对大量出现的XML数据,传统的基于字节流的文件系统因其不具备存储和管理语义结构的能力,只能将XML数据视为普通的文本文档进行存储和管理,因而不能充分利用XML的半结构化等优点进行高效的细粒度的信息管理.本文在研究基于XML的数据库系统和语义文件系统的基础上,提出一种新型的基于XML的文件系统模型,并在传统文件系统上利用目录和文件分别存储XML文件的元素和属性实现一种语义结构的存储,使文件系统具备对信息的细粒度控制. 相似文献
4.
研究了基于XML Schema的XML数据关系化存储策略,给出了一种基于Schema从XML到关系数据库的模式映射方法.以XML Schema文档作为输入,通过分析将它转换为一个包含XML Schema中组件信息的语义图;然后把XML Schema图内联;最后由内联图生成关系模式. 相似文献
5.
6.
数据依赖是数据库的一个重要概念。函数依赖是一种常见的数据依赖关系,是数据语义的重要组成部分。随着XML文档的大量出现,这一概念被引入到XML的领域中。本文在约束限制范围的基础上,给出了XML函数依赖的定义。引入粗糙集解决XML数据不完整的特点,给出XML函数依赖的判定定理。并且提出了一个发现XML文档中最小非平凡函数依赖的算法。该算法基于一致集的概念,通过不可分辨关系划分元组集减少求一致集的运算次数,使用逐层求精的算法来计算最小非平凡XML函数依赖集的左部。通过该算法得到的XML函数依赖的语义信息对数据存储模式设计、查询优化和更新异常检查来说是十分重要的。 相似文献
8.
关系数据库是当今农业信息存储的主要形式。随着Web技术的发展,信息检索越来越复杂,关系数据库需要更好被Web理解,需要更多语义上下文支持;使用XML格式文档来表达和存储数据的目的就是要解决这方面问题。文中以常见农业动物疾病信息数据库为例,通过比较两种数据存储表示形式找出XML文档结构的优势并使用Java语言设计映射算法,把现有禽类疾病关系数据库部分内容映射为XML数据形式,证明了该存储方式的优越性,为今后农业动植物疾病的语义网建设打下基础。 相似文献
9.
基于演化计算的XML数据的关系存储 总被引:5,自引:0,他引:5
随着XML规范的制定和推广,XML数据管理技术受到数据库界广泛重视,XML数据的存储是XML数据管理的关键.研究了利用数据库技术和人工智能技术,为XML数据的关系存储提供一种灵活的策略.首次提出了代价驱动的基于遗传算法的关系存储策略CDGABRS,针对不同的用户和查询模型,产生不同的映射模型方案,引进遗传算法,计算对应的系统开销,从中求出使系统的存储代价和查询代价最优的关系存储方案.实验证明了CDGABRS方法的可行性和高效性. 相似文献
10.
11.
12.
利用关系表构建XML文档解析的树模型 总被引:2,自引:1,他引:1
在对XML文档的数据解析和查询操作研究中,发现树能较好地反映XML文档的层次结构,但其查询效率较低,而关系表是一种适合存储大量数据且有较好查询效率与操作功能的数据结构。给出了一个把树和关系表相结合构建一种存储XML文档的数据模型;在这个模型的解析过程中,采用回调事件式的分段解析方法以减少解析时间和存储空间。这样既能较好保存XML文档的结构特点,又能提高其查询的效率和操作的便利性。通过对大数据量XML文档的解析和操作实验,实验结果证明这种数据模型在处理大型XML文档中具有明显优势。 相似文献
13.
本文介绍了一种树型结构的存储、显示和维护方法。以二叉链表的数据结构将树的信息存储在数据库中,服务器端将数据库中树的信息转化成XML,客户端将其加载到浏览器的(DOM)实例中,并采用深度优先搜索算法对该实例中的结点进行递归遍历,生成浏览器端树的HTML代码,它是一个与上述XML文档逻辑相同的树型结构。同时在各结点上设置JS事件,可以对该树进行维护,生成针对结点维护的XML,服务器解析该XML并生成一系列SQL提交到数据库中。 相似文献
14.
《Information and Software Technology》2003,45(5):241-251
XML is data that has no fixed structure. So it is hard to design a schema for storing and querying an XML data. Instead of a fixed schema, graph-based data models are widely adopted for querying XML. Queries on XML are based on paths in a data graph.A meaningful query usually has several paths in it, but much of recent research is more concerned with optimizing a single path in a query. In this paper, we present an efficient technique for processing multiple path expressions in a query. We implemented our technique and present preliminary performance results. 相似文献
15.
16.
因各系统记录的二进制数据的数据格式不同,为开发系统耦合度低,可重用性好的转换工具,结合树型结构数据字典和模块化设计思想,利用XML文档存储和维护数据字典内容,设计了基于XML存储的数据字典的转换工具系统框架.将转换工具划分为预处理模块、提取载荷模块、读取XML文件模块,数据字典模块和解析结果显示模块共5个功能模块,完成了二进制数据的译码过程.使用XML数据字典设计转换工具系统框架,结构清晰,可维护性好. 相似文献
17.
《Data & Knowledge Engineering》2006,58(2):159-179
Structural join has been established as a primitive technique for matching the binary containment pattern, specifically the parent–child and ancestor–descendant relationship, on the tree XML data. While current indexing approaches and evaluation algorithms proposed for the structural join operation assume the tree-structured data model, the presence of reference links in XML documents may render the underlying model a graph instead. In the more general category of semi-structured data, of which XML is an example, the data model is also usually supposed to be of graph structure. In this paper, we present an indexing approach and corresponding evaluation algorithms for efficiently performing the structural join operation on graph-structured data. Our approach encodes the structural containment relationship of a graph on multiple nested tree-structured layers, probably with the exception of the last one. With each tree-structured layer indexed with the inverted technique, the structural join operation on a graph can therefore be accomplished through recursively performing structural joins on nested layer trees. Our extensive experiments on both benchmark and synthetic XML data indicate that our proposed approach has good potential to perform significantly better than existing ones in term of both the I/O and CPU cost. 相似文献
18.
基于XML的数据库存储访问技术 总被引:5,自引:3,他引:2
随着XML日益普遍应用,如何有效地存储和访问XML文档中的数据已成为亟待解决的关键问题。讨论了目前比较先进的XML技术和基于XML的数据库模型,依据该模型和微软的SQL Server 2000实现XML数据的存储和访问。举例说明了如何在SQL Server中实现XML访问和XML存储。 相似文献
19.
基于XML Schema的XML存储 总被引:6,自引:0,他引:6
文章介绍了一个在关系数据库中,基于XMLSchema的XML存储方案。描述了一个以树模型为模型,XMLSchema为模式的XML数据库的存储系统。首先给出了在关系数据库中存储XMLSchema的方法,在此基础上,又给出了存储XML文档的方法。与通常的XML分解存储方案不同之处在于,在该方案中,XMLSchema被保存到数据库中,未作模式映射,避免了模式映射通常会带来的数据丢失和数据要分散到多个关系表中的问题;对XML文档的存储和查询都是基于XMLSchema的;并且由于所有基于同一个模式的XML文档共享该模式的结构,不必对结构信息进行重复存储,减少了存储空间;最后,由于我们为每一个元素赋予了一个唯一ID值,在进行查询的时候,可以利用该ID值进行定位,具有和XPath表达式相同的作用,但是更为简便。 相似文献
20.
Wang Lian Cheung D.W.-l. Mamoulis N. Siu-Ming Yiu 《Knowledge and Data Engineering, IEEE Transactions on》2004,16(1):82-96
With the standardization of XML as an information exchange language over the Internet, a huge amount of information is formatted in XML documents. In order to analyze this information efficiently, decomposing the XML documents and storing them in relational tables is a popular practice. However, query processing becomes expensive since, in many cases, an excessive number of joins is required to recover information from the fragmented data. If a collection consists of documents with different structures (for example, they come from different DTDs), mining clusters in the documents could alleviate the fragmentation problem. We propose a hierarchical algorithm (S-GRACE) for clustering XML documents based on structural information in the data. The notion of structure graph (s-graph) is proposed, supporting a computationally efficient distance metric defined between documents and sets of documents. This simple metric yields our new clustering algorithm which is efficient and effective, compared to other approaches based on tree-edit distance. Experiments on real data show that our algorithm can discover clusters not easily identified by manual inspection. 相似文献