共查询到20条相似文献,搜索用时 203 毫秒
1.
一种基于本体的异构数据源模式集成 总被引:1,自引:1,他引:0
本体是概念模型的明确的规范说明,能够精确地描述概念体系和领域知识.为了将异构数据源中的数据识别出来并进行语义相关的集成,提出了一种基于本体集成异构数据源的方法.首先将各个数据源中的效据以XML文档形式进行描述,然后将各个XML文档的文档类型定义(DTD)转化为DIM数据模型表示,最后通过语义聚类、全局模式生成等步骤,实现XML文档的基于本体的语义集成.文中提出的方法以普林斯顿大学的心理学家、语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典为本体库,可有效地识别出异构数据源中的具有等价语义或相近语义的数据,从而更准确地对异构数据源中的数据进行集成. 相似文献
2.
基于本体的XML语义集成研究 总被引:2,自引:0,他引:2
针对具有相同语义的XML数据经常具有不同表达形式的问题,采用了基于本体的语义集成方法来集成异构XML数据源,即通过一系列映射规则将XPath的局部路径与本体关联起来,将用户的RDQL查询重写为基于XML的XQuery查询,从而达到语义集成的效果。本方法的意义在于用户可以通过本体查询异构的XML数据源。 相似文献
3.
针对当前对异构数据源的数据集成中存在的语义异构问题,尤其是元素层的语义异构,通过分析现有的基于XML数据集成方法的基础上,将系统的设计分为三层,其中在数据层实现对异构数据源XML模式的包装,而在用户层和数据层之间增加一个中间层来实现全局查询到局部查询的转换。同时将本体论的思想引入集成系统框架,通过在中间层建立全局本体库和局部本体库,以及构建本体库之间的映射关系,解决了数据集成中异构数据源元素层的语义异构问题。 相似文献
4.
随着计算机技术的发展,很多企业内部实现了信息的计算机管理,积累了大量的数据.这些数据存在异构现象,相互之间难以集成和共享.传统的数据集成方法已经不能适应企业获取信息的需求,迫切需要一种新的数据集成系统.在XML技术基础上,提出一种基于本体的异构数据集成系统,用来解决数据源之间的语义异构问题.给出一种基于本体的异构数据集成的系统结构,对关键技术问题进行了研究,指出了系统今后研究的方向. 相似文献
5.
6.
王铮钧 《计算机应用与软件》2010,27(8)
提出了在企业应用集成EAI(Enterprise Application Integration)中基于本体的异构数据集成中间件,通过使用本体描述语言(OWL)对数据源进行建模,提高了系统集成的灵活性,隔离了数据源模式的变化,使得局部数据源模式的变化不会影响到整个集成系统.此外,通过引入本体来描述数据模式,为解决集成中的语义异构问题提供了支持,解决了数据源异构性问题,以实现灵活的数据源集成能力. 相似文献
7.
异构数据语义集成中本体映射研究 总被引:1,自引:0,他引:1
异构数据集成的要解决的关键问题之一是异构数据源的语义异构.为了解决语义异构,实现语义集成,本文利用"本体"描述异构数据,并提出一种通过WordNet词典、Google距离等多种方法综合计算本体概念相似度的方法,实现了半自动化本体映射. 相似文献
8.
9.
10.
11.
XML文档相似性的仿真研究 总被引:1,自引:0,他引:1
XML文档相似性的计算是XML文档分类中的一个难题。文中描述了一种基于结构的方法,通过序列化模式挖掘方法,挖掘出两个文档之间的最大相似路径,从而可以通过计算最大相似的路径的节点数目和所有路径的节点数目的比值,得到两个文档之间的相似度。文章提出了一种新的最小化XML文档的方法,并且综合考虑了文档节点的语义相似度和结构相似度,从而进一步地提高了计算文档相似度的精度。实验表明,该方法有着良好的应用前景。 相似文献
12.
基于XML的异构数据库的中间件的设计与研究 总被引:2,自引:0,他引:2
阐述了中间件及使用XML文档作为中间数据,在异构数据库之间进行中间件数据传输的设计与研究,并使用XML文档来设计各数据库与XML之间的数据类型映射. 相似文献
13.
针对目前数据交换方式在解决交换信息语义异构方面存在的不足,在XML技术的基础上,提出一种基于本体和Web Services的数据交换平台。首先给出一种数据交换平台的系统框架,对关键技术进行研究,提取各异构数据源的数据构造XML Schema文件,然后采用本体技术对其进行语义标记,形成带有语义信息的模式文件,最后通过对XML Schema文件进行模式匹配和映射,生成转换方案。实例效果表明该数据交换平台能有效地解决语义异构问题,并通过Web服务调用各业务系统实现数据交换和共享。 相似文献
14.
Richi Nayak 《Knowledge and Information Systems》2008,14(2):197-215
This paper presents the incremental clustering algorithm, XML documents Clustering with Level Similarity (XCLS), that groups
the XML documents according to structural similarity. A level structure format is introduced to represent the structure of
XML documents for efficient processing. A global criterion function that measures the similarity between the new document
and existing clusters is developed. It avoids the need to compute the pair-wise similarity between two individual documents
and hence saves a huge amount of computing effort. XCLS is further modified to incorporate the semantic meanings of XML tags
for investigating the trade-offs between accuracy and efficiency. The empirical analysis shows that the structural similarity
overplays the semantic similarity in the clustering process of the structured data such as XML. The experimental analysis
shows that the XCLS method is fast and accurate in clustering the heterogeneous documents by structures. 相似文献
15.
Pham Thu Thu Thuy Young-Koo Lee Sungyoung Lee 《Personal and Ubiquitous Computing》2013,17(7):1331-1339
Currently, a lot of recent electronic health records are based on XML documents. In order to integrate these heterogeneous XML medical documents efficiently, studies on finding structure and semantic similarity between XML Schemas have been exploited. The main problem is how to harvest the most appropriate relatedness to combine two schemas as a global XML Schema for reusing and referring purposes. In this paper, we propose the novel resemblance measure that concurrently considers both structural and semantic information of two specific healthcare XML Schemas. Specifically, we introduce new metrics to compute the datatype and cardinality constraint similarities, which improve the quality of the semantic assessment. On the basis of the similarity between each element pair, we put forward an algorithm to calculate the similarity between XML Schema trees. Experimental results lead to the conclusion that our methodology provides better similarity values than the others with regard to the accuracy of semantic and structure similarities. 相似文献
16.
基于本体的XML Schema生成方法 总被引:10,自引:0,他引:10
本体能够精确地描述概念体系和领域知识。该文提出了一种基于本体生成XMLSchema的方法。根据这一方法,可以提高XMLSchema的语义表达能力,最终提高XML文档在概念层次上描述的准确性。 相似文献
17.
XML access control models proposed in the literature enforce access restrictions directly on the structure and content of an XML document. Therefore access authorization rules (authorizations, for short), which specify access rights of users on information within an XML document, must be revised if they do not match with changed structure of the XML document. In this paper, we present two authorization translation problems. The first is a problem of translating instance-level authorizations for an XML document. The second is a problem of translating schema-level authorizations for a collection of XML documents conforming to a DTD. For the first problem, we propose an algorithm that translates instance-level authorizations of a source XML document into those for a transformed XML document by using instance-tree mapping from the transformed document instance to the source document instance. For the second problem, we propose an algorithm that translates value-independent schema-level authorizations of non-recursive source DTD into those for a non-recursive target DTD by using schema-tree mapping from the target DTD to the source DTD. The goal of authorization translation is to preserve authorization equivalence at instance node level of the source document. The XML access control models use path expressions of XPath to locate data in XML documents. We define property of the path expressions (called node-reducible path expressions) that we can transform schema-level authorizations of value-independent type by schema-tree mapping. To compute authorizations on instances of schema elements of the target DTD, we need to identify the schema elements whose instances are located by a node-reducible path expression of a value-independent schema-level authorization. We give an algorithm that carries out path fragment containment test to identify the schema elements whose instances are located by a node-reducible path expression. 相似文献
18.
存在多值依赖的XML DTD规范化研究 总被引:1,自引:0,他引:1
XML DTD文档中可能包含由非函数依赖引起的数据冗余和操作异常,首先从消除DTD文档内数据冗余的角度出发研究了文档的规范化的问题,讨论了在DTD文档中存在多值依赖的情况下,如何规范XML文档,提出了以DTD为模式的XML文档的多值依赖的概念。然后基于多值依赖的概念,提出了XML文档的一种多值依赖范式MXNF。最后在此基础上提出了把一个XML文档的DTD无损联接地分解成为符合MXNF的规范化算法,来规范存在多值依赖的XML DTD文档,并给出了该算法的分析说明。 相似文献
19.
20.
XML文档近似连接操作是在两个XML文档集合中发现近似的XML文档,其在基于XML数据的信息集成、XML数据清洗等系统中有着广泛的应用.然而,目前XML文档近似连接操作的一个显著问题在于:当文档之间存在较大差异时,存在大量的重复计算,降低了处理效率.对于这个问题,提出了基于聚类的XML文档近似连接方法,基本思想是为每个XML文档建立一个索引,如果两个数据集中若干文档的索引较相似,可以把它们组成一簇,然后在每一簇中执行近似连接.而不在任何簇中的文档,则无需对其进行任何计算.实验结果表明,提出的方法在保证正确率的前提下具有高效性. 相似文献