首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
一种基于本体的异构数据源模式集成   总被引:1,自引:1,他引:0  
本体是概念模型的明确的规范说明,能够精确地描述概念体系和领域知识.为了将异构数据源中的数据识别出来并进行语义相关的集成,提出了一种基于本体集成异构数据源的方法.首先将各个数据源中的效据以XML文档形式进行描述,然后将各个XML文档的文档类型定义(DTD)转化为DIM数据模型表示,最后通过语义聚类、全局模式生成等步骤,实现XML文档的基于本体的语义集成.文中提出的方法以普林斯顿大学的心理学家、语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典为本体库,可有效地识别出异构数据源中的具有等价语义或相近语义的数据,从而更准确地对异构数据源中的数据进行集成.  相似文献   

2.
基于本体的XML语义集成研究   总被引:2,自引:0,他引:2  
针对具有相同语义的XML数据经常具有不同表达形式的问题,采用了基于本体的语义集成方法来集成异构XML数据源,即通过一系列映射规则将XPath的局部路径与本体关联起来,将用户的RDQL查询重写为基于XML的XQuery查询,从而达到语义集成的效果。本方法的意义在于用户可以通过本体查询异构的XML数据源。  相似文献   

3.
针对当前对异构数据源的数据集成中存在的语义异构问题,尤其是元素层的语义异构,通过分析现有的基于XML数据集成方法的基础上,将系统的设计分为三层,其中在数据层实现对异构数据源XML模式的包装,而在用户层和数据层之间增加一个中间层来实现全局查询到局部查询的转换。同时将本体论的思想引入集成系统框架,通过在中间层建立全局本体库和局部本体库,以及构建本体库之间的映射关系,解决了数据集成中异构数据源元素层的语义异构问题。  相似文献   

4.
随着计算机技术的发展,很多企业内部实现了信息的计算机管理,积累了大量的数据.这些数据存在异构现象,相互之间难以集成和共享.传统的数据集成方法已经不能适应企业获取信息的需求,迫切需要一种新的数据集成系统.在XML技术基础上,提出一种基于本体的异构数据集成系统,用来解决数据源之间的语义异构问题.给出一种基于本体的异构数据集成的系统结构,对关键技术问题进行了研究,指出了系统今后研究的方向.  相似文献   

5.
一种支持异构数据集成的Web服务合成方法   总被引:1,自引:0,他引:1  
全立新  岳昆  刘惟一 《计算机应用》2007,27(6):1438-1441
基于“协作者”数据集成架构,以网络环境中的数据查询为基本Web服务、关系数据库和XML文档为异构数据源的典型代表,并以其上已有的查询处理和XML数据绑定技术为基础,给出了Web服务环境下的数据集成模型。通过定义该模型上的基本操作(服务),利用有向图结构描述服务合成过程,提出了支持异构数据集成的Web服务合成方法和相应的优化策略。  相似文献   

6.
提出了在企业应用集成EAI(Enterprise Application Integration)中基于本体的异构数据集成中间件,通过使用本体描述语言(OWL)对数据源进行建模,提高了系统集成的灵活性,隔离了数据源模式的变化,使得局部数据源模式的变化不会影响到整个集成系统.此外,通过引入本体来描述数据模式,为解决集成中的语义异构问题提供了支持,解决了数据源异构性问题,以实现灵活的数据源集成能力.  相似文献   

7.
异构数据语义集成中本体映射研究   总被引:1,自引:0,他引:1  
异构数据集成的要解决的关键问题之一是异构数据源的语义异构.为了解决语义异构,实现语义集成,本文利用"本体"描述异构数据,并提出一种通过WordNet词典、Google距离等多种方法综合计算本体概念相似度的方法,实现了半自动化本体映射.  相似文献   

8.
一种基于Ontology的数据集成系统   总被引:1,自引:0,他引:1       下载免费PDF全文
陈遥  李珊  厉浩 《计算机工程》2007,33(23):90-93
针对异构数据源中实现基于语义的数据集成的需求,采用分层思想,在用户层与实际数据层之间增加一个中间层来屏蔽底层数据的异构,用本体作为公共语义描述工具,建立本体到各数据源的映射规则,设计实现了将基于本体的全局查询转化为基于各数据源的局部查询系统,解决了数据源之间的语义异构问题,其中用OWL表示本体和映射,并研究了系统中的关键技术。  相似文献   

9.
10.
针对油井工程领域异构数据源,提出了一种基于语义的虚拟视图集成方法。通过本体抽取和本体合并分别构造数据源局部本体和全局本体实现基于语义的数据访问视图,并利用全局本体、局部本体和数据源模式之间的映射关系,将基于语义的查询转换为底层数据源的访问请求,提供统一、透明的数据访问视图,以避免数据加载和更新等问题。通过油井决策支持数据集成平台,该方法取得了很好的应用效果。  相似文献   

11.
XML文档相似性的仿真研究   总被引:1,自引:0,他引:1  
XML文档相似性的计算是XML文档分类中的一个难题。文中描述了一种基于结构的方法,通过序列化模式挖掘方法,挖掘出两个文档之间的最大相似路径,从而可以通过计算最大相似的路径的节点数目和所有路径的节点数目的比值,得到两个文档之间的相似度。文章提出了一种新的最小化XML文档的方法,并且综合考虑了文档节点的语义相似度和结构相似度,从而进一步地提高了计算文档相似度的精度。实验表明,该方法有着良好的应用前景。  相似文献   

12.
基于XML的异构数据库的中间件的设计与研究   总被引:2,自引:0,他引:2  
阐述了中间件及使用XML文档作为中间数据,在异构数据库之间进行中间件数据传输的设计与研究,并使用XML文档来设计各数据库与XML之间的数据类型映射.  相似文献   

13.
针对目前数据交换方式在解决交换信息语义异构方面存在的不足,在XML技术的基础上,提出一种基于本体和Web Services的数据交换平台。首先给出一种数据交换平台的系统框架,对关键技术进行研究,提取各异构数据源的数据构造XML Schema文件,然后采用本体技术对其进行语义标记,形成带有语义信息的模式文件,最后通过对XML Schema文件进行模式匹配和映射,生成转换方案。实例效果表明该数据交换平台能有效地解决语义异构问题,并通过Web服务调用各业务系统实现数据交换和共享。  相似文献   

14.
Fast and effective clustering of XML data using structural information   总被引:2,自引:2,他引:0  
This paper presents the incremental clustering algorithm, XML documents Clustering with Level Similarity (XCLS), that groups the XML documents according to structural similarity. A level structure format is introduced to represent the structure of XML documents for efficient processing. A global criterion function that measures the similarity between the new document and existing clusters is developed. It avoids the need to compute the pair-wise similarity between two individual documents and hence saves a huge amount of computing effort. XCLS is further modified to incorporate the semantic meanings of XML tags for investigating the trade-offs between accuracy and efficiency. The empirical analysis shows that the structural similarity overplays the semantic similarity in the clustering process of the structured data such as XML. The experimental analysis shows that the XCLS method is fast and accurate in clustering the heterogeneous documents by structures.  相似文献   

15.
Currently, a lot of recent electronic health records are based on XML documents. In order to integrate these heterogeneous XML medical documents efficiently, studies on finding structure and semantic similarity between XML Schemas have been exploited. The main problem is how to harvest the most appropriate relatedness to combine two schemas as a global XML Schema for reusing and referring purposes. In this paper, we propose the novel resemblance measure that concurrently considers both structural and semantic information of two specific healthcare XML Schemas. Specifically, we introduce new metrics to compute the datatype and cardinality constraint similarities, which improve the quality of the semantic assessment. On the basis of the similarity between each element pair, we put forward an algorithm to calculate the similarity between XML Schema trees. Experimental results lead to the conclusion that our methodology provides better similarity values than the others with regard to the accuracy of semantic and structure similarities.  相似文献   

16.
基于本体的XML Schema生成方法   总被引:10,自引:0,他引:10  
本体能够精确地描述概念体系和领域知识。该文提出了一种基于本体生成XMLSchema的方法。根据这一方法,可以提高XMLSchema的语义表达能力,最终提高XML文档在概念层次上描述的准确性。  相似文献   

17.
XML access control models proposed in the literature enforce access restrictions directly on the structure and content of an XML document. Therefore access authorization rules (authorizations, for short), which specify access rights of users on information within an XML document, must be revised if they do not match with changed structure of the XML document. In this paper, we present two authorization translation problems. The first is a problem of translating instance-level authorizations for an XML document. The second is a problem of translating schema-level authorizations for a collection of XML documents conforming to a DTD. For the first problem, we propose an algorithm that translates instance-level authorizations of a source XML document into those for a transformed XML document by using instance-tree mapping from the transformed document instance to the source document instance. For the second problem, we propose an algorithm that translates value-independent schema-level authorizations of non-recursive source DTD into those for a non-recursive target DTD by using schema-tree mapping from the target DTD to the source DTD. The goal of authorization translation is to preserve authorization equivalence at instance node level of the source document. The XML access control models use path expressions of XPath to locate data in XML documents. We define property of the path expressions (called node-reducible path expressions) that we can transform schema-level authorizations of value-independent type by schema-tree mapping. To compute authorizations on instances of schema elements of the target DTD, we need to identify the schema elements whose instances are located by a node-reducible path expression of a value-independent schema-level authorization. We give an algorithm that carries out path fragment containment test to identify the schema elements whose instances are located by a node-reducible path expression.  相似文献   

18.
存在多值依赖的XML DTD规范化研究   总被引:1,自引:0,他引:1  
丘威  张立臣 《计算机科学》2007,34(2):149-151
XML DTD文档中可能包含由非函数依赖引起的数据冗余和操作异常,首先从消除DTD文档内数据冗余的角度出发研究了文档的规范化的问题,讨论了在DTD文档中存在多值依赖的情况下,如何规范XML文档,提出了以DTD为模式的XML文档的多值依赖的概念。然后基于多值依赖的概念,提出了XML文档的一种多值依赖范式MXNF。最后在此基础上提出了把一个XML文档的DTD无损联接地分解成为符合MXNF的规范化算法,来规范存在多值依赖的XML DTD文档,并给出了该算法的分析说明。  相似文献   

19.
随着语义Web技术的不断发展,基于XML的数据文档管理成为语义Web技术发展的难题,特别是RDF,DAML,OIL,OWL等本体语言的提出,基于XML的本体文档日趋复杂,传统的在关系数据库中依靠映射关系管理本体文档越来越困难。提出使用XML数据库Xindice来存储查询本体文档并设计了存储查询方法。  相似文献   

20.
XML文档近似连接操作是在两个XML文档集合中发现近似的XML文档,其在基于XML数据的信息集成、XML数据清洗等系统中有着广泛的应用.然而,目前XML文档近似连接操作的一个显著问题在于:当文档之间存在较大差异时,存在大量的重复计算,降低了处理效率.对于这个问题,提出了基于聚类的XML文档近似连接方法,基本思想是为每个XML文档建立一个索引,如果两个数据集中若干文档的索引较相似,可以把它们组成一簇,然后在每一簇中执行近似连接.而不在任何簇中的文档,则无需对其进行任何计算.实验结果表明,提出的方法在保证正确率的前提下具有高效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号