首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
RE-OEM:一种半结构化生物数据的信息抽取模型*   总被引:2,自引:0,他引:2  
在分析半结构化生物数据特点的基础上,提出了一种新的半结构化数据抽取模型RE-OEM。它将OEM数据模型和正则表达式有机地结合起来,不但能够灵活方便地表示各种数据结构,而且能够非常方便地进行模式匹配和数据的定位,为半结构化生物数据的抽取打下坚实基础。  相似文献   

2.
半结构化数据的模式抽取   总被引:1,自引:1,他引:1  
模式抽取在半结构化数据研究领域中具有重要意义。论文结合同类对象集和标签路径的概念,提出了一种从OEM模型中抽取模式的新方法。算法的基本思想是:在用OEM模型表示的半结构化数据中查找同类对象集,并通过构造模式表的方法来实现模式抽取。这种方法不但能从层次结构数据中抽取模式,而且还能从包含环路的OEM数据中进行模式抽取,克服了其它一些算法不能从带有环路的数据中进行模式抽取的缺点。  相似文献   

3.
基于约束的半结构化信息的抽取方法   总被引:1,自引:0,他引:1  
为了对WEB上不规则的动态信息按照数据库的方式集成和查询,本文采用对象交换模型(OEM)建立WEB上信息模型。为了将页面中各个部分表示为对应的OEM对象,本文(1)设计了半结构化信息的抽取算法;(2)定义了满足约束条件的数据抽取格式,并且设计了输出正确抽取格式的候选者算法;(3)给出测试结果。该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强。  相似文献   

4.
半结构化数据的模式抽取对于半结构化数据查询、优化及异构数据的集成具有重要的意义.结合标签路径及标签路径的目标集概念,提出了基于OEM(Object Exchange Model)模型的半结构化数据最小化模式抽取新方法,并给出了与标签路径目标集、支持度计算相关的两个定理.算法的基本思路:依据文中的两个定理,采用宽度优先自顶向下的遍历策略依次求出各标签路径的最后一个标签的目标集及支持度,标签支持度大的目标集优先映射为对应的模式节点.对同一半结构数据实例,算法抽取的模式与其他算法得到的模式相比规模小、算法执行时间短.算法适用于层次型及包含环路的OEM半结构化数据模式抽取.  相似文献   

5.
从WEB文档中构造半结构化信息的抽取器   总被引:36,自引:0,他引:36  
为了对WEB上不规则的、动态的信息按照数据库的方式集成和查询,采用对象交换模型(object exchange model,简称OEM)建立了WEB信息模型.为了将页面中各个部分表示为对应的OEM对象,设计了半结构化信息的抽取算法,并给出测试结果.该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强.  相似文献   

6.
半结构化、层次数据的模式发现   总被引:10,自引:0,他引:10  
Web数据资源及数据集成引发了半结构化数据问题,半结构化数据指其结构隐含或不规整的自描述数据。由于缺乏独立于数据的模式,有效地查询划浏览该类数据比较困难,半结构化数据的模式发现成为解决该问题的基础步骤。本文提出的算法能够快速有效地发现半结构化层次数据中的规整结构。它采用自顶向下的生成,结合有效的剪枝策略,从OEM模型表达的半结构化层次数据中构建模式树。  相似文献   

7.
王锟 《福建电脑》2008,(3):133-133,144
web信息抽取是对html文本中包含的信息进行结构化处理,抽取出有用的信息。本文提出了一种web信息抽取方法,通过清洗半结构化的HTML页面信息将其转化为结构化的XHTML格式信息,再利用DB29的SQL/XML语言,实现web信息的抽取。实验表明,该方法能够准确地提取数据块,正确抽取块内信息。  相似文献   

8.
通过分析半结构化数据的特点,以实际的采购退货数据(BokeDataInfo .xml)为例,利用DOM 对象对基于XML的半结构化的数据进行抽取,设计并实现了一个基于半结构数据的数据仓库ETL工具,解决了商用ETL工具不能直接加载抽取XM L文件进行数据仓库数据加载的弊端,为XM L半结构化数据的抽取并装载到数据仓库当前细节级中的这一问题的解决进行了有益的探索。  相似文献   

9.
随着数据挖掘应用的深入,非结构化和半结构化数据的挖掘,将成为下一个数据挖掘应用的热点。文本挖掘是一种典型的非结构化数据挖掘,而Web挖掘则是典型的半结构化数据挖掘。所以将信息处理技术中的汉语分词、信息抽取、语义分析等技术应用到Web挖掘研究技术是必然的发展趋势。本文根据Web挖掘的特点,运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,以便使数据提取更加准确。  相似文献   

10.
裴松  武彤 《微型机与应用》2013,32(17):56-59
为从企业生产线上XML半结构化数据中抽取富有意义数据,分析了XML半结构化数据和关系数据库中结构化数据特点,以及XML半结构化数据在关系数据库中的存储方法。针对实际应用,提出采用扩展哈弗曼前缀编码方法,对XML文档树进行唯一编码,实现XML文档与关系数据库映射,同时给出最长前缀匹配策略,支持数据查询,以提高查询效率。  相似文献   

11.
企业数据仓库多维数据模型的建立   总被引:1,自引:0,他引:1  
数据仓库是一种新的数据管理技术,能将企业内分散的原始操作型数据和来自外部的数据汇集和整理,为企业提供完整、及时和准确的决策信息。构建数据仓库系统的核心问题是如何建立复杂的企业数据模型。商务数据的本质是多维的,传统的ER模型已无法满足要求,而多维数据建模技术从维度、层次建模的角度有效地弥补了传统数据模型的不足。文章以多维数据建模技术为中心通过实例讨论了数据仓库中数据模型的一般建立方法,为解决构建企业信息系统提供了一种切实可行的方案。  相似文献   

12.
汪涛 《微机发展》2010,(5):191-194
数据模型设计是数据仓库建设的核心,提出一种医院数据仓库数据模型的设计方法。以某一三甲医院的HIS数据为背景,采用数据驱动的手段,结合医院的需求,提出了医院数据仓库的三层数据模型,概念模型、逻辑模型、物理模型,并完整地给出了每个模型的具体的设计和主要内容。设计并实现了医院数据仓库的数据模型,并结合医院具体的数据给出了相应的实例。此医院数据仓库的三层数据模型易于理解和实现,为医院数据仓库设计最终完成提供了基础。  相似文献   

13.
多维数据模型ER(H)   总被引:7,自引:0,他引:7  
李盛恩  王珊 《计算机学报》2005,28(12):2059-2067
ER(H)把成员形式化为论域上的概念,成员之间的关系由概念的抽象程度所确定,层是成员的集合,层之间的关系由层中的成员所决定,成员之间的半序关系和层之间的半序关系统一用OEM图表示,采用路径表达式作为查询语言,从而把维抽象为一个半结构化对象,可以作为关系模型中的域.ER(H)给出了一组完整性规则.扩充了关系模型和关系代数,使得能用关系对象模型表示多维数据.ER(H)可以方便地在主流的关系对象数据库上实现,并可以用于XML环境.  相似文献   

14.
基于栅格的GIS三维空间数据模型   总被引:1,自引:0,他引:1  
空间数据模型是描述GIS空间数据组织和进行空间数据库设计的理论基础,它反映了现实世界中空间实体之间的相互关系,是空间数据处理和空间数据挖掘的核心问题。文章论述了空问数据模型的表示形式,重点讨论了基于栅格的三维空间数据模型,指出了栅格矢量空问数据模型集成化的必要性以及集成化表示方法,给出了将矢量数据转换为栅格数据的欧氏距离变换与算法,为基于栅格空间数据的空间数据处理和空间数据挖掘奠定了基础。  相似文献   

15.
ER(■)把成员形式化为论域上的概念,成员之间的关系由概念的抽象程度所确定,层是成员的集合,层之间的关系由层中的成员所决定,成员之间的半序关系和层之间的半序关系统一用OEM图表示,采用路径表达式作为查询语言,从而把维抽象为一个半结构化对象,可以作为关系模型中的域.ER(■)给出了一组完整性规则.扩充了关系模型和关系代数,使得能用关系对象模型表示多维数据.ER(■)可以方便地在主流的关系对象数据库上实现,并可以用于XML环境.  相似文献   

16.
基于关系数据库的对象数据管理方法研究   总被引:3,自引:0,他引:3  
面向对象方法在许多领域中已经得到了广泛应用 .对象描述方法可以很方便地描述领域中具有复杂结构的数据 ,但这些复杂数据的存储问题还有待妥善解决 .在数据存储管理方面 ,关系数据库系统一直处于主导地位 .本文提出了一种将对象模型和关系模型有机结合在一起的方法 .该方法将数据存储功能从领域数据对象中分离出来 ,采用专门的对象管理器来处理复杂的对象数据与关系数据库的交互问题 .该方法已经被用于海洋传播模型数据库管理系统的设计开发中 ,并取得较好的效果  相似文献   

17.
一个柔性的信息系统要求它的业务模型是可变的,满足企业业务需求多变性。然而,业务模型是以数据模型为支撑的,这就要求数据模型也是可变的、可扩展的。出于这个目的,讨论了普遍的数据建模方法中存在的问题,并提出一种改进的数据模型,称之为原子数据模型。  相似文献   

18.
数据模型及其发展历程   总被引:1,自引:0,他引:1  
数据库是数据管理的技术,是计算机学科的重要分支.经过近半个世纪的发展,数据库技术形成了坚实的理论基础、成熟的商业产品和广泛的应用领域.数据模型描述了数据库中数据的存储方式和操作方式.从数据组织形式,可以将数据模型分为结构化模型、半结构化模型、OLAP分析模型和大数据模型.20世纪60年代中后期到90年代初,结构化模型最早被提出,其主要包括层次模型、网状模型、关系模型和面向对象模型等.20世纪90年代末期,随着互联网应用和科学计算等复杂应用的快速发展,开始出现半结构化模型,包括XML模型、JSON模型和图模型等.21世纪,随着电子商务、商业智能等应用的不断发展,数据分析模型成为研究热点,主要包括关系型ROLAP和多维型MOLAP.2010年以来,随着大数据工业应用的快速发展,以NoSQL和NewSQL数据库系统为代表的大数据模型成为新的研究热点.对上述数据模型进行了综述,并选取每个模型的典型数据库系统进行了性能的分析.  相似文献   

19.
视频语义模型及评价准则   总被引:2,自引:0,他引:2  
视频语义模型的目的是表示和管理视频中包含的对象、事件及关系等语义信息,并提供实现语义查询的基础.随着视频技术及与视频相关的应用的发展,对有效的视频语义模型的要求越来越迫切.文章对现有的视频语义模型进行了全面的综述,共包含16种视频语义模型:5种基于标注的模型和11种丰富语义模型.尽管视频语义模型对视频数据库提供查询服务和其它特性来说是至关重要的,但目前仍没有较好的评价视频语义模型的准则.因此,作者提出了针对丰富语义模型的评价准则共22条,并根据这些准则对11种丰富语义模型进行了评价.评价的结果表明这些模型可以满足用户的基本查询要求,但在高级能力方面(如表达能力方面的不确定性和对象历史等,查询能力方面的推理、查询条件重写等)还有所欠缺.而在表示与领域相关的约束以及为语义信息获取提供辅助功能等方面,目前的模型基本上还没有考虑.根据这些评价结果,文章最后建议了视频语义模型未来的研究方向.  相似文献   

20.
In recent years various proposals have been offered for increasing the richness of the relational data model by addressing specific user requirements, particularly with regard to structural and behavioral expressiveness. Although there have been some criticisms of the semantic limitations of the model, few proposals have emerged to address them. In this paper we propose an extension of the model to address some of the semantic limitations around the use of multi-face attributes in everyday activity. We present a formal discussion of multi-face attributes and suggest how they can be accommodated in the relational model and relational database software systems. The resulting model offers a higher-level expressiveness and will provide the user with increased flexibility in the input, output and storage of data, and the specification of queries. Finally we outline some of the implications for database design methods that emerge for the extension.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号