首页 | 官方网站   微博 | 高级检索  
     

基于元数据和XML的信息抽取与集成技术研究
引用本文:亓祥波,南琳,张福顺.基于元数据和XML的信息抽取与集成技术研究[J].信息与控制,2008,37(1):1-1.
作者姓名:亓祥波  南琳  张福顺
作者单位:1. 中国科学院沈阳自动化研究所,辽宁,沈阳,110016;中国科学院研究生院,北京,100049
2. 中国科学院沈阳自动化研究所,辽宁,沈阳,110016
摘    要:为了得到统一的数据形式以利于数据操作和处理,提出了采用基于元数据的模板定制技术以实现信息抽取的方法.该方法有效地实现对非结构化文本的信息提取,将抽取信息转换为统一的XML格式,然后将XML格式的信息集成到关系数据库中.本方法在某造船厂的企业信息化中得到成功应用,为解决企业的信息集成问题提供了一种面向Word文档的新方案.

关 键 词:元数据  模板  信息抽取  XML
文章编号:1002-0411(2008)01-0052-06
收稿时间:2007-01-22
修稿时间:2007年1月22日

Information Extraction and Integration Technology Based on Metadata and XML
QI Xiang-bo,NAN Lin,ZHANG Fu-shun.Information Extraction and Integration Technology Based on Metadata and XML[J].Information and Control,2008,37(1):1-1.
Authors:QI Xiang-bo  NAN Lin  ZHANG Fu-shun
Abstract:In order to unify data form and to facilitate data manipulation and processing, lifts paper presents on effective method which uses meladata-based template-enstonfizing technology to extract infiormation. The presented method can efficiently extract information from unstructured document and convert the extracted information into XML. which is then integrated into the relational database. The method has been successfully applied to the enterprise informatization system of a shipbuilding plant and provides a new Word-oriented solution for enterprise informatinn integration.
Keywords:metadata  template  information extraction  XMI  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《信息与控制》浏览原始摘要信息
点击此处可从《信息与控制》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号