首页 | 官方网站   微博 | 高级检索  
     

基于Ontology的信息抽取
引用本文:廖乐健,曹元大,李新颖.基于Ontology的信息抽取[J].计算机工程与应用,2002,38(23):110-113.
作者姓名:廖乐健  曹元大  李新颖
作者单位:北京理工大学计算机科学工程系人工智能研究所,北京100081
摘    要:为了提高Internet上的信息搜索效率,基于内容的搜索引擎成为迫切的用户需求。但内容信息的手工获取是一项繁重的工作。从文本或半结构化文档中自动地抽取用户关心的内容信息且表示成计算机能理解的形式是一项极具实用价值的挑战性研究。该文从知识表示与推理的角度研究了提高信息抽取智能性的途径,提出了将Ontology与模板规则相结合的技术,并针对线性模板表示的局限提出了基于二侧树结构的模板规则表示,同时实现了此表示下的假设生成———冲突消解推理。该技术成功地应用于招聘广告的信息抽取。

关 键 词:信息抽取  Ontology  模板规则
文章编号:1002-8331-(2002)23-0110-04
修稿时间:2002年8月1日

Ontology-based Information Extraction
Abstract:To make information searching across Internet more efficient ,content-based search engine become s more and more efficient.However,the manual marking-up of content information is a laboring work.Automatic extraction of content information from text or semi -structured documents is a demanding and challenging technology.This paper aims at enhancing the intelligence of information extraction systems with improved knowledge representation techniques.It proposes to combine the Ontology representation with pattern rules,and to use bi -side tree as the structure of composing a pattern from pattern elements in replace of traditional sequential structure.In such representation,an information -extraction engine based on hypothesis -generation&conflict -resolution procedure is implemented.The proposed technique is successfully applied to information extraction system for job-recruitment advertisements.
Keywords:Information extraction  Ontology  Pattern rules  
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号