首页 | 官方网站   微博 | 高级检索  
     

一种基于WWW的Ontology属性值自动提取方法
引用本文:赵庆亮,穗志方.一种基于WWW的Ontology属性值自动提取方法[J].中文信息学报,2008,22(6):69-74.
作者姓名:赵庆亮  穗志方
作者单位:北京大学 计算语言学研究所,北京 100871
基金项目:国家自然科学基金,国家自然科学基金
摘    要:属性值是描述Ontology中类的重要信息,但是当前关于属性值的自动提取的研究并不多。该文提出一种基于WWW的Ontology属性值自动提取方法。论文首先提出了一种在小规模属性值种子集的基础上,包含属性值的句子的选择与属性值提取互动的方法。这种方法利用互联网信息的冗余性,自动抽取并扩充目标属性值集合。然后,为避免人工构造属性值种子集,提出种子集自动生成的方法。我们设计实验来计算提取结果的正确率和召回率,此外,我们还通过将填充后的Ontology信息用于网页正文提取任务来展示Ontology自动扩充结果的有效性。

关 键 词:计算机应用  中文信息处理  因特网  互动方法  属性值提取  

Automatic Extraction Of Ontology Attribute Value Based On WWW
ZHAO Qing-liang,SUI Zhi-fang.Automatic Extraction Of Ontology Attribute Value Based On WWW[J].Journal of Chinese Information Processing,2008,22(6):69-74.
Authors:ZHAO Qing-liang  SUI Zhi-fang
Affiliation:Institute of Computational Linguistics,Peking University, Beijing 100871, China
Abstract:Attributes value is among the most important information to describe Ontology.However,few researches have been done about attribute values extraction so far.This paper proposes a method of extracting Ontology attribute values automatically based on WWW.Firstly,an interactive method is described to unilize the interaction between the attribute-value-related sentence selection and the attribute values extraction.This method can expand the target attribute value set from a seed set by the redundancy of WWW.Secondly,we present a method to construct the seed automatically.Experiments are conducted to examine the method in terms of precision and recall.In addition,automatically enriched Ontology information is applied in webpage content extraction to test the usefulness of our approach.
Keywords:computer application  Chinese information processing  WWW  interactive method  attribute value extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号