首页 | 官方网站   微博 | 高级检索  
     

泛化类型的机读词典属性信息抽取
引用本文:王随涛,陆汝占.泛化类型的机读词典属性信息抽取[J].计算机应用与软件,2011,28(4).
作者姓名:王随涛  陆汝占
作者单位:上海交通大学计算机科学与工程系,上海,200240
基金项目:国家自然科学基金项目(60873135)
摘    要:为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇的属性值信息。在模式实例集的处理中引入了同义词扩展和词汇语义相似度计算以提高模式实例的覆盖率。实验中针对《现代汉语规范词典》中的电子领域词汇进行抽取,取得了较好的效果。

关 键 词:信息抽取  模式实例  相似度  泛化类型  

ACQUISITION OF ATTRIBUTE INFORMATION OF MACHINE-READABLE DICTIONARY IN GENERIC TYPE
Wang Suitao,Lu Ruzhan.ACQUISITION OF ATTRIBUTE INFORMATION OF MACHINE-READABLE DICTIONARY IN GENERIC TYPE[J].Computer Applications and Software,2011,28(4).
Authors:Wang Suitao  Lu Ruzhan
Affiliation:Wang Suitao Lu Ruzhan(Department of Computer Science and Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:This paper presents a method to acquire the attribute value information of conceptual instances from machine-readable dictionary in light to generic attribute types in order to build the network of entity-relationships and to improve and perfect the conceptual-based information retrieval.First,the method generates preliminary entity-attribute value pair sets by means of manual marking and selecting and acquires rough pattern instances set.Secondly,the method obtains several groups of pattern instances by cl...
Keywords:Information extraction Pattern instance Similarity Generic types  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号