首页 | 官方网站   微博 | 高级检索  
     

基于机器可读词典的词汇知识抽取
引用本文:樊玉俊,胡熠,陆汝占.基于机器可读词典的词汇知识抽取[J].计算机应用与软件,2008,25(6):8-10.
作者姓名:樊玉俊  胡熠  陆汝占
作者单位:上海交通大学计算机科学系,上海,200240
基金项目:本文得到国家自然科学基金重大项目"非规范知识的基本理论和核心技术"(60496326)的支持.
摘    要:越来越多的实践证明,词汇知识将是未来自然语言处理系统中不可或缺的组成部分。利用机器可读词典作为资源,首先通过对释义项进行分类,然后基于释义分析自动生成用于抽取词汇知识的模板,然后采用模板匹配的方法,实现词汇知识的自动抽取。通过一种基于最大熵模型的有监督的机器学习方法,对结果进行过滤。在应用到《应用汉语词典》中后,取得了良好的抽取效果。

关 键 词:词汇知识  机器可读词典  模板抽取  最大熵
修稿时间:2006年9月8日

LEXICAL KNOWLEDGE EXTRACTION BASED ON MACHINE READABLE DICTIONARY
Fan Yujun,Hu Yi,Lu Ruzhan.LEXICAL KNOWLEDGE EXTRACTION BASED ON MACHINE READABLE DICTIONARY[J].Computer Applications and Software,2008,25(6):8-10.
Authors:Fan Yujun  Hu Yi  Lu Ruzhan
Affiliation:Fan Yujun Hu Yi Lu Ruzhan(Department of Computer Science,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:It has been proved by more and more practices that lexical information will be an indispensable part for natural language processing system in the future.This article introduces a method to realize the automatic extraction for lexical knowledge with the machine readable dictionary as the resource.Firstly to divide the words into groups according to their definition,then to set automatically the patterns of extraction for lexical knowledge based on the definition analysis,at last to realize the extraction by...
Keywords:Lexical knowledge Machine readable dictionary Pattern extraction Maximum Entropy  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号