首页 | 官方网站   微博 | 高级检索  
     

基于核方法的中文实体关系抽取研究
引用本文:黄瑞红,孙乐,冯元勇,黄云平.基于核方法的中文实体关系抽取研究[J].中文信息学报,2008,22(5):102-108.
作者姓名:黄瑞红  孙乐  冯元勇  黄云平
作者单位:1. 中国科学院 软件研究所,北京100190;2.中国科学院 研究生院,北京100049
基金项目:国家自然科学基金,国家高技术研究发展计划(863计划)
摘    要:命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。

关 键 词:计算机应用  中文信息处理  中文实体关系抽取  核方法  卷积树核  复合核  最短路径依赖核  

A Study on Kernel-based Chinese Relation Extraction
HUANG Rui-hong,SUN Le,FENG Yuan-yong,HUANG Yun-ping.A Study on Kernel-based Chinese Relation Extraction[J].Journal of Chinese Information Processing,2008,22(5):102-108.
Authors:HUANG Rui-hong  SUN Le  FENG Yuan-yong  HUANG Yun-ping
Affiliation:1. Institute of Software, Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate University of Chinese Academy of Sciences, Beijing 100049, China
Abstract:Entity Relation Extraction is one of the important research fields in Information Extraction.This paper explores the effectiveness of two kernel-based methods,the convolution tree kernel and the shortest path dependency kernel,for Chinese relation extraction based on ACE 2007 corpus.For the convolution kernel,the influence by the different parse tree spans on the performance of relation extraction is studied.Then,experiments with composite kernels,which are a combination of the convolution kernel and feature-based kernels,are conducted to investigate the complementary effects between tree kernel and flat kernels.Finally,we improve the shortest path dependency kernel by replacing the strict same length requirement with finding the longest common subsequences between two shortest dependency paths.Experiments prove that kernel-based methods are effective for Chinese relation extraction as well.
Keywords:computer application  Chinese information processing  Chinese relation extraction  Kernel-based methods  convolution tree kernel  composite kernels  shortest path dependency kernel
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号