首页 | 官方网站   微博 | 高级检索  
     

基于树核函数的“it”待消解项识别研究
引用本文:陈九昌,孔芳,朱巧明,周国栋.基于树核函数的“it”待消解项识别研究[J].中文信息学报,2010,24(5):24-31.
作者姓名:陈九昌  孔芳  朱巧明  周国栋
作者单位:1.苏州大学 计算机科学与技术学院,江苏 苏州 215006;
2.江苏省计算机信息处理技术重点实验室,江苏 苏州 215006
基金项目:国家自然科学基金资助项目,高等学校博士学科点专项科研基金资助项目,江苏省高校自然科学重大基础研究项目,江苏省高校自然科学基础研究项目,苏州市软件专项资助项目 
摘    要:该文在基于特征的英文代词指代消解平台上,使用复合核函数,研究指代消解中待消解项“it”的识别问题。围绕“it”是否是待消解项,该文采取有效策略获得“it”句法结构信息与平面特征信息,并将它们结合起来生成“it”待消解项分类器。在测试分类器性能的同时,将其运用到代词指代消解中以检验它对指代消解的作用。最后在ACE2003基准语料上实验表明采用复合核生成的分类器具有较高的准确率,并能显著提高代词指代消解性能。

关 键 词:待消解项识别  复合核  指代消解  

Detection of Referential It in Coreference Resolution Based on Tree Kernel
CHEN Jiuchang,KONG Fang,ZHU Qiaoming,ZHOU Guodong.Detection of Referential It in Coreference Resolution Based on Tree Kernel[J].Journal of Chinese Information Processing,2010,24(5):24-31.
Authors:CHEN Jiuchang  KONG Fang  ZHU Qiaoming  ZHOU Guodong
Affiliation:1. School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006,China;
2. Jiangsu Provincial Key Laboratory of Computer Information Processing Technology, Suzhou, Jiangsu 215006,China
Abstract:This paper presents an automatic approach using Composite Kernel of SVM to determining whether “it” in text refers to a preceding noun phrase or is instead non-referential in the platform of feature-based English pronoun coreference resolution. We extract structure information and plane feature information about "it" in order to construct an anaphoricity filter. We examine the performance of the filter by introducing it into the pronoun coreference resolution task. Evaluation on the ACE2003 benchmark corpus shows that the filter achieves the highest performance by using Composite Kernel and the pronoun coreference resolution is improved by employing the filter.
Key wordsanaphoricity determination; composite kernel; coreference resolution
Keywords:anaphoricity determination  composite kernel  coreference resolution  
本文献已被 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号