首页 | 官方网站   微博 | 高级检索  
     

一种基于图划分的无监督汉语指代消解算法
引用本文:周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82.
作者姓名:周俊生  黄书剑  陈家骏  曲维光
作者单位:1.南京大学 计算机科学与技术系,江苏 南京 210093;
2.南京师范大学 计算机科学系, 江苏 南京 210097)
基金项目:国家高技术研究发展计划(863计划);国家自然科学基金;江苏省自然科学基金
摘    要:指代消解是自然语言处理领域中的一个重要问题。针对当前中文指代标注训练语料非常缺乏的现状,本文提出一种无监督聚类算法实现对名词短语的指代消解。引入图对名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并引入一个有效的模块函数实现对图的自动划分,使得指代消解过程并不是孤立地对每一对名词短语分别进行共指决策,而是充分考虑了多个待消解项之间的相关性,并且避免了阈值选择问题。通过在ACE中文语料上的人称代词消解和名词短语消解实验结果表明,该算法是一种有效可行的无监督指代消解算法。

关 键 词:人工智能  自然语言处理  聚类  指代消解  模块函数  
文章编号:1003-0077(2007)02-0077-06
收稿时间:2006-07-18
修稿时间:2006-12-21

A New Graph Clustering Algorithm for Chinese Noun Phrase Coreference Resolution
ZHOU Jun-sheng,HUANG Shu-jian,CHEN Jia-jun,QU Wei-guang.A New Graph Clustering Algorithm for Chinese Noun Phrase Coreference Resolution[J].Journal of Chinese Information Processing,2007,21(2):77-82.
Authors:ZHOU Jun-sheng  HUANG Shu-jian  CHEN Jia-jun  QU Wei-guang
Affiliation:1. Department of Computer Science and Technology,Nanjing University,Nanjing,Jiangsu 210093, China;
2. Deptartment of Computer Science, Nanjing Normal University , Nanjing, Jiangsu 210097, China
Abstract:Coreference resolution plays an important role in natural language processing. Facing the fact that the Chinese training corpus for coreference resolution is heavily lacking, this paper presents a new unsupervised clustering algorithm for noun phrase coreference resolution. In this approach, the problem of coreference resolution is firstly converted as a graph clustering problem, and then an objective function called the modularity function, which allows automatic selection of the number of clusters, is selected for graph clustering. The proposed algorithm does not make pairwise coreference decisions independently of each other. The experimental results on the Chinese ACE training corpus demonstrate that the proposed method is a feasible unsupervised algorithm for noun phrase coreference resolution.
Keywords:artificial intelligence  natural language processing  clustering  coreference resolution  modularity function
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号