首页 | 官方网站   微博 | 高级检索  
     

基于最大熵方法进行动词搭配的自动标注
引用本文:白妙青,郑家恒.基于最大熵方法进行动词搭配的自动标注[J].计算机工程与应用,2009,45(3):135-137.
作者姓名:白妙青  郑家恒
作者单位:1.山西大学 计算中心,太原 030006 2.山西大学 计算机系,太原 030006
摘    要:搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。通过对已标注真实文本的分析,构造了动词搭配对的上下文变量信息特征模板,给出利用最大熵方法抽取动词—动词搭配,对待测的1 000句汉语句子应用最大熵方法自动识别出搭配,其中封闭测试抽取正确率为85.6%,召回率达到70.6%。

关 键 词:语料  搭配  特征选择  最大熵
收稿时间:2008-7-9
修稿时间:2008-11-3  

Autolabeling of Chinese verb-verb collocation based on maximum entropy principle
BAI Miao-qing,ZHENG Jia-heng.Autolabeling of Chinese verb-verb collocation based on maximum entropy principle[J].Computer Engineering and Applications,2009,45(3):135-137.
Authors:BAI Miao-qing  ZHENG Jia-heng
Affiliation:1.Computer Center,Shanxi University,Taiyuan 030006,China 2.Department of Computer,Shanxi University,Taiyuan 030006,China
Abstract:Collocation plays an important role in parsing and verb is the kernel and precondition for Chinese parsing.This paper presents a method for verb—verb collocation based on maximum entropy principle,using the constructed characteristic modeling for context variable information via analyzing the real text labeled.By testing of 1 000 sentences with the maximum entropy principle,it has obtained 85.6% accuracy and 70.6% recall ratio.
Keywords:corpus  collocation  feature selection  maximum entropy
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号