首页 | 官方网站   微博 | 高级检索  
     

汉语自动分词中的歧义处理
引用本文:张辉丽,孟昭鹏,王慧芝.汉语自动分词中的歧义处理[J].微计算机应用,2006,27(6):685-688.
作者姓名:张辉丽  孟昭鹏  王慧芝
作者单位:天津大学计算机科学与技术系,天津,300072
摘    要:歧义处理是影响分词系统切分精度的重要因素,是自动分词系统设计中的一个核心问题。本文介绍了一种新的分词算法,利用汉语句内相邻字之间的互信息及t-信息差这两个统计量,解决汉语自动分词中的歧义字段的切分问题。试验结果表明,该方法可以有效地提高歧义处理的正确率。

关 键 词:分词  互信息t-信息差  歧义字段
收稿时间:2005-04-28
修稿时间:2005-04-282005-06-16

Ambiguity Processing in Chinese Word Segmentation
ZHANG Huili,MENG Zhaopeng,WANG Huizhi.Ambiguity Processing in Chinese Word Segmentation[J].Microcomputer Applications,2006,27(6):685-688.
Authors:ZHANG Huili  MENG Zhaopeng  WANG Huizhi
Affiliation:The Computer Science Department Tianjin University,Tianjin,300072, China
Abstract:Ambiguity processing is an important factor to determine the precise of a word segmenting system, and a most essential problem of automated word segmenting system. This paper presents a new method for word segmentation. This method resolves ambiguity word segmentation in Chinese using the two statistical measures, interact information and difference of t-information of adjacent characters. Tests have shown that this method can effectively improve the correctness of ambiguity processing.
Keywords:word segmentation  interact information  difference of t-information  ambiguity word
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号