首页 | 官方网站   微博 | 高级检索  
     

基于矩阵约束法的中文分词研究
引用本文:张素智,刘放美.基于矩阵约束法的中文分词研究[J].计算机工程,2007,33(15):98-100.
作者姓名:张素智  刘放美
作者单位:郑州轻工业学院计算机与通信工程学院,郑州,450002
基金项目:国家高技术研究发展计划(863计划)
摘    要:分词识别和歧义消除是影响信息检索系统准确度的重要因素,该文提出了一种基于语法和语义的使用约束矩阵的中文分词算法。该算法建立在语法和句法的基础上,从语境角度分析歧义字段,提高分词准确率。系统可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,并得到一个词典。再用《现代汉语语法信息词典》进行处理,实验结果显示分词准确率能提高10%左右。

关 键 词:中文分词  矩阵约束  歧义消除  分词系统
文章编号:1000-3428(2007)15-0098-03
修稿时间:2006-09-10

Research on Chinese Word Segmentation Based on Matrix Restraint
ZHANG Su-zhi,LIU Fang-mei.Research on Chinese Word Segmentation Based on Matrix Restraint[J].Computer Engineering,2007,33(15):98-100.
Authors:ZHANG Su-zhi  LIU Fang-mei
Affiliation:College of Computer and Communications Engineering, Zhengzhou University of Light Industry, Zhengzhou 450002
Abstract:Words segmentation recognition and ambiguity resolving are vital factors for information retrieval precision.This paper presents aChinese word segmentation algorithm with restraint matrix based on the grammar and the semantic.The algorithm improves the accuracy of word segmentation,by combining morphology and syntax with language situation.Continuous character bunch input can be segmented,and then the cut apart word bunch output can be obtained,and one dictionary can be obtained.Then "modern Chinese grammar information dictionary" is used to carry on the processing.Experimental result show the segment accurate rate can enhance about 10%.
Keywords:Chinese word  matrix restraint  disambiguation word  segmentation system
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号