首页 | 官方网站   微博 | 高级检索  
     

中文分词与词性标注研究
引用本文:梁喜涛,顾磊.中文分词与词性标注研究[J].计算机技术与发展,2015(2).
作者姓名:梁喜涛  顾磊
作者单位:南京邮电大学 计算机学院,江苏 南京,210023
基金项目:国家自然科学基金资助项目,教育部人文社会科学研究青年基金,江苏省教育高校哲学社会科学基金,江苏省社科研究文化精品课题
摘    要:分词和词性标注是中文语言处理的重要技术,广泛应用于语义理解、机器翻译、信息检索等领域。在搜集整理当前分词和词性标注研究与应用成果的基础上,对中文分词和词性标注的基本方法进行了分类和探讨。首先在分词方面,对基于词典的和基于统计的方法进行了详细介绍,并且列了三届分词竞赛的结果;其次在词性标注方面,分别对基于规则的方法和基于统计的方法进行了阐述;接下来介绍了中文分词和词性标注一体化模型相关方法。此外还分析了各种分词和词性标注方法的优点和不足,在此基础上,为中文分词和词性标注的进一步发展提供了建议。

关 键 词:中文分词  主动学习  词性标注  自然语言处理  一体化模型

Study on Word Segmentation and Part-of-speech Tagging
LIANG Xi-tao,GU Lei.Study on Word Segmentation and Part-of-speech Tagging[J].Computer Technology and Development,2015(2).
Authors:LIANG Xi-tao  GU Lei
Abstract:
Keywords:Chinese word segmentation  active learning  POS tagging  CLP  joint model
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号