首页 | 官方网站   微博 | 高级检索  
     

统计模型中附加语言学规则的蒙古语词法分析
引用本文:张聪品,赵理莉.统计模型中附加语言学规则的蒙古语词法分析[J].计算机工程与设计,2011,32(8):2861-2864.
作者姓名:张聪品  赵理莉
作者单位:1. 河南师范大学计算机与信息技术学院,河南新乡,453007
2. 河南师范大学计算机与信息技术学院,河南新乡453007;中国科学院计算技术研究所,北京100190
基金项目:河南省高等学校青年骨干教师计划基金项目,河南省基础与前沿技术研究计划基金项目,河南省科技攻关基金项目
摘    要:蒙古词法分析是蒙古语信息处理的基础性问题,是蒙古语信息处理工作的第一步。通过对统计模型和蒙古语构词规则进行深入研究,提出了一种融合统计和规则技术的蒙古语词切分和词性标注的方法。该方法以统计模型作为基本框架,采用树形结构描述系统的解空间,并加入了蒙古语语言学规则和词干、词缀词典。实验结果表明,该系统分词和词性标注的词级准确率为95.1%,词干/词缀级准确率为94.6%,较已有蒙古语词法分析系统的准确率有所提高。

关 键 词:蒙古语信息处理  蒙古语词法分析  蒙古语分词  蒙古语词性标注  联合切分和词性标注

Statistical model added linguistic rules for Mongolian lexical analysis
ZHANG Cong-pin,ZHAO Li-li.Statistical model added linguistic rules for Mongolian lexical analysis[J].Computer Engineering and Design,2011,32(8):2861-2864.
Authors:ZHANG Cong-pin  ZHAO Li-li
Affiliation:ZHANG Cong-pin1,ZHAO Li-li1,2(1.College of Computer and Information Technology,Henan Normal University,Xinxiang 453007,China,2.Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China)
Abstract:Mongolian lexical analysis is the first step in Mongolian information processing.Statistical model and Mongolian language rules are researched,a method of integrating statistics and rules technology is presented which can solve the Mongolian word segmentation and POS tagging at the same time.This method uses a statistical model as the basic framework to describe the system with tree structure the solution space,then added the Mongolian linguistic rules and the stem,affix dictionary.The results show that the...
Keywords:Mongolian information processing  Mongolian lexical analysis  Mongolian word segmentation  Mongolian part of speech tagging  joint segmentation and POS tagging  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号