首页 | 官方网站   微博 | 高级检索  
     

改进的HMM应用于哈萨克语词性标注
引用本文:侯呈风,古丽拉·阿东别克.改进的HMM应用于哈萨克语词性标注[J].计算机工程与应用,2010,46(36):147-149.
作者姓名:侯呈风  古丽拉·阿东别克
作者单位:新疆大学,信息科学与工程学院,乌鲁木齐,830046
基金项目:国家自然科学基金,国家教育部、国家语委民族语盲文字规范标准建设及信息化科研项目
摘    要:哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础。在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑以及未登录词的处理方法,使之更好地体现词语的上下文依赖关系。利用基于统计的方法对哈萨克语熟语料进行训练,然后用Viterbi算法实现词性标注。实验结果表明利用改进的HMM进行词性标注的效果比传统的HMM好。

关 键 词:隐马尔科夫模型  哈萨克语  词性标注
收稿时间:2010-7-21
修稿时间:2010-9-10  

Improved hidden Markov models used in Kazakh part-of-speech tagging
HOU Cheng-feng,Gulila·Altenbek.Improved hidden Markov models used in Kazakh part-of-speech tagging[J].Computer Engineering and Applications,2010,46(36):147-149.
Authors:HOU Cheng-feng  Gulila·Altenbek
Affiliation:HOU Cheng-feng,Gulila·Altenbek (College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China )
Abstract:Part-of-Speech(POS) tagging of Kazakh is playing a key role in natural language information processing.Kazakh POS tagging is the basis of syntactic analysisi,nformation retrieval and machine translation.Based upon the traditional HMM,computing of HMM parameters,data-smoothing and process of words which are not logged enable to improve context depen-dence relationship.Use statistical method to train Kazakh corpus,and then use Viterbi algorithm to implement POS tagging.The experimental results show that the effect of POS tagging of improved HMM is better than traditional HMM.
Keywords:Hidden Markov Models(HMM)  Kazakh  part-of-speech tagging
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号