首页 | 官方网站   微博 | 高级检索  
     

由粗到精的哈萨克语短语结构句法分析研究
引用本文:梁金莲,古丽拉·阿东别克.由粗到精的哈萨克语短语结构句法分析研究[J].中文信息学报,2018,32(1):83-88.
作者姓名:梁金莲  古丽拉·阿东别克
作者单位:1.新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046;2.新疆多语种信息技术实验室,新疆大学,新疆 乌鲁木齐 830046;3.国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地,新疆大学,新疆 乌鲁木齐 830046
基金项目:国家自然科学基金(61363062);其他项目(NMLR201601)
摘    要:该文针对哈萨克语短语结构句法分两个阶段采用由粗到精的方法进行哈萨克语句法分析研究。第一阶段使用粗略的句法分析器生成20个最佳候选树;第二阶段采用感知机的方法训练,提取特征信息,并对第一阶段生成的20个最佳候选树进行重排序,最终解析结果是第一阶段产生的候选树的结果和重排序结果按照比例选取。该方法在两个阶段不仅可以获取到句子的结构信息,还可以提取到详细的特征信息,可以最大限度地对句子进行解析,获得了较好的句子解析结果,其句法分析正确率为71.4%。

关 键 词:句法分析  PCFG  重排序  

A Coarse-to-Fine Kazakh PSG Parser
LIANG Jinlian,Gulila Altenbek.A Coarse-to-Fine Kazakh PSG Parser[J].Journal of Chinese Information Processing,2018,32(1):83-88.
Authors:LIANG Jinlian  Gulila Altenbek
Affiliation:1. College of Information Science and Engineering, Xinjiang University, Urumqi, Xinjiang 830046, China; 2. Xinjiang Laboratory of Multi-Language Information Technology, Xinjiang University, Urumqi, Xinjiang 830046, China; 3. The Base of Kazakh and Kirghiz Language of National Language Resource Monitoring and Research Center on Minority Languages, Xinjiang University, Urumqi, Xinjiang 830046, China
Abstract:A coarse-to-fine strategy is applied for the two-stage syntactic analysis of the Kazakh phrase structure. The first stage generates 20-best parses with a rough parser. The second stage employs the perceptron method to re-rank them for the best result with the extracted features. This method can not only obtain the sentence structural through the two stages, but also provide the detailed feature information for better analysis of the result. Experiments indicate an accuracy 71.4% of this parser.
Keywords:syntactic analysis  PCFG  reranking  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号