首页 | 官方网站   微博 | 高级检索  
     

汉语概念复合块的自动分析
引用本文:仵永栩,吕学强,周 强,关晓炟.汉语概念复合块的自动分析[J].中文信息学报,2016,30(2):1-11.
作者姓名:仵永栩  吕学强  周 强  关晓炟
作者单位:1. 北京信息科技大学 网络文化与数字传播北京市重点实验室,北京 100101;
2. 清华信息科学与技术国家实验室(筹),清华大学信息技术研究院语音与语言技术中心, 北京 100084
基金项目:国家重点基础研究发展计划资助项目(2013CB329304);国家自然科学基金(61373075,61271304);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037); 北京市优秀人才培养资助青年骨干项目(2014000020124G099)
摘    要:为解决句法分析任务中的块边界识别和块内结构分析问题,该文基于概念复合块描述体系进行了块分析探索。通过概念复合块与以往的基本块和功能块描述体系的对比分析,深入挖掘了概念复合块自动分析的主要难点所在,提出了一种基于“移进-归约”模型的汉语概念复合块自动分析方法。在从清华句法树库TCT中自动提取的概念复合块标注库上,多层次、多角度对概念复合块自动分析性能进行了纵向与横向评估,初步实验结果证明了该分析方法对简单概念复合块分析的有效性,为后续进行更复杂的概念复合块的句法语义分析研究打下了很好的基础。

关 键 词:句法分析  块识别  概念复合块  移进-归约分析  

Automatic Parsing of Chinese Concept Compound Chunk
WU Yongxu,LV Xueqiang,ZHOU Qiang,GUAN Xiaoda.Automatic Parsing of Chinese Concept Compound Chunk[J].Journal of Chinese Information Processing,2016,30(2):1-11.
Authors:WU Yongxu  LV Xueqiang  ZHOU Qiang  GUAN Xiaoda
Affiliation:1. Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,
Beijing Information Science and Technology University, Beijing 100101, China;
(2. Tsinghua National Laboratory for Information Science and Technology(TNList), Center for Speech and
Language Technologies, Research Institute of Information Technology, Tsinghua University, Beijing 100084, China)
Abstract:In order to solve the problems of chunk boundary identification and intra-chunk structure analysis, this paper explores a new chunk parsing task based on the Chinese concept compound chunk (CCC) scheme. After making detailed comparisons with previous base chunk and functional chunk schemes, the main parsing difficulties for CCC chunking are revealed. Therefore, the paper proposes a CCC parsing method based on the “shift-reduce” model. The experiments on the CCC bank automatically extracted from Tsinghua Chinese Treebank (TCT) show the feasibility of the method for parsing some simple CCCs, which facilitates further syntactic and semantic parsing on complex CCCs.
Keywords:syntactic parsing  chunk recognition  concept compound chunk  shift-reduce parsing  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号