首页 | 官方网站   微博 | 高级检索  
     

基于混合表示的中文事件检测方法研究
引用本文:秦彦霞,王中卿,郑德权,张民.基于混合表示的中文事件检测方法研究[J].中文信息学报,2019,33(4):85-92.
作者姓名:秦彦霞  王中卿  郑德权  张民
作者单位:1.哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001;
2.苏州大学 计算机科学与技术学院,江苏 苏州 215006
基金项目:国家自然科学基金(61572154);国家重点研发计划(2017YFB1002102)
摘    要:传统中文事件检测方法采用人工定义的特征表示候选触发词,耗时耗力。基于神经网络的特征学习方法在中英文事件检测任务中得到了验证。现有的基于神经网络的中文事件检测方法初步探索了字信息对解决分词错误的作用。字是中文的最小结构单元和语义表示单元。词语的字符级信息能够提供词语的结构性信息和辅助词语级语义。该文研究了字/词混合神经网络特征对于解决中文事件数据集未登录词问题的作用。采用神经网络模型分别学习词语的词语级表示和字符级表示,进而拼接得到词语的混合表示。实验结果表明,基于字/词混合表示的中文神经网络事件检测模型的F1值比当前最好的模型高2.5%。

关 键 词:中文  事件检测  神经网络  混合表示  

Hybrid Representation Based Chinese Event Detection
QIN Yanxia,WANG zhongqing,ZHENG Dequan,ZHANG Min.Hybrid Representation Based Chinese Event Detection[J].Journal of Chinese Information Processing,2019,33(4):85-92.
Authors:QIN Yanxia  WANG zhongqing  ZHENG Dequan  ZHANG Min
Affiliation:1.School of Computer Science and Technology, Harbin Institute of Technology, Harbin, Heilongjiang 150001, China;
2.School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006, China
Abstract:Neural network based feature learning methods had been proven to be effective in Chinese/English event detection task. This paper further explores character-word-level neural features on solving out-of-vocabulary phenomenon in Chinese event detection. Two neural network models are applied to learn word-level representation and character-level representation, respectively. Hybrid representation for each word is obtained by concatenating word-level and character-level representation. Experimental results show that the proposed hybrid representation-based neural Chinese event detection model outperforms state-of-the-art results by 2.5% on F1.
Keywords:Chinese  event detection  neural network  hybrid representation  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号