基于词典特征优化和依存关系的中文时间表达式识别 |
| |
引用本文: | 高源,席耀一,李弼程,李苏奕.基于词典特征优化和依存关系的中文时间表达式识别[J].信息工程大学学报,2016,17(4):490-495. |
| |
作者姓名: | 高源 席耀一 李弼程 李苏奕 |
| |
作者单位: | 信息工程大学;解放军电视宣传中心 |
| |
基金项目: | 国家社会科学基金资助项目(14BXW028) |
| |
摘 要: | 提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识别方法忽视时间表达式本身结构特点的问题,在优化后的词典特征的基础上提取依存特征,挖掘时间表达式的结构信息;最后综合时间表达式的基本特征、词典特征和依存特征,在条件随机场模型上完成时间表达式识别。在中文语料上进行实验,时间表达式识别达到较好效果。
|
关 键 词: | 时间表达式 时间表达式识别 时间词典 条件随机场 依存句法分析 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《信息工程大学学报》浏览原始摘要信息 |
|
点击此处可从《信息工程大学学报》下载全文 |
|