融入结构化信息的端到端中文指代消解 |
| |
引用本文: | 付健,孔芳. 融入结构化信息的端到端中文指代消解[J]. 计算机工程, 2020, 46(1): 45-51 |
| |
作者姓名: | 付健 孔芳 |
| |
作者单位: | 苏州大学 计算机科学与技术学院,江苏 苏州 251006;苏州大学 计算机科学与技术学院,江苏 苏州 251006 |
| |
基金项目: | 国家重点研发计划;国家自然科学基金 |
| |
摘 要: | 在LEE等人提出的端到端指代消解模型基础上,考虑中文行文特点,提出一种融合结构化信息的中文指代消解模型。压缩文档中所进行有句子对应的成分句法树并获取文档压缩树叶节点深度,采用成分句法树的结构化嵌入(SECT)方法将结构信息进行向量化处理,将词性、文档压缩树叶节点深度与SECT信息作为3个特征向量引入模型中进行中文指代消解。在CoNLL2012数据集中的测试结果表明,通过结合上述3个特征,可使该模型的中文指代消解性能得到有效提高,其平均F_1值可达62.33%,较基准模型提升5.28%。
|
关 键 词: | 端到端指代消解 结构化嵌入 词性 成分句法树 文档句法压缩树 |
End to End Chinese Coreference Resolution with Structural Information |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|