基于Transformer和重要词识别的句子融合方法 |
| |
引用本文: | 谭红叶,李飞艳.基于Transformer和重要词识别的句子融合方法[J].计算机应用与软件,2023(7):145-150. |
| |
作者姓名: | 谭红叶 李飞艳 |
| |
作者单位: | 1. 山西大学计算机与信息技术学院;2. 山西大学计算智能与中文信息处理教育部重点实验室 |
| |
基金项目: | 国家重点研发计划重点专项项目课题(2018YFB1005103);;国家自然科学基金项目(61673248); |
| |
摘 要: | 句子融合是为多个句子生成言简意赅、符合语法的句子,可应用到自动摘要、复述生成等自然语言处理任务。目前句子融合方法已取得一定成效,但还存在重要信息缺失、语义偏离原句等问题。该文提出基于Transformer和重要词识别的方法来缓解上述问题。该方法包括两个模块,(1)重要词识别模块:利用序列标注模型识别原句重要词;(2)句子融合模块:将重要词与原句输入到Transformer框架并利用BERT进行语义表示,然后在全连接层引入基于原句和词表获得的向量作为先验知识进行句子融合。基于NLPCC2017摘要任务集构建句子融合数据集,并进行相关实验,结果表明所提方法的性能明显优于基线系统。
|
关 键 词: | 句子融合 重要词 Transformer 文本生成 |
|