一种基于参考规范的专业文本生成方法 |
| |
引用本文: | 胡宇,王舰,孙宇清.一种基于参考规范的专业文本生成方法[J].中文信息学报,2023(3):152-163. |
| |
作者姓名: | 胡宇 王舰 孙宇清 |
| |
作者单位: | 山东大学软件学院 |
| |
基金项目: | 国家重点研发计划(2018YFC0831401);;山东省自然科学基金(ZR2022LZH007,ZR2018ZB0420); |
| |
摘 要: | 参考规范是指专业知识点的相关文本描述,参考规范指导下的文本生成任务要求自动生成的文本满足与参考规范的语义相关性和知识点匹配性,是自然语言处理领域中的困难问题。相关工作主要控制生成文本的情感、态度等通用性质,无法满足专业层面的复杂控制需求。为此,该文提出了基于对抗架构的专业文本生成模型(PT-GAN),采用多个独立的生成器分别生成不同知识点匹配程度的文本,各生成器均为自编码器结构,其中编码器用于提取参考规范文本的知识点语义特征,解码器用于生成文本;采用两个判别器同时对生成文本的语言规范和专业知识进行指导,其中连贯性判别器用于指导语言规范,专业性判别器用于控制专业层面属性。在多个国家级专业考试真实数据集上进行实验,结果显示该文模型在语言连贯性、与参考规范的语义相关性和知识点匹配性上均有明显提升,更符合该场景下的文本生成需求。
|
关 键 词: | 文本生成 生成式对抗网络 自编码器 专业文本 |
|
|