首页 | 官方网站   微博 | 高级检索  
     

基于篇章修辞结构的自动文摘连贯性研究
引用本文:刘凯,王红玲.基于篇章修辞结构的自动文摘连贯性研究[J].中文信息学报,2019,33(1):77-84.
作者姓名:刘凯  王红玲
作者单位:苏州大学 计算机科学与技术学院,江苏 苏州 215006
基金项目:国家自然科学基金(61402314)
摘    要:尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息应用于中文自动文摘。首先,基于汉语篇章修辞结构抽取摘要,然后使用基于LSTM的方法对文本连贯性进行建模,并使用该模型对文摘的连贯性做出评价。实验结果表明: 在摘要抽取方面,基于篇章修辞结构的自动文摘相比于传统的抽取方法具有更好的ROUGE评价值;在使用基于LSTM连贯性模型评价摘要连贯性方面,篇章结构信息在自动抽取文摘时可以很好地提炼出文章的主旨,同时使摘要具有更好的结果。

关 键 词:篇章修辞结构  中文自动文摘  连贯性  可读性  实体网格模型  LSTM  

Research on Automatic Summarization Coherence Based on Discourse Rhetoric Structure
LIU Kai,WANG Hongling.Research on Automatic Summarization Coherence Based on Discourse Rhetoric Structure[J].Journal of Chinese Information Processing,2019,33(1):77-84.
Authors:LIU Kai  WANG Hongling
Affiliation:School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006, China
Abstract:In order to improve the readability of automatic summaries, this article attempts to apply the discourse rhetorical structure information to Chinese automatic summarization. First, abstracts are extracted based on the rhetorical structure of Chinese texts. Then the LSTM-based methods are adopted to evaluate the coherence of the abstracts. The experimental results show that, automatic abstraction based on discourse rhetorical structure has better ROUGE value than traditional methods. The coherence evaluation results show that the discourse structure information can help the system extract the subject of the article automatically.
Keywords:discourse rhetoric structure  Chinese automatic summarization  coherence  readability  entity-grid model  LSTM  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号