首页 | 官方网站   微博 | 高级检索  
     

基于矩阵分解和子模最大化的微博新闻摘要方法
引用本文:刘彼洋.基于矩阵分解和子模最大化的微博新闻摘要方法[J].计算机应用研究,2017,34(10).
作者姓名:刘彼洋
作者单位:武汉大学计算机学院
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目);国家社科基金重大招标计划项目
摘    要:针对面向微博的中文新闻摘要的主要挑战,提出了一种将矩阵分解与子模最大化相结合的新闻自动摘要方法。该方法首先利用正交矩阵分解模型得到新闻文本潜语义向量,解决了短文本信息稀疏问题,并使投影方向近似正交以减少冗余;然后从相关性和多样性等方面评估新闻语句集合,该评估函数由多个单调子模函数和一个评估语句不相似度的非子模函数组成;最后设计贪心算法生成最终摘要。在NLPCC2015数据集面向上的实验结果表明本文提出的方法能有效提高面向微博的新闻自动摘要质量,ROUGE得分超过其他基线系统。

关 键 词:子模属性    正交矩阵分解    新闻摘要    抽取式摘要  微博
收稿时间:2016/7/12 0:00:00
修稿时间:2017/7/14 0:00:00

Weibo-oriented news summarization based on matrix factorization and submodular maximization
Affiliation:School of Computer, Wuhan University
Abstract:This paper presented a novel method for Weibo-Oriented Chinese new summarization which combined matrix factorization and submodular maximization. It used the Orthogonal Matrix Factorization(OrMF) model to solve the information sparsity issue of short texts and the information redundancy problem in the projection procedure, and obtained robust latent vectors for news sentences. Moreover, news sentences were evaluated for its relevance and diversity, the objective function included several submodular functions and a non-submodular function that evaluates sentence dissimilarities. Finally, a greedy algorithm was designed to select summary sentences. Experimental results on NLPCC2015 datasets show that the ROUGE scores of the proposed method outweigh other baseline systems and that the quality of Weibo-oriented news summaries is improved effectively.
Keywords:submodularity  orthogonal matrix factorization  news summarization  extractive summarization  Weibo-Oriented
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号