首页 | 官方网站   微博 | 高级检索  
     

一种基于TextRank的单文本关键字提取算法
引用本文:柳林青,余瀚,费宁,陈春玲.一种基于TextRank的单文本关键字提取算法[J].计算机应用研究,2018,35(3).
作者姓名:柳林青  余瀚  费宁  陈春玲
作者单位:南京邮电大学 计算机学院,南京邮电大学 计算机学院,南京邮电大学 计算机学院,南京邮电大学 计算机学院
基金项目:国家自然科学基金(11501302)
摘    要:作为一种经典的文本关键字提取和自动生成算法,TextRank将文本看作若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结合,提出节点间边权为条件概率的新模型生成算法TextRank_Revised。通过对有标记和无标记的验证集进行验证,证明新的算法在不提升时间复杂度的前提下,通过计算单文本得出的单词排序结果相较于原TextRank算法更加吻合人工对文档的关键字提取结果。

关 键 词:TextRank  单文本关键字  提取算法  有向带权图  马尔可夫状态转移模型
收稿时间:2016/11/28 0:00:00
修稿时间:2018/1/17 0:00:00

Key-word extracting algorithm from single text based on TextRank
LIU Ling-qing,YU han,FEI ning and CHEN Chun-ling.Key-word extracting algorithm from single text based on TextRank[J].Application Research of Computers,2018,35(3).
Authors:LIU Ling-qing  YU han  FEI ning and CHEN Chun-ling
Abstract:As a classical key-word extracting and abstraction auto-generating algorithm, TextRank considers the text as a group of terms, and seeks a latent semantic relationship between terms according to iteratively calculating the weights of the terms in the nodes graph. Based on the nodes graph model of TextRank, combine node graph and Markov state transform model, weight the edge between nodes with conditional probability, propose a new nodes graph model and corresponding algorithm TextRank_Revised. According to test signed and unsigned samples, it shows that without promotion of time complexity, the new algorithm can get a key-word sorting consequence which is closer to the manual than the original algorithm from the single text.
Keywords:TextRank  Keywordof single text  extracting algorithm  weighted directed graph  Markov state transform model
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号