首页 | 官方网站   微博 | 高级检索  
     

改进的关键词提取算法研究
引用本文:王涛,李明.改进的关键词提取算法研究[J].重庆师范大学学报(自然科学版),2019,36(3):94-104.
作者姓名:王涛  李明
作者单位:重庆师范大学计算机与信息科学学院,重庆,401331;重庆师范大学计算机与信息科学学院,重庆,401331
基金项目:重庆市教育委员会教改项目;重庆市教育委员会科技项目
摘    要:【目的】针对词主题信息与词相似性信息对关键词提取的影响进行了研究,提出一种改进的TextRank关键词提取方法。【方法】首先,使用隐含狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型对文档建模计算词主题信息;其次,使用FastText生成词向量,并计算词相似性矩阵;最后,融合词主题信息与词相似性信息的综合权重来优化TextRank词汇节点的初始权重,并进行词图模型的迭代运算与关键词提取。【结果】实验表明,改进方法的提取结果优于传统方法。【结论】证明了考虑词主题信息的全局性与词相似性信息的局部性能有效提高TextRank算法提取关键词的性能。

关 键 词:词向量  TextRank  图模型  LDA

Study on an Improved Keyword Extraction Algorithm
WANG Tao,LI Ming.Study on an Improved Keyword Extraction Algorithm[J].Journal of Chongqing Normal University:Natural Science Edition,2019,36(3):94-104.
Authors:WANG Tao  LI Ming
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《重庆师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《重庆师范大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号