首页 | 官方网站   微博 | 高级检索  
     

基于种子文档LDA话题的演化研究
引用本文:单斌,李芳.基于种子文档LDA话题的演化研究[J].现代图书情报技术,2011(Z1):104-109.
作者姓名:单斌  李芳
作者单位:上海交通大学计算机科学与工程系;
基金项目:国家自然科学基金项目“新闻话题线索与主题的探测研究”(项目编号:60873134)的研究成果之一
摘    要:提出一种基于种子文档的LDA话题演化方法。首先选取种子文档,利用种子文档指导后一时间段文档的建模,然后根据种子文档的语义分布信息对连续时间上的LDA话题进行关联,保证话题的同一性。实验结果证明,在NIPS论文语料集和全国两会新闻报道集中,该方法可以推导特定话题的演化结果,避免关联话题之间存在的演化结果。

关 键 词:LDA  话题演化  种子文档  话题模型

Topic Evolution Based on Seminal Document and Topic Model
Shan Bin Li Fang.Topic Evolution Based on Seminal Document and Topic Model[J].New Technology of Library and Information Service,2011(Z1):104-109.
Authors:Shan Bin Li Fang
Affiliation:Shan Bin Li Fang(School of Electronic Information and Electrical Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:This paper presents a new method to infer the LDA topic evolution automatically based on seminal documents.The semantic distribution of the seminal documents is used to guide the successive model and link topics between consecutive time slices.The experiments are based on NIPS dataset and Chinese newswire of NPC and CPPCC,and the results show that the method can not only get the correct evolutions in various forms,but also avoid those related topics without evolution relationship.
Keywords:LDA Topic evolution Seminal document Topic model  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号