首页 | 官方网站   微博 | 高级检索  
     

一种融合标签语义的微博热点话题挖掘方法
引用本文:周福星,陈秀真,马进,李生红. 一种融合标签语义的微博热点话题挖掘方法[J]. 计算机工程, 2019, 45(10): 283-287
作者姓名:周福星  陈秀真  马进  李生红
作者单位:上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240;上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240;上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240;上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240
基金项目:国家自然科学基金;国家自然科学基金;国家重点研发计划
摘    要:由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。

关 键 词:微博文本  隐狄利克雷分布模型  标签语义  公共块  K-means聚类

A Microblog Hot Topic Mining Method Integrating Tag Semantics
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号