一种融合标签语义的微博热点话题挖掘方法 |
| |
引用本文: | 周福星,陈秀真,马进,李生红. 一种融合标签语义的微博热点话题挖掘方法[J]. 计算机工程, 2019, 45(10): 283-287 |
| |
作者姓名: | 周福星 陈秀真 马进 李生红 |
| |
作者单位: | 上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240;上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240;上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240;上海交通大学网络空间安全学院,上海200240;上海市信息安全综合管理技术研究重点实验室,上海200240 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金;国家重点研发计划 |
| |
摘 要: | 由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。
|
关 键 词: | 微博文本 隐狄利克雷分布模型 标签语义 公共块 K-means聚类 |
A Microblog Hot Topic Mining Method Integrating Tag Semantics |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|