首页 | 官方网站   微博 | 高级检索  
     

基于SOM聚类的微博话题发现
引用本文:宋莉娜,冯旭鹏,刘利军,黄青松.基于SOM聚类的微博话题发现[J].计算机应用研究,2018,35(3).
作者姓名:宋莉娜  冯旭鹏  刘利军  黄青松
作者单位:昆明理工大学信息工程与自动化学院,昆明理工大学教育技术与网络中心,昆明理工大学信息工程与自动化学院,昆明理工大学信息工程与自动化学院
基金项目:国家自然科学基金资助项目(81360230,81560296).
摘    要:随着微博用户的增多,微博平台的信息更新频繁,针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。首先从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题;然后,采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能够有效的发现话题。实验表明,该算法较传统文本聚类算法的综合指标F值有明显提高。

关 键 词:话题发现  词向量模型  文本相似度  短文本  SOM聚类
收稿时间:2016/11/16 0:00:00
修稿时间:2017/1/5 0:00:00

Microblog hot-topic detection based on SOM clustering
SONG Lin,FENG Xupeng,LIU Lijun and HUANG Qingsong.Microblog hot-topic detection based on SOM clustering[J].Application Research of Computers,2018,35(3).
Authors:SONG Lin  FENG Xupeng  LIU Lijun and HUANG Qingsong
Affiliation:Faculty of Information Engineering and Automation,Kunming University of Science and Technology,,,
Abstract:
Keywords:Topics detection  Word vector model  Texts similarity  Short text  SOM clustering
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号