首页 | 官方网站   微博 | 高级检索  
     

面向舆情分析的短文本频繁模式聚类算法
引用本文:刘建波,杨峰.面向舆情分析的短文本频繁模式聚类算法[J].北京电子科技学院学报,2010,18(4):6-11.
作者姓名:刘建波  杨峰
作者单位:山东财政学院计算机网络中心,山东,济南,250014;山东财政学院计算机信息工程学院,山东,济南,250014
摘    要:基于短文本的舆情分析是当前信息挖掘与情感分析领域的研究重点,针对网络环境中大量的短文本信息的鲜明特点,本文突破了传统基于词的分类方法,提出一种基于后缀数组频繁模式发现的聚类算法,利用后缀数组频繁模式精确去重算法得到关键词库,结合局部性原理对位置点聚类之后作有意义字串挖掘,进而进行文本舆情分析,以便及时动态了解网络群体的情感方向以及社会舆情热点。

关 键 词:短文本  舆情分析  后缀数组  频繁模式  聚类

Short Text Frequent Pattern Clustering Algorithm for Public Opinion Analysis
LIU Jian-bo,YANG Feng.Short Text Frequent Pattern Clustering Algorithm for Public Opinion Analysis[J].Journal of Beijing Electronic Science & Technology Institute,2010,18(4):6-11.
Authors:LIU Jian-bo  YANG Feng
Affiliation:LIU Jian-bo1 YANG Feng2(1.Networkcenter,Shandong University of Finance,Jinan,250014,China,2.School of Computer &Information Engineering,China)
Abstract:The analysis of public opinion based on short text is the focus of the field of information mining and sensation analysis.Different from the traditional classification method based on words,a clustering algorithm,which based on suffix arrays is proposed.By removeing repetitive string accurately,meaningful strings are obtained after the clustering analysis of repeat string alterations in accordance with the principle of position.Public opinion toward these meaningful strings are analyzed and the dynamic emot...
Keywords:short text  public opinion analysis  suffix arrays  frequent pattern  clustering  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号