首页 | 官方网站   微博 | 高级检索  
     

基于Single-Pass的网络话题在线聚类方法研究
引用本文:朱恒民,朱卫未.基于Single-Pass的网络话题在线聚类方法研究[J].现代图书情报技术,2011(12):52-57.
作者姓名:朱恒民  朱卫未
作者单位:南京大学信息管理系;南京邮电大学经济与管理学院
基金项目:江苏省社会科学基金项目“网络舆论危机的生成与预警机制研究”(项目编号:10TQC009);江苏省教育厅高校哲学社会科学项目“互联网舆情演化的动态网络模型研究”(项目编号:2011SJB870006);南京邮电大学青蓝计划“网络舆情热点发现及动态预警研究”(项目编号:NY210055)的研究成果之一
摘    要:基于Single-Pass算法思想,研究网络话题的在线聚类方法,以期及时捕捉网络信息的动态变化在分析该方法聚类流程的基础上,重点研究网络动态信息流的文本特征抽取和权重计算方法,以及话题类表示和更新等关键问题,设计实验对比分析不同的标题中特征加权系数、特征权重计算和标准化方法以及话题类向量维度对话题聚类质量和时间效率的影响。

关 键 词:网络舆情  话题挖掘  在线聚类  Single-Pass

Study on Web Topic Online Clustering Approach Based on Single -Pass Algorithm
Zhu Hengmin,Zhu Weiwei.Study on Web Topic Online Clustering Approach Based on Single -Pass Algorithm[J].New Technology of Library and Information Service,2011(12):52-57.
Authors:Zhu Hengmin  Zhu Weiwei
Affiliation:1(Department of Information Management,Nanjing University,Nanjing 210093,China) 2(College of Economics & Management,Nanjing University of Posts & Telecommunications,Nanjing 210046,China)
Abstract:In order to get dynamics of Web information timely,an online Web topic clustering approach based on Single -Pass algorithm is researched.The clustering process of this approach is analyzed firstly,and the key problems including extracting and weight calculating of features as well as representation and modification of topic cluster are deliberated.Experiment is designed to compare the effects of different weight factor of features in title,weight calculating and normalizing methods of features and the vector dimension of topic cluster on cluster quality and time efficiency.
Keywords:Internet public opinion  Topic mining  Online clustering  Single - Pass
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号