基于文本相似度的微博网络水军发现算法 |
| |
引用本文: | 杨长春,徐小松,叶施仁,周猛.基于文本相似度的微博网络水军发现算法[J].微电子学与计算机,2014(3). |
| |
作者姓名: | 杨长春 徐小松 叶施仁 周猛 |
| |
作者单位: | 常州大学信息科学与工程学院; |
| |
基金项目: | 国家自然科学基金项目(61272367);江苏省科技厅项目(BZ2010021);江苏省研究生培养创新工程项目(20120515) |
| |
摘 要: | 微博中水军发表的评论内容具有重复或者相似性,提出了基于文本相似度的微博网络水军发现算法.评论内容可以用特征码来表示.特征码再通过高效的B-Tree来索引,使整个系统具有极高的处理效率.根据水军发帖的重复性或者相似性很高的特点,通过对多个相同或相似的评论内容进行统计分析找出出现次数频繁的用户,初步定义为水军.再对这些用户的评论内容进行分析,发现他们的评论内容基本上都是具有重复性.试验表明,该方法能够准确、有效地找出水军账户.
|
关 键 词: | 特征码 索引 文本相似度 最长子序列 |
本文献已被 CNKI 等数据库收录! |
|