首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
肖宇  许炜  夏霖 《计算机科学》2012,39(2):34-37,46
意见领袖对网络舆情的产生和发展有着重要的指引作用,挖掘和识别网络社区中的意见领袖有重要的现实意义。结合聚类算法和分类算法的优势,提出一种基于话题内容分析的兴趣团体发现方法,以有效识别出兴趣团体。并通过分析用户回帖情感倾向来计算用户间链接的权重。在此基础上,提出了一种新的LeaderRank意见领袖发现算法,通过实验证明该算法能有效提高意见领袖挖掘的准确度。  相似文献   

2.
为解决异质信息网络社区发现问题,提出一种基于超图和K-means改进的算法.引入超图对异质网络进行建模,通过DeepWalk的深度随机游走产生节点序列,利用Skip-gram模型将网络节点序列映射到一个低维的向量空间,通过节点向量间距离进行聚类完成社区发现.针对传统K-means在初始聚类中心选择的敏感性问题,提出一种基于密度基尼系数的聚类中心选取方法.在两个真实数据集上进行了实验,实验结果表明,该算法不仅能够完成异质信息网络的社区划分,且社区识别精度高.  相似文献   

3.
针对投运时间不长的变压器数据中有极大部分是正常数据的情况,为了有效利用变压器历史正常数据识别变压器是否异常,本文提出了基于改进K-means聚类的变压器异常状态识别模型。针对变压器绝大部分运行数据为正常数据、正常数据逐渐按一定的趋势变化以及异常状态数据变化急剧等特点,基于历史正常数据与K-means算法建立变压器异常状态识别模型;根据对正常数据聚类的结果确定用于识别新数据的各个阈值;通过计算新数据到各聚类中心的距离并与各阈值对比确认变压器是否异常。针对传统K-means算法的缺点,对K-means算法进行基于密度与距离选择K值与初始聚类中心的改进,使K-means算法有稳定的K值与聚类中心,聚类过程更加快速、稳定、有效,从而使识别模型计算得到的阈值更可靠。实例分析表明,模型能有效对变压器的异常状态进行快速、准确的识别,为变压器状态评估提供一种新思路。  相似文献   

4.
改进的K-means 算法在网络舆情分析中的应用   总被引:1,自引:0,他引:1  
结合网络舆情分析的应用需求背景,首先介绍了文本信息的处理,然后探讨了文本聚类中的K-means算法,针对其对初始聚类中心的依赖性的特点,对算法加以改进。基于文档标题能够代表文档内容的思想,改进算法采用稀疏特征向量表示文本标题,计算标题间的稀疏相似度,确定初始聚类中心。最后实验证明改进的K-means算法提高了聚类的准确度;与基于最大最小距离原则的初始中心选择算法比较,提高了执行效率,同时保证了聚类准确度。  相似文献   

5.
为进行论坛舆情分析,提出一种基于标题聚类的舆论领袖发现算法。按时间将数据进行预处理,运用话题模型度量标题数据并依此进行标题聚类;建立同一话题下的变规模用户回复关系网络,结合情感分析和网络特性分析进行影响力排名以提取舆论领袖。该算法旨在快速发现某一网络热门事件中的舆论领袖,综合考虑了帖子的话题属性、情感倾向和网络结构关系。通过实验验证了该模型的可行性和有效性。  相似文献   

6.
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。  相似文献   

7.
优化初始聚类中心的K-means聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于[α]([α]为样本集数据点数目与聚类的簇类数目的比值),再把该集合从样本集中删除,重复以上步骤得到K(K为簇类数目)个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。  相似文献   

8.
意见领袖是网络社区中积极的信息传播者和信息引导者,对其影响力的评估是社交网络分析的一项重要内容。针对现有算法对用户动态行为分析和动态内容影响考虑欠缺而不能客观反映真实情况的问题,提出一种基于用户影响力和PageRank的意见领袖发现算法,综合考虑用户自身影响力、用户动态行为影响度和用户行为给动态内容带来的真实影响。通过从知乎网络社区收集的大规模数据实验结果表明,该算法更具合理性并能有效地提高网络社区意见领袖的识别准确度。  相似文献   

9.
本文面向网格计算、协同工作等特定P2P应用、提出了一种基于超节点的P2P混合网络模型。该模型的主要特点是采用K-means聚类算法对网络中的节点进行聚类,从而得到分组虚拟子网,由各子网内的超节点负责临近节点的加入与注销。该模型既克服P2P集中模型伸缩性不强,分散性P2P模型发送消息量大等缺点,又可以灵活地组织对等节点进行网格计算或组内协同工作等分布式应用。文章最后使用仿真实验表明K-means算法在网络节点聚类中的有效性。  相似文献   

10.
针对在社交网络中挖掘意见领袖时存在的计算复杂度高的难题,提出了一种基于K核分解的意见领袖识别算法CR.首先,基于K核分解方法获取社交网络中的意见领袖候选集,以缩小识别意见领袖的数据规模;然后,提出包括位置相似性和邻居相似性的用户相似性的概念,利用K核值、入度数、平均K核变化率和用户追随者个数计算用户相似性,并根据用户相...  相似文献   

11.
在线社交网络中的意见领袖通常是指在社交网络的信息传播中具有较大社会影响力的个体。针对当前意见领袖挖掘方法中只考虑社交网络的拓扑结构和节点的个体属性,缺乏信息传播中交互特征的问题,该文提出了基于扩展独立级联模型,并融入网络结构特征、个体属性和行为特征的意见领袖挖掘模型(extended independent cascade, EIC)。该模型以个体属性、个体在信息传播过程中的交互行为建立加权的传播网络,利用改进的CELF(cost effective lazy forward)算法,挖掘网络中影响力较大的个体。通过实验验证,在意见领袖的扩展核心率指标上,该算法优于拓扑结构类算法,且具有较好的稳定性,同时并未降低意见领袖的传播范围。  相似文献   

12.
当前的影响力分析算法大多基于网络拓扑结构或用户交互信息,然而单一方面的方法会使挖掘结果出现较大的偏差,目前缺乏全面准确的影响力挖掘方法。本文通过对传统PageRank算法进行扩展,提出一种面向新浪微博的基于用户交互度连接属性的TCRank算法;其次设计了3种微博意见领袖特征指标,并对其加权求和用于意见领袖候选集的精化操作;同时提出一种基于卷积神经网络模型的情感支持度的意见领袖抽取算法,对意见领袖候选集进行最终排名。最后,通过实验验证所提出算法的有效性。  相似文献   

13.
意见领袖挖掘是社会网络研究的重要课题,对于舆情控制、信息传播等方面具有重要意义。LeaderRank算法是一个有效的意见领袖挖掘算法。为提高LeaderRank算法的准确性和抗干扰能力,在LeaderRank算法基础上,加入用户之间的情感倾向、用户活跃程度,提出了改进的LeaderRank算法。基于SIR模型的实验验证表明,改进算法的准确性和抗干扰能力均得到了有效提升。  相似文献   

14.
传统的社区发现算法往往时间复杂度较高,K-means算法作为聚类算法且时间复杂度较低可为社区发现提供新思路,但K-means算法的原始应用场景为数值环境与社交网络不符,且自身存在初始中心节点选取敏感等原有问题,针对上述问题本文在下面三个方面进行了优化:第一,结合最短路径及共同邻居信息重新定义距离度量;第二,结合了节点的度和节点距离因素进行初始中心节点选取;第三,在K-means算法结果的基础上进行基于贪心策略以模块度为目标的层次聚类优化。通过实验表明:改进的K-means算法能够很好地应用于社区发现,得到的社区发现结果有较高质量。  相似文献   

15.
针对中文微博目前已有的意见领袖识别模型存在的不足,提出一种特定话题转播网络中的意见领袖检测方法.识别模型通过转发关系建立信息传播网络,以用户自身权威值和转发用户的支持力来评价用户的影响力.通过对微博两周以来特定话题下意见领袖的检测实验,结果表明该方法能够有效地识别特定话题下的意见领袖.  相似文献   

16.
意见领袖在不同的主题社团下对舆情的传播影响力是不同的,为了在社交网络中快速准确挖掘出意见领袖,提出一种面向主题社团的意见领袖挖掘方法。根据提出的兴趣隐含狄利克雷分布(Interest Latent Dirichlet Allocation,I-LDA)主题模型得到主题表达能力更强的主题分布,并在此基础上计算相邻用户的主题相似度。采用基于主题相似度的多标签均衡社团划分算法划分主题社团,使相似度大的用户被划分到相同的主题社团中,由此进一步提升社团划分的准确性与合理性。对于意见领袖的挖掘,提出一种快速意见领袖挖掘算法(Quickly-Ming Opinion Leader Algorithm,QMOLA),先通过结构特征筛选出主题社团中的意见领袖候选人,再结合传播特征和情感特征挖掘主题社团中的意见领袖。对比实验结果表明,QMOLA相对于传统的意见领袖挖掘方法在挖掘效率上具有明显的优势,而且挖掘出的意见领袖具有更高的覆盖率和支持率。  相似文献   

17.
Previous research suggests that online leaders play an important role in sustaining community activities. Although the research has contributed to our understanding of how leaders develop effective ways to operate a community, most only provide a snapshot view of online leadership, thus paying little attention to changes in leaders in a communal context. In this study, we adopt the theory of networked influence to investigate the dynamics of online leadership using a longitudinal analysis. Data were collected from an online community in operation for 10 years. By conducting social network analysis using qualitative methods, we identified several types of emerging and coexisting online leadership, i.e., responsive expert leader, multiboard connectors, and social bond leader. The community’s sustainability did not rely on the same leaders throughout its temporal development but rather a “relay event” involving passing on the baton among different leaders with their specific leadership styles, which had a significant positive impact on the sustainability of user participation.  相似文献   

18.
为了有效地分析意见领袖在微博在线社交网络传播中所起的作用及微博信息传播的生命周期,提出了一种OLL分级意见领袖模型。首先,爬取微博数据,并进行数据统计分析;其次,将传播力构建为转发数、活跃度与粉丝量3个因素相关的函数,并建立一种基于层次分析的权重计算方法;最后, 利用计算的传播力并结合OLL模型,对意见领袖传播作用及微博生命周期进行了实验分析。仿真结果表明:意见领袖在微博信息传播中有很强的传播效应,通过计算得出OLL模型仿真与3组真实数据的误差分别为9.6%,13.4%,4.5%,从而证明了所提OLL模型对于分析意见领袖在微博信息传播中的生命周期是合理且有效的。  相似文献   

19.
基于聚类分析的网络论坛意见领袖发现方法   总被引:1,自引:0,他引:1  
提出表示网络论坛用户的特征值向量,它由7个特征值组成。设计基于EM算法的用户聚类算法,从实际的贴子数据中提取向量数据集,并基于聚类结果筛选出最符合意见领袖群体的子类。以某论坛为例,分别运用该方法及现有典型方法提取出意见领袖并进行比较,验证本文算法的正确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号