首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
近年来,微博用户都凭借其自身在社区中的影响力来对信息传播做出贡献,尤其是活跃的大V用户能够引起信息广泛的传播。为了在微博社区中提高用户影响力衡量的准确性,提出了一种基于传统的PageRank算法和用户交互行为的用户影响力改进算法(IUIR算法),此算法通过直接质量指数和间接质量指数来构建微博用户的质量指数,再结合近期用户的活跃度来构造用户影响力评价公式。在新浪微博数据集上进行实验,并与传统的PageRank算法作比较,结果表明,该算法能够更有效地反映微博用户影响力的排名。  相似文献   

2.
在已有PageRank算法构建的微博用户影响力评估模型中,存在用户自身属性信息欠缺以及在用户不活跃期间其影响力被误判下降的问题。为此,综合考虑用户自身的属性,基于用户的活跃度、认证信息及博文质量来确定其自身的基本影响力,通过引入用户博文的传播率挖掘用户的潜在影响力,结合用户不同好友的质量,基于改进的PageRank算法构建微博用户影响力评估算法。实验结果表明,与改进BWPR算法相比,该算法准确率、召回率和F值分别提高13.5%、10.1%和12.3%,能准确、客观地反映微博用户的实际影响力,可为社交网络中的意见领袖挖掘、信息传播和舆论引导等研究提供参考。  相似文献   

3.
根据PageRank算法中一个网站的PR值由所有链向它的网站的PR值决定,提出了一种多维度的基于用户自身影响力和传播影响力的用户影响力改进算法BPPI(Based on users’Personal and Propagating Influence)。基于用户的个人信息、活跃度、关注度,以及点赞、评论、转发的互动行为,从用户本身和微博博文传播两个方面,综合计算出用户的自身影响力和传播影响力,最终得到用户影响力,改进了PageRank算法中初始PR值和传递PR值分配不合理的问题。根据最新的微博数据集上的实验结果,与同类型的算法相比,该算法更能准确、客观、全面地评估微博用户影响力。  相似文献   

4.
由于影响范围的重叠效应,单纯的影响力度量算法并不能解决微博网络中的影响力最大化问题,针对这一研究现状,提出一种用于微博网络中Top-K节点挖掘的算法GABE。通过归纳决定微博用户影响力的关键因素,提出了节点间影响率的概念,进而建立了用于用户影响力度量的WIR算法;根据得到的WIR值提出了符合微博特性的影响力传播模型,运用贪婪算法挖掘出微博网络中的Top-K节点。以爬取到的新浪微博数据进行了模拟验证,结果发现GABE在影响范围上与传统的最大化算法和影响力度量算法相比分别提高了7.7%和20%。这表明通过引入微博特性和贪婪思想,GABE较好地解决了微博网络中的影响力最大化问题。  相似文献   

5.
在舆情分析、微博营销和个性化推荐等方面,微博社区发现的研究都具有重要的应用价值。为了准确而有效地发现微博社交网络中的社区,提出一种基于信任关联度的微博社区发现算法(TRKM算法)。该算法通过微博用户的评论、转发、原创微博等属性来构造节点间信任关联度,再利用微博社区的模块度对网络社区划分效果进行评价。在新浪微博明星和普通用户数据集上进行实验,并将TRKM算法与传统K-means算法作比较。实验表明,该算法能够更有效地发现微博用户关系网络中的社区结构。  相似文献   

6.
针对微博中用户影响力分析这个问题,提出用户影响力的计算方法。该方法首先提出用户自身影响力以及用户被影响力的概念,并根据用户自身特征与用户粉丝情况得出其计算公式,从而可以综合考虑用户在微博中的所有信息,计算出用户影响力。实验结果表明,这种计算方法能比较好地反映用户在其粉丝中的影响力。  相似文献   

7.
随着Web技术的发展,微博逐渐成为当下最流行的社交平台之一。微博中用户影响力计算是相关研究中的焦点问题。通过对PageRank模型的改进,提出一种新的用户影响力挖掘算法PR4WB(PageRank for Micro Blogs),解决了传统的PageRank算法由于页面权威值的等分传递带来的潜在误差过大的问题。PR4WB算法在考虑微博中用户关系的同时,利用社会网络概念将自身的活跃度、博文质量及可信性加以关联,形成动态的评价模型。基于Twitter数据的实验表明,PR4WB算法能更加准确、客观地反映出用户的实际影响力。  相似文献   

8.
罗芳  徐阳 《计算机应用研究》2020,37(5):1354-1358,1367
以新浪微博为研究对象,提出一种适用性更广、考虑因素更全面的微博用户影响力度量算法,将用户基本属性、用户交互行为和用户博文内容三个维度因素融入传统PageRank算法中,提出了一种多维度微博用户影响力度量算法——MDIR(multi-dimension influence rank)。实验结果表明,MDIR算法相较于其他常用的五种影响力度量算法,能更加全面、真实地反映微博用户的实际影响力。  相似文献   

9.
基于HRank的微博用户影响力评价   总被引:1,自引:0,他引:1  
贾冲冲  王名扬  车鑫 《计算机应用》2015,35(4):1017-1020
针对微博社交网络平台中的用户影响力评价问题,提出了一种基于HRank的评价算法。该算法将评价科学家科研绩效影响力的判定参数H指数引入进来,构造出能反映用户影响覆盖度的粉丝H指数和用户微博受追捧程度的微博被转发H指数,以分别表征用户的静态特征和在微博平台上的动态行为特征。在此基础上,结合粉丝H指数和微博被转发H指数构建出对用户影响力进行综合评价的HRank模型。粉丝数与用户影响力的相关性不是很强,同样数据集下相对PageRank,HRank用户影响力模型与新浪用户影响力官方排名更为接近,可有效实现对微博用户影响力的客观评判。  相似文献   

10.
随着Web技术的发展,微博已经成为最受欢迎的社交平台之一了。在中国,微博用户规模已经达到了2.42亿。微博用户影响力计算对社会信息在微博里面有效传播,正确传播,健康传播有着非常重要的意义。本文以新浪微博数据为实验的对象,通过改进传统的PageRank模型,提出了的新型用户影响力排名算法---MBUI-Rank(Micro-Blog User Influence Rank)算法。在考虑传统PageRank方法的用户链接关系的同时,MBUI-Rank算法还考虑到微博用户自身行为活动,构建用户对微博的影响的动态挖掘模型。实验结果表明,MBUI-Rank算法与传统的PageRank算法相比,可以更加真实有效地反映微博用户的实际影响力。  相似文献   

11.
微博特有的移动终端轻博客发布与交互模式,使其迅速成为使用范围最大、影响力最大的社交媒体。新浪中文微博现有超过3亿用户,发展最为迅速,中文微博和其他微博相比具有独特性,一些大“V”博主的影响力堪比电台电视。通过分析微博的网络结构特征,总结出微博相对于其他传统社会载体的特性。利用PageRank算法的思想,设计了基于用户质量的User Impack Rank(UIR)排序算法。UIR算法通过用户相对微力值和用户相对链接质量对各博主的影响力进行动态的评估。在一个活跃的微博社区数据集上进行了全面的实验,实验结果显示了UIR算法能更加准确和客观地对用户的影响力进行排序,并且能有效地消除僵尸粉丝对排序的影响。  相似文献   

12.
为提高微博话题中关键人识别的准确性, 提出了一种基于个人属性特征的用户影响力分析方法——PBF方法。该方法利用信息传播特征对用户影响力进行度量, 结合个人属性特征对其进行回归分析, 找出最能反映用户影响力的属性特征, 进而利用这些特征对用户影响力进行预测。实验结果表明, PBF方法的识别效率要明显高于RNF方法, 有效提高了关键人识别的准确性。  相似文献   

13.
针对现有微博事件抽取方法由于基于事件的内容特征,而忽略事件本身的社会属性与时间特征之间的关系,进而无法识别微博热点传播过程中关键事件的问题,提出了一种融合社会影响力和时间分布的微博关键事件抽取方法。首先通过建模社会影响力来刻画微博事件的重要性,然后融合微博事件演化过程中的时间特性以捕获事件在不同时间分布下的差异,最后抽取出不同时间分布下的微博关键事件。在真实数据集上的实验结果表明,所提方法能有效抽取微博热点中的关键事件,较随机选择、词频-逆文本频率(TF-IDF)、最小权重支配集以及度与聚集系数这四种方法在事件集的完整性指标ROUGE-1上在数据集1上分别提升了21%、18%、26%以及30%,在数据集2上分别提升了14%、2%、21%以及23%,抽取效果优于传统方法。  相似文献   

14.
反语识别已成为当前研究的热点,但当前对于中文反语识别研究报道较少。针对于此,主要研究面向社交网络的中文反语识别。在借鉴外文相关工作的基础上,结合中文语言和社交网络的特性,构建了六种特征,通过信息增益对比了各种特征有效性,并检测了不同分类器在该特征体系中的稳定性。实验结果表明,本文构建的特征在识别反语的任务中有显著的效果。  相似文献   

15.
高明霞  陈福荣 《计算机应用》2016,36(8):2071-2075
针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型(LMJM)相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。  相似文献   

16.
17.
黄铃  李学明 《计算机应用》2013,33(12):3563-3566
针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法。该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器加权集合成高精度的强分类器。从实际的热门新浪微博中提取评论数据集进行实验,结果表明所选取的8个特征是有效的,该方法对于微博垃圾评论的识别拥有较高的识别率。  相似文献   

18.
在线论坛中潜在影响力主题的发现研究   总被引:1,自引:0,他引:1  
在线论坛已经成为人们获取信息、发表言论的重要场所,针对传统的在线论坛中有影响力主题计算方法的不足,通过计算词语在回帖传播链上的影响力,提出一种根据对有影响力词语聚类的方法发现在线论坛中具有潜在影响力的主题。它能够为用户和论坛管理人员及时、准确和方便地提取重要的主题信息,以便更好地对论坛进行管理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号