首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 70 毫秒
1.
根据PageRank算法中一个网站的PR值由所有链向它的网站的PR值决定,提出了一种多维度的基于用户自身影响力和传播影响力的用户影响力改进算法BPPI(Based on users’Personal and Propagating Influence)。基于用户的个人信息、活跃度、关注度,以及点赞、评论、转发的互动行为,从用户本身和微博博文传播两个方面,综合计算出用户的自身影响力和传播影响力,最终得到用户影响力,改进了PageRank算法中初始PR值和传递PR值分配不合理的问题。根据最新的微博数据集上的实验结果,与同类型的算法相比,该算法更能准确、客观、全面地评估微博用户影响力。  相似文献   

2.
近年来,微博用户都凭借其自身在社区中的影响力来对信息传播做出贡献,尤其是活跃的大V用户能够引起信息广泛的传播。为了在微博社区中提高用户影响力衡量的准确性,提出了一种基于传统的PageRank算法和用户交互行为的用户影响力改进算法(IUIR算法),此算法通过直接质量指数和间接质量指数来构建微博用户的质量指数,再结合近期用户的活跃度来构造用户影响力评价公式。在新浪微博数据集上进行实验,并与传统的PageRank算法作比较,结果表明,该算法能够更有效地反映微博用户影响力的排名。  相似文献   

3.
鉴于新浪微博现有好友推荐机制的不足,提出一种新的新浪微博好友推荐算法。研究微博社区结构和权威用户对好友推荐的影响。在同一微博社区中,通过查找权威用户,并结合用户之间的兴趣相似度和信任度进行好友推荐。推荐过程中两次计算了用户的兴趣相似度并引入用户间信任度传播模型。通过跟踪多组新浪微博目标用户,将新浪微博提供的好友推荐列表和该算法推荐的好友列表作对比,实验表明该算法具有更好的推荐效果。  相似文献   

4.
针对微博中用户影响力分析这个问题,提出用户影响力的计算方法。该方法首先提出用户自身影响力以及用户被影响力的概念,并根据用户自身特征与用户粉丝情况得出其计算公式,从而可以综合考虑用户在微博中的所有信息,计算出用户影响力。实验结果表明,这种计算方法能比较好地反映用户在其粉丝中的影响力。  相似文献   

5.
在微博热点话题的传播过程中,部分微博用户在传播网络中担当着非常重要的角色,能够促进信息更快和更广地传播.针对微博核心用户,首先提出了采用HITS算法的改进算法来识别微博热点话题传播过程中出现的关键博主;其次还构建了微博热点话题传播的关键节点网络;最后,通过实验分析验证了算法的有效性.研究结果表明:经过改进的Weibo-HITS算法可以有效地识别微博传播网络的关键节点,关键节点的合理有效布局有助于构建规模更大的传播网络.  相似文献   

6.
随着Web技术的发展,微博已经成为最受欢迎的社交平台之一了。在中国,微博用户规模已经达到了2.42亿。微博用户影响力计算对社会信息在微博里面有效传播,正确传播,健康传播有着非常重要的意义。本文以新浪微博数据为实验的对象,通过改进传统的PageRank模型,提出了的新型用户影响力排名算法---MBUI-Rank(Micro-Blog User Influence Rank)算法。在考虑传统PageRank方法的用户链接关系的同时,MBUI-Rank算法还考虑到微博用户自身行为活动,构建用户对微博的影响的动态挖掘模型。实验结果表明,MBUI-Rank算法与传统的PageRank算法相比,可以更加真实有效地反映微博用户的实际影响力。  相似文献   

7.
目前常用的网络爬虫和基于微博API抓取数据的算法很难满足舆情系统对微博数据的需求。为此,提出一种模拟浏览器登录微博抓取网页数据的算法,以方便地获取任意微博用户网页上的所有数据。通过微博用户之间的关系构建用户网络,并通过该网络发现新用户。为获取微博上有质量的数据,建立一个完整的数学模型,根据用户的发帖数、发帖频率、粉丝数、转发数、评论数等因素来计算用户影响力,以影响力为主要因子构建优先队列,使得影响力越大的用户数据采集频率越高,同时计算时间间隔以兼顾非活跃用户的数据获取。实验结果表明,该算法具有通用性强、完全无需人工干预、获取信息的质量高、速度快等优点。  相似文献   

8.
在舆情分析、微博营销和个性化推荐等方面,微博社区发现的研究都具有重要的应用价值。为了准确而有效地发现微博社交网络中的社区,提出一种基于信任关联度的微博社区发现算法(TRKM算法)。该算法通过微博用户的评论、转发、原创微博等属性来构造节点间信任关联度,再利用微博社区的模块度对网络社区划分效果进行评价。在新浪微博明星和普通用户数据集上进行实验,并将TRKM算法与传统K-means算法作比较。实验表明,该算法能够更有效地发现微博用户关系网络中的社区结构。  相似文献   

9.
微博作为一种新型的社会媒体,以其信息的高实时性、话题动态关注、传播速度快的特点,逐渐被人们所接受和使用。筛选出相关话题的微博信息,帮助用户关注话题的动态发展,成为迫切需要解决的问题。由于微博信息篇幅极短、包含的信息和特征少等特点,为相关话题微博信息的筛选带来了新的挑战,而传统的文本分类技术已不再适用。该文提出了基于信息熵的筛选规则学习算法,利用学习得到的规则对微博信息进行有效的筛选。算法利用信息熵来评价规则的好坏,同时基于模拟退火的随机策略使算法中的规则选择避免了过于贪心。分别通过来自新浪微博的约九万条标注数据和TREC2011中约三千条特定话题的标注数据进行实验,该文算法相比于CPAR和SVM算法,学习得到的规则在筛选时取得了较高的F值。  相似文献   

10.
为了解决推荐算法中用户标签稀疏、推荐准确度不高的问题,提出了一种基于用户标签的微博推荐算法。利用TextRank排序方法提取用户发布微博中的关键词,并对该关键词进行扩展,将其作为表示用户兴趣的标签;再根据微博的效应函数和生命周期形成待推荐的微博列表,计算用户标签及其同义词在待推荐微博列表 中出现的次数,将出现次数较多的TOP-k条微博推荐给用户。通过实验验证,该算法能够有效地解决用户标签的稀疏性问题,并能提高推荐算法的准确性。  相似文献   

11.
首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。  相似文献   

12.
首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。  相似文献   

13.
崔为娜 《计算机科学》2016,43(Z11):469-471
微博作为社交媒体的后起之秀,已经得到快速的发展。微博快速的发展在带给人们便利的同时,也使人们置身于信息的海洋。针对微博中日益呈现出的信息过载问题,微博分类已经成为一个重要的研究课题。针对微博分类,提出一种基于特征加权语言模型的微博分类新方法。 在新浪微博上抽取的真实标注数据集上进行的对比实验结果表明,所提方法是一个有效的微博分类方法。  相似文献   

14.
黄庆宇  卢珞先 《计算机科学》2015,42(10):198-201
在微博平台中用户的消息以流的形式按照时间顺序到达系统,对微博数据流的有效管理可以及时地响应用户的查询操作。基于数据库的数据世系思想,提出了一种基于数据世系的微博信息管理方法。首先,根据事件的产生、发展以及变化,将同一社会事件包含的消息定义为数据世系;其次,将微博消息流划分为不同的数据世系,并根据新消息动态地维护数据世系集合;最后,应用数据世系中的文本消息响应用户的查询。实验表明,基于数据世系的微博信息管理方法使用的内存少,运行效率高,可用于微博消息流的实时处理及查询响应工作。  相似文献   

15.
当前,由于全民自媒体兴起而引发了巨大的舆情危机,如何高效快速地从海量的碎片化信息中发现热点并抽取实用信息成为一项重大的挑战。在此背景下,提出一种基于Lex-PageRank的微博摘要优化方法,在该方案中,以聚类结果作为实验数据,从微博影响力周期的时间特性和权重属性考虑,提出改进的Lex-PageRank算法,从聚类结果中抽取若干文本组织生成摘要。在新浪微博数据基础上进行的对比实验表明,本方案可以有效地从大量文本中提取出关键信息。  相似文献   

16.
孙嘉  陈智勇 《计算机仿真》2020,37(1):179-182,316
校园微博作为影响学生学习与生活的平台,其中的负信息数量逐渐增多。针对当前校园微博负信息分类方法中存在的分类准确性差、耗时长的问题,提出基于贝叶斯的校园中微博演化网络动画负信息分类方法。依据完全性和可区分性对微博演化网络动画负信息特征集合进行构造,设定判定阈值,去除各篇信息文档中频次比设定阈值低的信息特征项,获取每篇微博信息文档特征项集合。根据特征项集合的构建,给出专指度定义,针对专指度比较高的信息特征项,对其频次进行适当增加。针对专指度比较低的信息特征项,对其频次进行适当减少,完成微博演化网络动画信息文档特征向量的构建,并对特征向量进行归一化。利用点互信息对校园中微博演化网络动画负信息进行初分类,通过贝叶斯分类器对初次分类后未被分类的微博负信息进行二次分类。实验结果表明,上述方法负信息分类准确率高,耗时短,具有可行性。  相似文献   

17.
微博热点话题发现是目前的研究热点。针对传统热词抽取方法难以适用于微博数据的问题,提出一种基于老化理论的词生命值计算模型用于热词抽取,并基于热词间的相关性构建词共现网络;针对传统的词聚类算法不能较好地解决话题间存在重叠热词以及时间效率不佳的问题,引入多标签传播思想,设计一种接近线性时间复杂度的多标签传播聚类算法( TCMLPA)用于词共现网络的热词聚类,获得热点话题集。实验结果表明,词生命值计算模型能够有效过滤噪声并提取热词,TCMLPA算法则能够在保证聚类结果稳定性的情况下,有效提高热点话题发现的精度和效率。  相似文献   

18.
郑影  李大辉 《计算机科学》2014,41(2):270-275
社会媒体是人们用来分享意见、见解、观念和经验的平台或工具,目前已经发展成具有重大影响力的新媒体。而微博作为社会媒体的一个重要部分,对信息的传播起到了很大的作用。面向微博内容的信息抽取就是要从充满噪音的、零碎的、非结构化的微博内容的自由文本中提取有价值的结构化的信息,以利于从微博内容中有效地获取信息。提出了一种基于因子图的微博事件抽取方法来准确地抽取微博中所反映的事件。最后通过实验验证了该方法在性能和准确性上都比其他的方法要高。  相似文献   

19.
基于关系图特征的微博水军发现方法   总被引:1,自引:0,他引:1  
随着网络水军策略的不断演变,传统的基于用户内容和用户行为的发现方法 对新型社交网络水军的识别效果不断下降.水军用户可以变更自身的博文内容与转发行为, 但无法改变与网络中正常用户的连结关系,形成的结构图具有一定的稳定性, 因此,相对于用户的内容特征与行为特征,用户关系特征在水军识别中具有更强的鲁棒性与准确度. 由此,本文提出一种基于用户关系图特征的微博水军账号识别方法. 实验中通过爬虫程序抓取新浪微博网络数据; 然后,提取用户的属性特征、时间特征、关系图特征;最后,利用三种机器学习算法对用户进行分类预测. 仿真结果表明,添加新特征后对水军账号的识别准确率、召回率提高5%以上, 从而验证了关系图特征在水军识别中的有效性.  相似文献   

20.
一种中文微博新闻话题检测的方法   总被引:3,自引:3,他引:3  
微博的迅猛发展带来了另一种社会化的新闻媒体形式。提出一种从微博中挖掘新闻话题的方法,即在线检测微博消息中大量突现的关键字,并将它们进行聚类,从而找到新闻话题。为了提取出新闻主题词,综合考虑短文本中的词频和增长速度而构造复合权值,用以量化词语是新闻词汇的程度;在话题构造中使用了上下文的相关度模型来支撑增量式聚类算法,相比于语义相似度模型,其更能适应该问题的特点。在真实的微博数据上运行的实验表明,本方法可以有效地从大量消息中检测出新闻话题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号